Federe Öğrenme Nedir? Yapay Zekada Yeni Dönem
Teknolojinin gelişmesiyle yapay zeka gün geçtikçe hayatımızın her alanında yerini almaya devam ediyor. Milyonlarca farklı parçadan oluşan verileri kullanan makine öğrenmesi algoritmaları verilerin korunması konusunda pek çok kanun tarafından belirli sınırlar içerisinde tutuluyor. Verilerin anonimleştirilmeden güvende tutulması ve farklı kullanıcılarla paylaşılmamasının verilerin korunması adına çok önemli olduğu bu koşullar altında federe öğrenme geliştiriciler için büyük bir güvence ve kolaylık sağlayacak gibi gözüküyor. Federe öğrenme ile ilgili detayları yazımızda inceleyeceğiz.
12.07.2020 tarihli yazı 15167 kez okunmuştur.
Çoğu zaman makine öğrenmesi modelleri bulut tabanlı bir platform kullanılarak veriler üzerinde eğitilir. Son yıllarda federe öğrenme adı verilen yeni ve alternatif bir yaklaşım ortaya çıktı. Federe öğrenme, verileri modele getirmek yerine makine öğrenmesi modellerini veri kaynağına getirir. Federe öğrenme, birden fazla hesaplama cihazını, veri toplamak için kullanılan sistemlerle birlikte kullanılacak şekilde merkezi olmayan bir sisteme bağlar.
Federe Öğrenme Nedir?
Federe öğrenmede öğrenme ağının bir parçası olan çeşitli aygıtların her birinde makine öğrenmesi modelinin bir kopyası bulunur. Farklı cihazlar, cihazın yerel verilerini kullanarak makine öğrenmesi modelinin kopyasını eğitir ve daha sonra farklı makine öğrenmesi modellerindeki parametreler, parametreleri toplayarak bu doğrultuda genel makine öğrenmesi modelini güncelleyen bir ana cihaza veya sunucuya gönderir. Bu eğitim süreci istenen doğruluk seviyesine ulaşılana kadar tekrarlanabilir. Kısacası federe öğrenmenin arkasındaki ana fikir, eğitim verilerinin hiçbirinin cihazlar ve ya taraflar arasında iletilmemesidir, sadece modelle ilgili güncellemeler paylaşılır.Federe öğrenme üç farklı aşamaya ayrılabilir. Bu aşamalar genellikle merkezi bir sunucuda eğitilen temel bir modelle başlar. İlk adımda, bu genel model uygulamanın istemci cihazlarına gönderilir. Bu yerel kopyalar daha sonra istemci sistemler tarafından oluşturulan yerel veriler üzerinde eğitilir ve makine öğrenmesi modelinin performansı istenilen doğrultuda geliştirilir. İkinci adımda, makine öğrenmesi modelleri tarafından öğrenilen parametreler genel bir sunucuya gönderilir. Bu işlemler belirli bir programda periyodik olarak gerçekleşir. Üçüncü adımda, merkezi sunucu bu parametreleri toplar, parametreler toplandıktan sonra merkezi model güncellenir ve istemcilerle tekrar paylaşılır.
Federe öğrenmede makine öğrenmesi modelinin bir kopyasının olmasının avantajı, çeşitli cihazlar üzerinde çalışılırken ağ gecikmelerinin azaltılmış veya elimine edilmiş olmasıdır. Bunların yanı sıra verilerin sunucu ile paylaşılmasının doğuracağı maliyetler de ortadan kalkar. Federe öğrenme yöntemlerinin diğer faydaları arasında, federe öğrenme modellerinin gizliliğin korunması ve makine öğrenmesi modelinin çıktılarının her bir cihazın kullanıcısı için kişiselleştirilebilmesi yer alır.
Federe öğrenme şemaları çoğunlukla çok taraflı sistemler ve tek taraflı sistemler olmak üzere ikiye ayrılır. Tek taraflı federe öğrenme sistemlerinde öğrenme ağındaki tüm istemci cihazlarda veri yakalama ve veri akışını denetlemekten yalnızca tek bir merkez sorumludur. İstemci cihazlarda bulunan federe öğrenme modelleri, aynı yapıya sahip veriler üzerinde eğitilir, ancak veri noktaları genellikle çeşitli kullanıcılara ve cihazlara özgüdür. Tek partili sistemlerin aksine, çok partili sistemler iki veya daha fazla merkez tarafından yönetilir. Bu merkezler, erişime sahip oldukları çeşitli aygıtları ve veri kümelerini kullanarak paylaşılan bir modeli eğitmek için işbirliği yapar.
Federe öğrenme için kullanılan popüler kütüphaneler arasında Tensorflow Federated, Federated AI Technology Enabler (FATE) ve PySyft bulunmaktadır. PySyft, derin öğrenmede sıklıkla kullanılan PyTorch kütüphanesini temel alan açık kaynaklı bir federe öğrenme kütüphanesidir. PySyft, şifrelenmiş işlemler yaparak sunucular ve aracılar arasında özel ve güvenli derin öğrenme algoritmaları geliştirmenizi sağlar.
Tensorflow Federated, Google'ın Tensorflow platformunda oluşturmuş olduğu başka bir açık kaynaklı kütüphanedir. Tensorflow Federated kullanıcıların kendi algoritmalarını oluşturmalarını sağlamanın yanı sıra kullanıcıların kendi modelleri ve verileri üzerinde pek çok Federe öğrenme algoritması simüle etmesine olanak tanır. Son olarak, FATE ise Webank AI tarafından tasarlanan açık kaynaklı bir kütüphanedir ve Federated AI ekosistemine güvenli bir federe öğrenme kütüphanesi sağlamayı amaçlamaktadır.
Federe öğrenme modellerine örnek olarak öneri motorları, sahtekarlık tespit modelleri ve tıbbi modeller gösterilebilir. Netflix veya Amazon tarafından kullanılan türde medya öneri motorları binlerce kullanıcıdan toplanan veriler kullanılarak eğitilir. Pek çok farklı cihazın kendi ayrı makine öğrenmesi modellerini eğitip kendi yerel verilerini kullanması bu cihazlara özgülük sağlasa da, bu çıktılar doğrultusunda güncellenen merkezi model daha iyi tahminlerde bulunabilir.
Benzer şekilde, bankalar tarafından sahtekarlık tespiti için kullanılan makine öğrenmesi modelleri, birçok farklı cihaz üzerinde elde edilen veriler doğrultusunda eğitilebilir ve pek çok farklı banka ortak bir model eğitmek için işbirliği yapabilir. Sağlık hizmetleri için geliştirilecek bir federe öğrenme modeliyle ise birden fazla hastane, tıbbi taramalar yoluyla potansiyel tümörleri tanıyabilen ortak bir model eğitmek için birlikte çalışabilir.
Benzer şekilde, bankalar tarafından sahtekarlık tespiti için kullanılan makine öğrenmesi modelleri, birçok farklı cihaz üzerinde elde edilen veriler doğrultusunda eğitilebilir ve pek çok farklı banka ortak bir model eğitmek için işbirliği yapabilir. Sağlık hizmetleri için geliştirilecek bir federe öğrenme modeliyle ise birden fazla hastane, tıbbi taramalar yoluyla potansiyel tümörleri tanıyabilen ortak bir model eğitmek için birlikte çalışabilir.
Federe Öğrenme Türleri
Federe öğrenme şemaları çoğunlukla çok taraflı sistemler ve tek taraflı sistemler olmak üzere ikiye ayrılır. Tek taraflı federe öğrenme sistemlerinde öğrenme ağındaki tüm istemci cihazlarda veri yakalama ve veri akışını denetlemekten yalnızca tek bir merkez sorumludur. İstemci cihazlarda bulunan federe öğrenme modelleri, aynı yapıya sahip veriler üzerinde eğitilir, ancak veri noktaları genellikle çeşitli kullanıcılara ve cihazlara özgüdür. Tek partili sistemlerin aksine, çok partili sistemler iki veya daha fazla merkez tarafından yönetilir. Bu merkezler, erişime sahip oldukları çeşitli aygıtları ve veri kümelerini kullanarak paylaşılan bir modeli eğitmek için işbirliği yapar.
Federe Öğrenme için Geliştirilen Teknolojiler ve Kütüphaneler
Federe öğrenme için kullanılan popüler kütüphaneler arasında Tensorflow Federated, Federated AI Technology Enabler (FATE) ve PySyft bulunmaktadır. PySyft, derin öğrenmede sıklıkla kullanılan PyTorch kütüphanesini temel alan açık kaynaklı bir federe öğrenme kütüphanesidir. PySyft, şifrelenmiş işlemler yaparak sunucular ve aracılar arasında özel ve güvenli derin öğrenme algoritmaları geliştirmenizi sağlar.
► İlginizi Çekebilir: Tensorflow ile Yapay Sinir Ağları
Tensorflow Federated, Google'ın Tensorflow platformunda oluşturmuş olduğu başka bir açık kaynaklı kütüphanedir. Tensorflow Federated kullanıcıların kendi algoritmalarını oluşturmalarını sağlamanın yanı sıra kullanıcıların kendi modelleri ve verileri üzerinde pek çok Federe öğrenme algoritması simüle etmesine olanak tanır. Son olarak, FATE ise Webank AI tarafından tasarlanan açık kaynaklı bir kütüphanedir ve Federated AI ekosistemine güvenli bir federe öğrenme kütüphanesi sağlamayı amaçlamaktadır.
Federe Öğrenmede Karşılaşılabilecek Zorluklar
Federe öğrenmenin hala oldukça yeni bir teknik olması tam potansiyeline ulaşabilmesi için bir takım zorlukların üstesinden gelinmesini gerektiriyor. Uç cihazların eğitim yetenekleri, veri etiketleme ve standardizasyon federe öğrenme yaklaşımında karşılaşılabilecek en temel engellerdendir. Farklı cihazlarda makine öğrenmesi modeli eğitilmesi söz konusu olduğunda cihazların teknik özellikleri dikkate alınmalıdır. Denetimli öğrenme modelleri, açık ve tutarlı bir şekilde etiketlenmiş eğitim verilerine ihtiyaç duyar. Bu nedenle, işlemlere ve kullanıcılara göre verileri otomatik olarak standartlaştırılmış bir şekilde etiketleyen modeller geliştirmek oldukça önemlidir.
Model yakınsama süresi, federe öğrenmede karşılaşılabilecek bir başka zorluktur çünkü federe öğrenme modellerinin yakınsaması yerel olarak eğitilen modellerden daha uzun sürer. Bağlantı sorunları, düzensiz güncellemeler ve hatta farklı uygulama kullanım süreleri yakınsama süresinin artmasına ve güvenilirliğin azalmasına sebep olabileceğinden eğitimde yer alan cihazların sayısı federe öğrenme modelinin eğitilmesine öngörülemeyen bir unsur ekler. Bu nedenle, federe öğrenme uygulamaları veri kümelerinin aşırı derecede büyük ve dağıtık olduğu durumlarda bir modelin merkezi olarak eğitilmesine kıyasla daha çok avantaj sağlar.
Bu yaklaşım çeşitli tıbbi kuruluşların, hassas klinik verileri birbirleriyle doğrudan paylaşmaya gerek kalmadan, makine öğrenmesi modelleri geliştirmelerine ve üzerinde işbirliği yapmalarına imkan sağlar. Modelin eğitilmesi süresince geliştirilen taslaklar, herhangi bir tıbbi kuruluşun şirket içinde sahip olduklarından çok daha geniş bir veri yelpazesini tecrübe etmesini sağlar. Tıbbi senaryolarda kullanılan makine öğrenmesi algoritmalarının geliştirme aşamalarının sonunda klinik düzeyde doğruluğa ulaşması gerekir. Bu, geliştirildikleri amaç doğrultusunda gerekli standardı karşıladıkları anlamına gelir.
Model yakınsama süresi, federe öğrenmede karşılaşılabilecek bir başka zorluktur çünkü federe öğrenme modellerinin yakınsaması yerel olarak eğitilen modellerden daha uzun sürer. Bağlantı sorunları, düzensiz güncellemeler ve hatta farklı uygulama kullanım süreleri yakınsama süresinin artmasına ve güvenilirliğin azalmasına sebep olabileceğinden eğitimde yer alan cihazların sayısı federe öğrenme modelinin eğitilmesine öngörülemeyen bir unsur ekler. Bu nedenle, federe öğrenme uygulamaları veri kümelerinin aşırı derecede büyük ve dağıtık olduğu durumlarda bir modelin merkezi olarak eğitilmesine kıyasla daha çok avantaj sağlar.
Sağlık Hizmetlerinde Federe Öğrenmenin Kullanımı
Semptomların nasıl yorumlanacağını, hangi kritik durumlarda bir sonraki adıma geçileceğini ve hangi tedavinin uygulanacağını bilmek doktorlar için uzun yıllar süren eğitim ve tecrübe demektir. Yapay zeka algoritmaları için deneyim ise büyük, çeşitli ve yüksek kaliteli veri kümelerinin eğitilmesi anlamına gelir. Federe öğrenme, makine öğrenmesi algoritmalarının farklı kaynaklarda bulunan çok çeşitli verileri kullanarak eğitilmesini mümkün kılar.Bu yaklaşım çeşitli tıbbi kuruluşların, hassas klinik verileri birbirleriyle doğrudan paylaşmaya gerek kalmadan, makine öğrenmesi modelleri geliştirmelerine ve üzerinde işbirliği yapmalarına imkan sağlar. Modelin eğitilmesi süresince geliştirilen taslaklar, herhangi bir tıbbi kuruluşun şirket içinde sahip olduklarından çok daha geniş bir veri yelpazesini tecrübe etmesini sağlar. Tıbbi senaryolarda kullanılan makine öğrenmesi algoritmalarının geliştirme aşamalarının sonunda klinik düzeyde doğruluğa ulaşması gerekir. Bu, geliştirildikleri amaç doğrultusunda gerekli standardı karşıladıkları anlamına gelir.
Belirli bir alanda uzman olmak için ortalama 15 yıllık bir iş tecrübesi kabul edilebilir. Bu durumda bir yılda ortalama 10000 vaka ile karşılaşan bir doktor kariyeri boyunca yaklaşık 150000 vakanın tedavisinde görev alır. Yaklaşık 2000 kişiden birinde görülen nadir bir göz hastalığını ele aldığımızda otuz yıllık deneyime sahip bir doktor bile sadece bu belirli durumla ilgili yaklaşık 150 vaka ile karşılaşacaktır.
Sağlık personellerinin tanı koymasını ve tedavi sürecini kolaylaştırmayı hedefleyen makine öğrenmesi algoritmaları eğitmek için oldukça çok sayıda vakaya ihtiyaç vardır ve bu örneklerin hepsinin kullanılacakları klinik ortamı ve şartları yeterince temsil etmeleri gerekmektedir. Bunların yanı sıra çok sayıda veriye sahip olmak bile tıp alanında başarılı makine öğrenmesi algoritmaları geliştirmek için yeterli gelmemektedir.
Verilerin aynı zamanda çok çeşitli olması, farklı cinsiyet, yaş, demografik özellikler ve çevresel koşullardan bir araya gelen hastaların örneklerini içermesi gerekir. Sağlık kurumlarının yüz binlerce kayıt ve doküman içeren arşivleri olabilir, ancak bu veri kaynakları genellikle kullanılamaz. Bu verilerin kullanılmamasının en büyük sebebi kişisel verilerin özel olması ve gerekli hasta onayı ve etik onay olmadan kullanılamamasıdır. Federe öğrenme sayesinde hasta verilerinin paylaşılması gerekmediğinden klinikler verileri kendi sistemlerinde güvende tutabilir ve hastalardan ek bir onay alınmasına gerek kalmaz.
Federe öğrenme, verileri tek bir merkezde birleştirme gereksinimini ortadan kaldırarak derin öğrenmeyi merkeziyetten uzaklaştırır. Bunun yerine, model farklı kaynaklarda birden fazla yineleme ile eğitilir. Örneğin, üç hastanenin beyin tümörü görüntülerini otomatik olarak analiz etmeyi kolaylaştırmak için bir ekip oluşturmayı ve bir model geliştirmeyi kararlaştırdığını varsayalım. Eğer bir istemci cihaz-sunucu bütünleşik yaklaşımıyla çalışmayı seçerlerse, merkezi bir sunucu küresel derin sinir ağını koruyacak ve her katılımcı hastaneye kendi veri setlerini eğitmek için bir kopya verilecektir.
Model birkaç tekrar için yerel olarak istemci cihazlarda eğitildikten sonra, katılımcılar modelin güncellenmiş versiyonlarını merkezi sunucuya geri gönderecek ve veri setlerini kendi güvenli altyapıları içinde tutacaktır. Merkezi sunucu daha sonra tüm katılımcıların gönderdiği güncellenmiş versiyonları toplayarak güncellenen parametrelerle daha sonra yerel eğitimlere devam edebilmeleri için katılımcı hastanelerle paylaşacaktır. Hastanelerden biri bu ekipten ayrılmaya karar verirse, belirli verilere bağlı olmadıkları için modelin eğitimini durdurmaz. Benzer şekilde, yeni bir hastane girişime istediği zaman katılmayı seçebilir.
► towardsdatascience.com
► nvidia.com
► unite.ai
Sağlık personellerinin tanı koymasını ve tedavi sürecini kolaylaştırmayı hedefleyen makine öğrenmesi algoritmaları eğitmek için oldukça çok sayıda vakaya ihtiyaç vardır ve bu örneklerin hepsinin kullanılacakları klinik ortamı ve şartları yeterince temsil etmeleri gerekmektedir. Bunların yanı sıra çok sayıda veriye sahip olmak bile tıp alanında başarılı makine öğrenmesi algoritmaları geliştirmek için yeterli gelmemektedir.
Verilerin aynı zamanda çok çeşitli olması, farklı cinsiyet, yaş, demografik özellikler ve çevresel koşullardan bir araya gelen hastaların örneklerini içermesi gerekir. Sağlık kurumlarının yüz binlerce kayıt ve doküman içeren arşivleri olabilir, ancak bu veri kaynakları genellikle kullanılamaz. Bu verilerin kullanılmamasının en büyük sebebi kişisel verilerin özel olması ve gerekli hasta onayı ve etik onay olmadan kullanılamamasıdır. Federe öğrenme sayesinde hasta verilerinin paylaşılması gerekmediğinden klinikler verileri kendi sistemlerinde güvende tutabilir ve hastalardan ek bir onay alınmasına gerek kalmaz.
Federe öğrenme, verileri tek bir merkezde birleştirme gereksinimini ortadan kaldırarak derin öğrenmeyi merkeziyetten uzaklaştırır. Bunun yerine, model farklı kaynaklarda birden fazla yineleme ile eğitilir. Örneğin, üç hastanenin beyin tümörü görüntülerini otomatik olarak analiz etmeyi kolaylaştırmak için bir ekip oluşturmayı ve bir model geliştirmeyi kararlaştırdığını varsayalım. Eğer bir istemci cihaz-sunucu bütünleşik yaklaşımıyla çalışmayı seçerlerse, merkezi bir sunucu küresel derin sinir ağını koruyacak ve her katılımcı hastaneye kendi veri setlerini eğitmek için bir kopya verilecektir.
Model birkaç tekrar için yerel olarak istemci cihazlarda eğitildikten sonra, katılımcılar modelin güncellenmiş versiyonlarını merkezi sunucuya geri gönderecek ve veri setlerini kendi güvenli altyapıları içinde tutacaktır. Merkezi sunucu daha sonra tüm katılımcıların gönderdiği güncellenmiş versiyonları toplayarak güncellenen parametrelerle daha sonra yerel eğitimlere devam edebilmeleri için katılımcı hastanelerle paylaşacaktır. Hastanelerden biri bu ekipten ayrılmaya karar verirse, belirli verilere bağlı olmadıkları için modelin eğitimini durdurmaz. Benzer şekilde, yeni bir hastane girişime istediği zaman katılmayı seçebilir.
Federe öğrenme, yapay zeka modellerinin eğitilmesi konusunda bir devrim yaratarak beraberinde getirdiği kolaylıkları sağlık ekosistemine uygulayabilir. Daha büyük hastaneler birlikte daha başarılı bir şekilde çalışırken daha küçük klinikler ise teşhis koyma ve tedaviyi takip etme süreçlerinin dijital olarak desteklenmesinden faydalanabilir. Tüm bunların yanı sıra sağlık merkezleri, çeşitli algoritmalar kullanılarak eğitilen bu güvenli yaklaşımlar sayesinde tıp alanındaki en son yenilikleri daha hızlı bir şekilde uygulamaya koyabilir.
Araştırma kurumları çalışmalarını sınırlı sayıda veri içeren açık veri setleri ile sürdürmek yerine çeşitli ve gerçek hasta verilerine dayanarak klinik ihtiyaçlara yönlendirebilir. Federe öğrenmenin sağlık alanında kullanılmaya başlamasının ilk örneklerinden biri olan King's College London, Değerli Sağlık Hizmetleri projesi için Londra Tıbbi Görüntüleme ve Yapay Zeka Merkezi ortaklığıyla federe öğrenme ile inme ve nörolojik bozuklukların sınıflandırılmasında, kanserlerin altında yatan nedenleri belirleme ve hasta için en iyi tedavinin önerilmesi üzerine çalışıyor.
Kaynak:Araştırma kurumları çalışmalarını sınırlı sayıda veri içeren açık veri setleri ile sürdürmek yerine çeşitli ve gerçek hasta verilerine dayanarak klinik ihtiyaçlara yönlendirebilir. Federe öğrenmenin sağlık alanında kullanılmaya başlamasının ilk örneklerinden biri olan King's College London, Değerli Sağlık Hizmetleri projesi için Londra Tıbbi Görüntüleme ve Yapay Zeka Merkezi ortaklığıyla federe öğrenme ile inme ve nörolojik bozuklukların sınıflandırılmasında, kanserlerin altında yatan nedenleri belirleme ve hasta için en iyi tedavinin önerilmesi üzerine çalışıyor.
► nvidia.com
► unite.ai
YORUMLAR
Aktif etkinlik bulunmamaktadır.
- Dünyanın En Görkemli 10 Güneş Tarlası
- Dünyanın En Büyük 10 Makinesi
- 2020’nin En İyi 10 Kişisel Robotu
- Programlamaya Erken Yaşta Başlayan 7 Ünlü Bilgisayar Programcısı
- Üretimin Geleceğinde Etkili Olacak 10 Beceri
- Olağan Üstü Tasarıma Sahip 5 Köprü
- Dünyanın En İyi Bilim ve Teknoloji Müzeleri
- En İyi 5 Tıbbi Robot
- Dünyanın En Zengin 10 Mühendisi
- Üretim için 6 Fabrikasyon İşlemi
- DrivePro Yaşam Döngüsü Hizmetleri
- Batarya Testinin Temelleri
- Enerji Yönetiminde Ölçümün Rolü: Verimliliğe Giden Yol
- HVAC Sistemlerinde Kullanılan EC Fan, Sürücü ve EC+ Fan Teknolojisi
- Su İşleme, Dağıtım ve Atık Su Yönetim Tesislerinde Sürücü Kullanımı
- Röle ve Trafo Merkezi Testlerinin Temelleri | Webinar
- Chint Elektrik Temel DIN Ray Ürünleri Tanıtımı
- Sigma Termik Manyetik Şalterler ile Elektrik Devrelerinde Koruma
- Elektrik Panoları ve Üretim Teknikleri
- Teknik Servis | Megger Türkiye
ANKET