Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak
AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketen, teknik engeli en yüksek olan aşamadır ve doğrudan modelin yetenek sınırını ve pratik uygulama etkisini belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir; bu, AI sistemlerinin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigmalara göre, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, yerel yüksek performanslı kümeler içinde tek bir kuruluş tarafından tüm eğitim sürecinin tamamlandığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme zamanlama sisteminden eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır; bu nedenle GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur. Yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlar sunarken, aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da barındırmaktadır.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir; bunun temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve işbirliği içinde gerçekleştirilmesi yatmaktadır. Bu, tek bir makinenin hesaplama ve depolama darboğazını aşmak için gereklidir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen, yönlendirilen ve senkronize edilen bir yapıdır. Genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır ve NVLink yüksek hızlı bağlantı hattı teknolojisi ile ana düğüm, alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunları içermektedir:
Veri paralelliği: Her düğüm farklı veri parametreleri eğitiyor ve model ağırlıkları eşleşmelidir.
Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırma
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölerek paralel işleme granüllerini artırır.
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birçok "ofis" çalışanını iş birliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim almaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dirençli bir gelecek yolu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, merkezi bir koordinatör olmaksızın, ev bilgisayarları, bulut GPU'ları veya kenar cihazları ), genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği gerçekleştirerek eğitim görevlerini tamamlar ve şifreleme teşvik mekanizmalarından yararlanarak katkıların dürüstlüğünü güvence altına alır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordinasyonu zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin
Birlikte koordinasyon eksikliği: Merkezî bir dağıtımcı yok, görev dağıtımı ve hata geri alma mekanizması karmaşık
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, kendi hesaplama güçlerini model eğitimi için birleştirmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hala sistematik bir mühendislik zorluğudur ve sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizma, model doğrulaması gibi birçok yönü içermektedir, ancak "iş birliği etkin + dürüstlük teşvikleri + doğru sonuçlar" sağlanabilir mi hala erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtık ve merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını, model parametrelerinin merkezi olarak bir araya getirilmesini vurgular ve gizlilik uyumuna önem veren senaryolar için uygundur, örneğin sağlık, finans. Federated öğrenme, dağıtık eğitim mühendislik yapısını ve yerel iş birliği yeteneğini barındırırken, aynı zamanda merkeziyetsiz eğitimin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre ihtiyaç duyar ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından daha ılımlıdır ve endüstride geçiş aşaması dağıtım yapısı olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi her görev türü için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin çok yüksek olması veya işbirliği zorluğunun büyük olması nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması uygun değildir. Örneğin, büyük model eğitimleri genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu da açık ağda etkili bir şekilde bölmek ve senkronize etmekte zorluk çıkarır; veri gizliliği ve egemenlik sınırlamaları olan görevler (, tıbbi, finansal, gizli veri ) gibi, yasal uyum ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; ve işbirliği teşvik temeli eksik olan görevler (, şirketin kapalı kaynaklı model veya dahili prototip eğitimi ), dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimdeki gerçek kısıtlamaları oluşturur.
Ancak bu, merkeziyetsizlik eğitimlerinin bir safsata olduğu anlamına gelmez. Aslında, yapısal olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri (, RLHF, DPO ), veri kalabalığı eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gösterme özelliklerine sahiptir ve P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenim öncülüğünde, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermektedir, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise görece net olup, başlangıç mühendislik ilerlemelerini görebiliyoruz. Bu makalede, bu beş projenin ardındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve Merkeziyetsizlik AI eğitim sistemi içindeki farklılıkları ve tamamlayıcı ilişkilerini daha fazla tartışacağız.
( Prime Intellect: Eğitim yolları doğrulanabilir pekiştirmeli öğrenme işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; böylece herkes eğitime katılabilir ve hesaplama katkılarından güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizması tam olan bir AI merkeziyetsiz eğitim sistemi oluşturmayı hedeflemektedir.
)# Temel Teknoloji Mekanizmalarının Detaylı Açıklaması
PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect'in Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile iş birliği yapabilir. Geleneksel denetimli öğrenim süreçlerine kıyasla, PRIME-RL, merkezi bir zamanlamanın olmadığı ortamlarda esnek eğitimi gerçekleştirmek için daha uygundur, bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gözlem verilerine dayalı olarak gerçekten etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi ↔ strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir; güvenilmeyen eğitim ödül dağıtımının gerçekleştirilmesi için kritik bir yenilik olup, denetlenebilir ve teşvik edici merkeziyetsiz işbirlikçi eğitim ağlarının inşa edilmesi için uygulanabilir bir yol sunmaktadır.
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve agregasyon protokolüdür; asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılma mekanizması ile yerel senkronizasyon stratejilerini birleştirerek, çok sayıda düğümün senkronize olmayan durumlarda sürekli kısmi güncellemeler göndermesine olanak tanır, bu da ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırarak, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonları oluşturmanın temelini oluşturur.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapılarının oluşturulmasıyla, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirlikçi eğitimini tamamlamaya olanak tanımaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile bir araya getirildiğinde, OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamaktadır; bu da küresel işbirlikçi eğitimin katılımcılığını önemli ölçüde artırarak, merkeziyetsizlik eğitim ağı inşası için kritik bir iletişim altyapısı haline gelmektedir.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum darboğazlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve kararsız düğümlerde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güvene dayanmayan bir işbirlikçi eğitim ağı inşa etmek için "son bir mil" iletişim altyapısını açmaktadır.
Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılabileceği ve gerçek katkılara dayalı olarak ödüller alabileceği, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizması olan bir eğitim ağı inşa etti. Protokol, üç ana rol üzerine çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar
Eğitim Düğümü: Yerel eğitim yürütmek, ağırlık güncellemeleri ve gözlem izlerini göndermek
Doğrulama Düğümleri: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplaması ile strateji birleştirmeye katılır.
Protokolün ana süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme###SHARDCAST### ve ödül dağıtımını içerir, bu da "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
(# INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te, asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri ile işbirliği içinde eğitilen dünyanın ilk büyük ölçekli güçlendirme öğrenimi modeli olan INTELLECT-2'yi piyasaya sürdü. Modelin parametre ölçeği 32B'ye ulaşıyor. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitildi ve tamamen asenkron bir mimari kullanıldı, eğitim süresi 400 saati aştı ve asenkron işbirlikçi ağın uygulanabilirliğini ve istikrarını gösterdi. Bu model, yalnızca bir performans sıçraması değil, aynı zamanda Prime Intellect'in önerdiği "eğitim eşitliktir" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL) asenkron eğitim yapısı###, TOPLOC( eğitim davranış doğrulama) ve SHARDCAST( asenkron ağırlık toplama) gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecinin açılmasını ve doğrulanmasını ilk kez başardığını göstermektedir.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
7 Likes
Reward
7
6
Share
Comment
0/400
pumpamentalist
· 4h ago
Yine bir spekülasyon, ama seviyorum.
View OriginalReply0
FloorSweeper
· 4h ago
smh... başka bir zayıf sinyal kağıt ellerin AI eğitimini merkezileştirmeye çalıştığını gösteriyor
View OriginalReply0
ParallelChainMaxi
· 4h ago
Yine merkeziyetsizlik eski tuzağı.
View OriginalReply0
rekt_but_resilient
· 4h ago
Ne yapmak istiyorsun, nasıl merkeziyetsizlik olabilir?
View OriginalReply0
PumpAnalyst
· 4h ago
Yine hayal satıyor, enayiler geçen ay her yeri kaplayan aigc gündemini hatırlıyor musunuz?
Merkeziyetsizlik eğitimi: AI model iş birliği için yeni bir paradigma ve zorluklar
Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak
AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketen, teknik engeli en yüksek olan aşamadır ve doğrudan modelin yetenek sınırını ve pratik uygulama etkisini belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir; bu, AI sistemlerinin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigmalara göre, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, yerel yüksek performanslı kümeler içinde tek bir kuruluş tarafından tüm eğitim sürecinin tamamlandığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme zamanlama sisteminden eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır; bu nedenle GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur. Yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlar sunarken, aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da barındırmaktadır.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir; bunun temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve işbirliği içinde gerçekleştirilmesi yatmaktadır. Bu, tek bir makinenin hesaplama ve depolama darboğazını aşmak için gereklidir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen, yönlendirilen ve senkronize edilen bir yapıdır. Genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır ve NVLink yüksek hızlı bağlantı hattı teknolojisi ile ana düğüm, alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunları içermektedir:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birçok "ofis" çalışanını iş birliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim almaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dirençli bir gelecek yolu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, merkezi bir koordinatör olmaksızın, ev bilgisayarları, bulut GPU'ları veya kenar cihazları ), genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği gerçekleştirerek eğitim görevlerini tamamlar ve şifreleme teşvik mekanizmalarından yararlanarak katkıların dürüstlüğünü güvence altına alır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, kendi hesaplama güçlerini model eğitimi için birleştirmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hala sistematik bir mühendislik zorluğudur ve sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizma, model doğrulaması gibi birçok yönü içermektedir, ancak "iş birliği etkin + dürüstlük teşvikleri + doğru sonuçlar" sağlanabilir mi hala erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtık ve merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını, model parametrelerinin merkezi olarak bir araya getirilmesini vurgular ve gizlilik uyumuna önem veren senaryolar için uygundur, örneğin sağlık, finans. Federated öğrenme, dağıtık eğitim mühendislik yapısını ve yerel iş birliği yeteneğini barındırırken, aynı zamanda merkeziyetsiz eğitimin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre ihtiyaç duyar ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından daha ılımlıdır ve endüstride geçiş aşaması dağıtım yapısı olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi her görev türü için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin çok yüksek olması veya işbirliği zorluğunun büyük olması nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması uygun değildir. Örneğin, büyük model eğitimleri genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu da açık ağda etkili bir şekilde bölmek ve senkronize etmekte zorluk çıkarır; veri gizliliği ve egemenlik sınırlamaları olan görevler (, tıbbi, finansal, gizli veri ) gibi, yasal uyum ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; ve işbirliği teşvik temeli eksik olan görevler (, şirketin kapalı kaynaklı model veya dahili prototip eğitimi ), dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimdeki gerçek kısıtlamaları oluşturur.
Ancak bu, merkeziyetsizlik eğitimlerinin bir safsata olduğu anlamına gelmez. Aslında, yapısal olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri (, RLHF, DPO ), veri kalabalığı eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gösterme özelliklerine sahiptir ve P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenim öncülüğünde, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermektedir, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise görece net olup, başlangıç mühendislik ilerlemelerini görebiliyoruz. Bu makalede, bu beş projenin ardındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve Merkeziyetsizlik AI eğitim sistemi içindeki farklılıkları ve tamamlayıcı ilişkilerini daha fazla tartışacağız.
( Prime Intellect: Eğitim yolları doğrulanabilir pekiştirmeli öğrenme işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; böylece herkes eğitime katılabilir ve hesaplama katkılarından güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizması tam olan bir AI merkeziyetsiz eğitim sistemi oluşturmayı hedeflemektedir.
)# Temel Teknoloji Mekanizmalarının Detaylı Açıklaması
PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect'in Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile iş birliği yapabilir. Geleneksel denetimli öğrenim süreçlerine kıyasla, PRIME-RL, merkezi bir zamanlamanın olmadığı ortamlarda esnek eğitimi gerçekleştirmek için daha uygundur, bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gözlem verilerine dayalı olarak gerçekten etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi ↔ strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir; güvenilmeyen eğitim ödül dağıtımının gerçekleştirilmesi için kritik bir yenilik olup, denetlenebilir ve teşvik edici merkeziyetsiz işbirlikçi eğitim ağlarının inşa edilmesi için uygulanabilir bir yol sunmaktadır.
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve agregasyon protokolüdür; asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılma mekanizması ile yerel senkronizasyon stratejilerini birleştirerek, çok sayıda düğümün senkronize olmayan durumlarda sürekli kısmi güncellemeler göndermesine olanak tanır, bu da ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırarak, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonları oluşturmanın temelini oluşturur.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapılarının oluşturulmasıyla, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirlikçi eğitimini tamamlamaya olanak tanımaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile bir araya getirildiğinde, OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamaktadır; bu da küresel işbirlikçi eğitimin katılımcılığını önemli ölçüde artırarak, merkeziyetsizlik eğitim ağı inşası için kritik bir iletişim altyapısı haline gelmektedir.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum darboğazlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve kararsız düğümlerde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güvene dayanmayan bir işbirlikçi eğitim ağı inşa etmek için "son bir mil" iletişim altyapısını açmaktadır.
Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılabileceği ve gerçek katkılara dayalı olarak ödüller alabileceği, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizması olan bir eğitim ağı inşa etti. Protokol, üç ana rol üzerine çalışmaktadır:
Protokolün ana süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme###SHARDCAST### ve ödül dağıtımını içerir, bu da "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
(# INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te, asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri ile işbirliği içinde eğitilen dünyanın ilk büyük ölçekli güçlendirme öğrenimi modeli olan INTELLECT-2'yi piyasaya sürdü. Modelin parametre ölçeği 32B'ye ulaşıyor. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitildi ve tamamen asenkron bir mimari kullanıldı, eğitim süresi 400 saati aştı ve asenkron işbirlikçi ağın uygulanabilirliğini ve istikrarını gösterdi. Bu model, yalnızca bir performans sıçraması değil, aynı zamanda Prime Intellect'in önerdiği "eğitim eşitliktir" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL) asenkron eğitim yapısı###, TOPLOC( eğitim davranış doğrulama) ve SHARDCAST( asenkron ağırlık toplama) gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecinin açılmasını ve doğrulanmasını ilk kez başardığını göstermektedir.