DeepL AI Labs

NVIDIA: DeepL yapay zeka laboratuvarlarını destekleyen teknoloji

DeepL yapay zeka laboratuvarlarında geliştirdiğimiz yeni ürünler ve çözümler, NVIDIA ile uzun süredir sürdürdüğümüz işbirliği sayesinde mümkün olmaktadır. Bu ortaklığın en son dönüm noktası, DeepL'nin ilk NVIDIA DGX SuperPOD'u . Bu yeni süper bilgisayar, yapay zeka çözümlerinin eğitimi ve uygulanması konusunda yeni olanaklar sunuyor.

Yeni NVIDIA SuperPOD'umuza DeepL Arion adını verdik. NVIDIA'nın Grace Blackwell mimarisini kullanır ve 72 adet güçlü Blackwell GPU'yu birbirine bağlayarak tek bir birim gibi çalışmasını sağlar. SuperPOD bu şekilde ne kadar çok GPU bağlarsa, o kadar güçlü hale gelir ve Arion, önceki NVIDIA süper bilgisayarımız Mercury'den bile çok daha güçlüdür. Mercury'nin tüm interneti çevirmesi 193 gün sürerdi. Arion'a bu varsayımsal görevi versek, 18 günden biraz fazla bir sürede 10 kat daha hızlı bir şekilde halledebilirdi!

Daha hızlı makineler daha büyük modelleri eğitir

Dünya çapındaki web'i çevirmek etkileyici görünebilir, ancak Arion'un büyük dil modelleri (LLM'ler) eğitme kabiliyetimiz için anlamı daha da önemlidir. Basitçe söylemek gerekirse, GPU'lar ne kadar hızlı iletişim kurabilirse, onlarla o kadar büyük modeller oluşturabiliriz. Arion ile normal, ölçeklenebilir mimariler kullanarak çok daha büyük LLM'ler.

Dil yapay zekası modellerimizi eğitmek için öncü olduğumuz sofistike teknikleri kullanarak, ölçeklendirilmiş eğitim verileriyle bu daha büyük LLM'leri eğitebiliyoruz. Bu, DeepL LLM'lerin kalitesini zaman içinde sürekli olarak iyileştirmemizi sağlayan, kanıtlanmış bir sentetik veri üretme yaklaşımıdır ve geliştirdiğimiz daha büyük modellerin tüm potansiyelinden yararlanmamıza yardımcı olacaktır.

Yeni ortaya çıkan yeteneklerle yenilik yapmak

Yapay zeka araştırmaları, daha büyük modeller oluşturup bunları daha fazla miktarda yüksek kaliteli veriyle eğittiğinizde, bu modellerin daha önce öngörülemeyen yetenekler sergilemeye başlayabileceğini göstermektedir.

Bu genellikle, bir görevi son derece zor bulmaktan nispeten kolay bulmaya kadar çok hızlı bir şekilde gelişen bir model şeklinde olur. Bu tür yeni ortaya çıkan yetenekler , araştırmacıları yapay zekanın yapabileceklerinin sınırlarını zorlamaları, çözülebilecek yeni problemler hayal etmeleri ve bunları çözmek için yeni yollar denemeleri için ödüllendiriyor. Bu tür deneylerin bir boru hattını oluşturmak için DeepL yapay zeka laboratuvarını kurduk. Ve bunu yaparken, DeepL'in modellerinin bundan sonra neler yapabileceğine dair cesur ama akıllı tahminlerde bulunuyoruz.

Bunu, insanların çalışma şekillerinde ve verimliliklerinde büyük bir fark yaratacağını bildiğimiz iddialı hedefler belirleyerek yapıyoruz. Ardından, bu hedefleri gerçekleştirmemize yardımcı olabilecek yeni özellikler için fikirleri test ederek yoğun bir şekilde deneyler yapıyoruz. Acil durum yetenekleri, çok iddialı deneylerin bile şaşırtıcı derecede başarılı olabileceği anlamına gelir. Modellerimizi uyguladığımız hedef ve çözümlerin kapsamını genişletmek, yeni yeteneklerin daha hızlı ortaya çıkmasına yardımcı olur.

Daha etkileşimli, daha değerli yapay zeka deneyimleri sunmak

Daha yüksek hesaplama gücü ve yeni ortaya çıkan yeteneklerin etkisi, DeepL'in özelliklerini ve araçlarımızı kullanan kişilerin deneyimlerini şimdiden şekillendirmeye başladı.

Clarify, anlamı belirsizlik gidermek için ne zaman akıllı sorular sorması gerektiğini bilen isteğe bağlı çeviri uzmanı, bunun erken bir örneğidir. Modeller, Clarify'ın yaptığı gibi belirsizlikleri anlayıp varsayımları tespit edebildiklerinde, kullanıcılarla daha değerli, insan doğallığında etkileşim kurabilirler. Bu, daha duyarlı bir yapay zeka ile çalışma deneyimive kendi kendine akıl yürütmeye çalışan bir modele göre çok daha alakalı ve etkileyici sonuçlar sunar.

Bu etkileşimli yetenekleri ilk olarak çeviri görevleri için geliştirdik, ancak bunlar neredeyse tüm yapay zeka uygulamaları için de aynı derecede değerlidir. İnsanlarla daha doğal, daha akıllı ve daha verimli bir şekilde işbirliği yapabilen modeller geliştirerek, işletmelerin ve diğer kuruluşların yapay zeka ile çok daha fazlasını başarmasına yardımcı oluyoruz.

Yapay zeka projelerinin boru hattı

DeepL yapay zeka laboratuvarlarında şekillenen projeler, bu potansiyeli gerçekleştirmek için yenilikçi yeni yollar araştırıyor. Böylece, hesaplama gücünün potansiyelini en üst düzeye çıkarmak için NVIDIA ile yakın işbirliğimizin bir başka sonucundan da faydalanıyorlar: artırılmış çıkarım hızı.

Genel olarak, daha büyük yapay zeka modelleri daha fazla gecikme süresine sahiptir, bu da kullanıcıların yapay zekadan bir görevi yerine getirmesini istediklerinde sonuçları daha uzun süre beklemeleri gerektiği anlamına gelir. Arion'un artan hesaplama gücü, NVIDIA'nın FP8 eğitimi ve FP4 çıkarımını mümkün kılmasıyla birleştiğinde, bu durumu değiştirmeye yardımcı oluyor. Bu, daha büyük ve daha güçlü modellerimizin görevleri yine de son derece hızlı bir şekilde yerine getirebileceği anlamına gelir.

Arion, yapay zeka ajanlarının kullanıcıların istediği hızda karmaşık görevleri yerine getirmelerine yardımcı olur. Ayrıca, insanların söylediklerini akıllıca tahmin edebilme ve söyledikleri anda çevirebilme becerisine dayanan, sesli çeviriye devrim niteliğindeki yaklaşımımız gibi iddialı projeleri de mümkün kılıyor.

DeepL olarak, inovasyon için inovasyonla hiç ilgilenmedik. Daha ziyade, özellikle insanların iş ve yaşam deneyimleri konusunda, gerçek dünyada etkisi olan yenilikçi fikirlerin peşindeyiz. DeepL Arion'un yetenekleri ve bunları destekleyen NVIDIA ve EcoDataCenter ile olan işbirliğimiz, bu tür gerçek dünya etkisine yönelik çok daha geniş bir yelpazede fikirleri test etmemizi sağlıyor. DeepL yapay zeka laboratuvarlarını bu kadar heyecan verici bir yer yapan, hızla genişleyen bu olanaklardır.