DeepL AI Labs
Nowe produkty i rozwiązania, które tworzymy w DeepL AI Labs, są możliwe dzięki naszej wieloletniej współpracy z firmą NVIDIA. Najnowszym kamieniem milowym w tej współpracy było uruchomienie przez DeepL pierwszego systemu NVIDIA DGX SuperPOD z systemami DGX GB200 w Europie na początku tego roku. Ten nowy superkomputer otwiera nowe możliwości w zakresie szkolenia i uruchamiania rozwiązań opartych na AI.
Nasz nowy produkt NVIDIA SuperPOD nazwaliśmy DeepL Arion. Wykorzystuje architekturę NVIDIA Grace Blackwell, która łączy ze sobą „wyspy” 72 potężnych procesorów graficznych Blackwell, dzięki czemu mogą one działać jako jedna całość. Im więcej procesorów graficznych SuperPOD łączy w ten sposób, tym większą moc osiąga, a Arion jest znacznie wydajniejszy nawet od naszego poprzedniego superkomputera NVIDIA, Mercury. Przetłumaczenie całego internetu zajęłoby Mercury 193 dni. Gdybyśmy powierzyli Arionowi to hipotetyczne zadanie, wykonałby je ponad 10 razy szybciej, w nieco ponad 18 dni!
Tłumaczenie światowej sieci internetowej brzmi imponująco, ale znaczenie Ariona dla waszej zdolności do trenowania dużych modeli językowych (LLM) jest jeszcze większe. Mówiąc najprościej, im szybciej komunikują się procesory graficzne, tym większe modele można dzięki nim tworzyć. Dzięki Arionowi możemy wykorzystywać proste, skalowalne architektury do budować znacznie większe modele LLM.
Jesteśmy w stanie trenować te większe modele LLM przy użyciu skalowanych danych treningowych, wykorzystując zaawansowane techniki, które opracowaliśmy specjalnie do trenowania naszych modeli technologii językowej AI. Jest to sprawdzona metoda wygenerowania danych syntetycznych, która pozwoliła wam z czasem stale poprawiać jakość modeli DeepL LLM i pomoże wam w pełni wykorzystać potencjał większych modeli, które tworzycie.
Badania nad AI pokazują, że kiedy tworzycie większe modele i trenujecie je na większych ilościach wysokiej jakości danych, modele te mogą zacząć wykazywać nieprzewidziane wcześniej możliwości.
Często przybiera to formę modelu, który bardzo szybko ewoluuje od postrzegania zadania jako niezwykle trudnego do postrzegania go jako stosunkowo łatwego. Takie nowe możliwości nagradzają was za poszerzanie granic możliwości AI, wymyślanie nowych problemów, które można rozwiązać, i eksperymentowanie z nowymi sposobami ich rozwiązywania. Stworzyliśmy DeepL AI Labs, aby ustanowić proces przeprowadzania takich eksperymentów. W ten sposób podejmujemy odważne, ale przemyślane decyzje dotyczące przyszłych możliwości modeli DeepL.
Robimy to, wyznaczając ambitne cele, które, jak wiemy, będą miały ogromny wpływ na sposób pracy ludzi i ich wydajność. Następnie intensywnie eksperymentujemy, testując pomysły dotyczące nowych funkcji, które mogą pomóc wam osiągnąć te cele. Wschodzące możliwości oznaczają, że nawet bardzo ambitne eksperymenty mogą okazać się zaskakująco skuteczne. Rozszerzenie zakresu celów i rozwiązań, do których stosujemy nasze modele, pomaga w jeszcze szybszym pojawianiu się nowych możliwości.
Wpływ większej mocy obliczeniowej i nowych możliwości już teraz kształtuje funkcje DeepL oraz doświadczenia użytkowników korzystających z naszych narzędzi.
Clarify, ekspert w dziedzinie tłumaczeń na żądanie, który wie, kiedy zadawać inteligentne pytania w celu precyzyjnego wyjaśnienia znaczenia, jest jednym z pierwszych przykładów tego typu rozwiązań. Kiedy modele potrafią zrozumieć niejednoznaczność i wykrywać założenia w taki sposób, jak robi to Clarify, są w stanie wchodzić w interakcje z użytkownikami w bardziej wartościowy, naturalnie brzmiący sposób. Pomaga to zapewnić doświadczenie pracy z AI, która jest bardziej responsywnai zapewnia znacznie bardziej trafne i imponujące wyniki niż model, który próbuje samodzielnie wnioskować.
Najpierw opracowaliśmy te interaktywne funkcje do zadań związanych z tłumaczeniem, ale są one równie przydatne w niemal każdej aplikacji AI. Opracowując modele, które mogą współpracować z ludźmi w sposób bardziej naturalny, inteligentny i produktywny, pomagamy przedsiębiorstwom i innym organizacjom osiągać znacznie więcej dzięki AI.
Projekty realizowane w DeepL AI Labs badają nowe, innowacyjne sposoby wykorzystania tego potencjału. W ten sposób korzystacie z kolejnego efektu naszej ścisłej współpracy z firmą NVIDIA w zakresie maksymalizacji potencjału mocy obliczeniowej: zwiększoną prędkością wnioskowania.
Ogólnie rzecz biorąc, większe modele AI charakteryzują się większym opóźnieniem, co oznacza, że użytkownicy muszą dłużej czekać na wyniki, gdy proszą AI o wykonanie zadania. Zwiększona moc obliczeniowa Ariona w połączeniu z obsługą szkolenia FP8 i wnioskowania FP4 przez firmę NVIDIA pomaga to zmienić. Oznacza to, że nasze większe, mocniejsze modele nadal mogą wykonywać zadania niezwykle szybko.
Arion pomaga agentom AI wykonywać złożone zadania z prędkością wymaganą przez użytkowników. Umożliwia to również realizację ambitnych projektów, takich jak nasze rewolucyjne podejście do tłumaczenia głosowego, które opiera się na inteligentnym przewidywaniu tego, co mówią ludzie, i tłumaczeniu tego w trakcie mówienia.
W DeepL nigdy nie interesowały was innowacje dla samych innowacji. Zamiast tego realizujemy innowacyjne pomysły, które mają realny wpływ na świat — zwłaszcza w zakresie doświadczeń związanych z pracą i życiem. Możliwości DeepL Arion oraz nasza współpraca z firmami NVIDIA i EcoDataCenter, które stanowią ich podstawę, pozwalają wam testować znacznie szerszy zakres pomysłów dotyczących tego rodzaju rzeczywistego wpływu. To właśnie te szybko rozwijające się możliwości sprawiają, że DeepL AI Labs jest tak ekscytującym miejscem.