DeepL AI Labs

NVIDIA: Technologie, která pohání DeepL AI Labs

Nové produkty a řešení, které vytváříme v DeepL AI Labs, jsou možné díky naší dlouhodobé spolupráci se společností NVIDIA. Posledním milníkem v tomto partnerství bylo nasazení prvního systému NVIDIA DGX SuperPOD se systémy DGX GB200 v Evropě na začátku tohoto roku. Tento nový superpočítač otevírá nové možnosti v oblasti trénování a nasazování řešení AI.

Náš nový NVIDIA SuperPOD jsme pojmenovali DeepL Arion. Využívá architekturu NVIDIA Grace Blackwell, která propojuje „ostrůvky“ 72 výkonných grafických procesorů Blackwell, aby mohly fungovat jako jeden celek. Čím více grafických procesorů SuperPOD tímto způsobem propojí, tím výkonnější se stává, a Arion je mnohem výkonnější než náš předchozí superpočítač NVIDIA, Mercury. Mercury by potřeboval 193 dní, aby přeložil celý internet. Kdybychom Arionovi zadali tento hypotetický úkol, zvládl by ho více než 10krát rychleji, za pouhých 18 dní!

Rychlejší stroje trénují větší modely

Překlad celosvětové sítě zní působivě, ale význam Arionu pro naši schopnost trénovat velké jazykové modely (LLM) je ještě významnější. Zjednodušeně řečeno, čím rychleji mohou GPU komunikovat, tím větší modely s nimi můžeme vytvářet. S Arionem můžeme pomocí jednoduchých, škálovatelných architektur vytvářet mnohem větší LLM.

Jsme schopni trénovat tyto větší LLM pomocí rozšířených tréninkových dat s využitím sofistikovaných technik, které jsme vyvinuli pro trénování našich Jazykových AI modelů. Jedná se o osvědčený přístup k generování syntetických dat, který nám umožnil průběžně zlepšovat kvalitu DeepL LLM v průběhu času a který nám pomůže plně využít potenciál větších modelů, které vytváříme.

Inovace s využitím nových schopností

Výzkum v oblasti AI ukazuje, že když vytvoříte větší modely a trénujete je na větším množství vysoce kvalitních dat, mohou tyto modely začít vykazovat dosud nepředvídané schopnosti.

To často nabývá podoby modelu, který se velmi rychle vyvíjí od vnímání úkolu jako extrémně obtížného k vnímání jako relativně snadného. Takové nové schopnosti odměňují výzkumníky za posouvání hranic možností AI, vymýšlení nových problémů, které lze vyřešit, a experimentování s novými způsoby jejich řešení. Vytvořili jsme DeepL AI Labs, abychom zavedli postup pro provádění takových experimentů. A tímto způsobem děláme odvážné, ale inteligentní sázky na to, co modely DeepL dokážou v budoucnu.

Toho dosahujeme nastavením ambiciózních cílů, o kterých víme, že výrazně ovlivní způsob práce lidí a jejich produktivitu. Poté intenzivně experimentujeme a testujeme nápady na nové funkce, které nám mohou pomoci tyto cíle splnit. Díky nově vznikajícím schopnostem mohou být i velmi ambiciózní experimenty překvapivě úspěšné. Rozšíření škály cílů a řešení, na které aplikujeme naše modely, pomáhá novým schopnostem objevovat se ještě rychleji.

Umožnění interaktivnějších a hodnotnějších zážitků s AI

Vliv většího výpočetního výkonu a nových schopností již nyní ovlivňuje vlastnosti DeepL a zkušenosti uživatelů našich nástrojů.

Clarify, expert na překlady na vyžádání, který ví, kdy se obrátit s inteligentními otázkami, aby objasnil význam, je jedním z prvních příkladů tohoto přístupu. Když modely dokážou porozumět nejednoznačnosti a rozpoznat předpoklady tak, jak to dělá Clarify, jsou schopny komunikovat s uživateli hodnotnějším, přirozeně znějícím způsobem. To pomáhá poskytovat zkušenost s prací s AI, která je responzivnějšía poskytuje mnohem relevantnější a působivější výsledky než model, který se pokouší uvažovat sám.

Tyto interaktivní schopnosti jsme nejprve vyvinuli pro překladatelské úkoly, ale jsou stejně cenné pro téměř jakoukoli aplikaci AI. Díky vývoji modelů, které mohou s lidmi spolupracovat přirozeněji, inteligentněji a produktivněji, jsme schopni pomoci podnikům a dalším organizacím dosáhnout s AI mnohem více.

Řada projektů v oblasti AI

Projekty, které vznikají v DeepL AI Labs, zkoumají nové inovativní způsoby, jak tento potenciál naplnit. Tímto způsobem těží z dalšího výsledku naší úzké spolupráce se společností NVIDIA na maximalizaci potenciálu výpočetního výkonu: zvýšení rychlosti inferenčních operací.

Obecně lze říci, že větší modely AI mají větší latenci, což znamená, že uživatelé/ky musí déle čekat na výsledky, když požádají AI o provedení úkolu. Zvýšený výpočetní výkon Arionu v kombinaci s podporou trénování FP8 a inferencí FP4 od společnosti NVIDIA pomáhá tuto situaci změnit. To znamená, že naše větší a výkonnější modely mohou i nadále provádět úkoly extrémně rychle.

Arion pomáhá agentům AI provádět složité úkoly rychlostí, kterou uživatelé vyžadují. Umožňuje také realizaci ambiciózních projektů, jako je náš revoluční přístup k překladu hlasu do hlasu, který závisí na schopnosti inteligentně předvídat, co lidé říkají, a překládat to v reálném čase.

Ve společnosti DeepL jsme nikdy neměli zájem o inovace jen pro inovace samotné. Spíše se zaměřujeme na inovativní nápady, které mají reálný dopad – zejména pokud jde o pracovní a životní zkušenosti lidí. Schopnosti DeepL Arion a naše spolupráce se společnostmi NVIDIA a EcoDataCenter, které je podporují, nám umožňují testovat mnohem širší škálu nápadů pro tento typ reálného dopadu. Právě tyto rychle se rozšiřující možnosti dělají z DeepL AI Labs tak vzrušující místo.