DeepL AI Labs

NVIDIA: la tecnologia dietro DeepL AI Labs

I nuovi prodotti e soluzioni che stiamo creando in DeepL AI Labs sono possibili grazie alla nostra collaborazione di lunga data con NVIDIA. L’ultimo traguardo raggiunto nell’ambito di questa partnership è stata l’implementazione da parte di DeepL del primo NVIDIA DGX SuperPOD con sistemi DGX GB200 in Europa all’inizio di quest’anno. Il supercomputer sta aprendo nuove possibilità per quanto riguarda la formazione e l’implementazione di soluzioni di IA.

Abbiamo chiamato il nostro nuovo NVIDIA SuperPOD DeepL Arion. Si avvale dell’architettura Grace Blackwell di NVIDIA, che collega tra loro “isole” di 72 potenti GPU Blackwell per usarle come un’unica unità. Più GPU un SuperPOD collega in questo modo, più diventa potente, e Arion è molto più potente anche del nostro precedente supercomputer NVIDIA, Mercury. Mercury avrebbe impiegato 193 giorni per tradurre l’intero Internet. Se assegnassimo ad Arion questo compito ipotetico, potrebbe gestirlo in modo più che decuplicato, in poco più di 18 giorni!

Più veloce è la macchina, più grande è il modello

Tradurre il World Wide Web sembra impressionante, ma lo è ancora di più l’importanza di Arion per la nostra capacità di addestrare modelli linguistici di grandi dimensioni (LLM, Large Language Models). In sostanza, più veloce è la comunicazione delle GPU, più grandi sono i modelli che possiamo costruirvi. Grazie ad Arion possiamo sfruttare architetture semplici e scalabili per sviluppare LLM molto più grandi.

Siamo in grado di addestrare questi LLM più grandi con dati di addestramento potenziati tramite tecniche sofisticate che abbiamo sperimentato per addestrare i nostri modelli di IA linguistica. Si tratta di un approccio collaudato per la generazione di dati sintetici che ci ha permesso di migliorare di continuo la qualità degli LLM di DeepL nel tempo e che ci aiuterà a sfruttare tutto il potenziale dei modelli più grandi che stiamo sviluppando.

Innovare con nuove capacità

La ricerca sull’IA dimostra che quando si realizzano modelli più grandi e li si addestra su quantità maggiori di dati di alta qualità, i modelli possono iniziare a mostrare capacità finora imprevedibili. 

Questo spesso si traduce in un’evoluzione rapida del modello, che passa dal considerare un compito estremamente difficile a considerarlo relativamente facile. Le nuove capacità premiano i ricercatori che spingono i confini di ciò che l’IA può fare, immaginando nuovi problemi che possono essere risolti e sperimentando nuovi modi per risolverli. Abbiamo creato DeepL AI Labs per stabilire una pipeline di questi esperimenti. In questo modo, stiamo facendo scommesse audaci ma intelligenti su ciò che i modelli di DeepL potranno fare in futuro. 

Ci fissiamo prima obiettivi ambiziosi che sappiamo faranno una grande differenza nel modo in cui le persone lavorano e nella loro produttività. Dopodiché sperimentiamo intensamente, testando idee per nuove funzioni che possono aiutarci a raggiungere questi obiettivi. Le capacità emergenti significano che anche esperimenti molto ambiziosi possono rivelarsi sorprendentemente efficaci. Ampliare la gamma di obiettivi e soluzioni a cui applichiamo i nostri modelli aiuta le nuove capacità ad emergere ancora più rapidamente.

Più interazione con l’IA, più valore per l’utente

L’impatto di una maggiore potenza di calcolo e delle capacità emergenti sta già plasmando le funzioni di DeepL e l’esperienza delle persone che usano i nostri strumenti.

Clarify, l’esperto di traduzione su richiesta che sa quando intervenire con domande intelligenti per chiarire il significato, ne è un primo esempio. Quando i modelli sono in grado di comprendere l’ambiguità e individuare le supposizioni come fa Clarify, sono in grado di interagire con gli utenti in modo più utile e simile a quello umano. Ciò contribuisce a offrire un’esperienza di lavoro con l’IA più reattiva e fornisce risultati molto più pertinenti e impressionanti rispetto a un modello che cerca di ragionare da solo.

All’inizio abbiamo sviluppato queste funzioni interattive per le attività di traduzione, ma sono altrettanto utili per quasi tutte le applicazioni dell’IA. Sviluppando modelli in grado di collaborare in modo più naturale, intelligente e produttivo con le persone, siamo in grado di aiutare le imprese e altre organizzazioni a ottenere molto di più dall’IA.

Una pipeline di progetti di IA

I progetti che stanno prendendo forma nei DeepL AI Labs stanno esplorando nuovi modi innovativi per sfruttare appieno questo potenziale. Così facendo, stanno beneficiando di un altro risultato della nostra stretta collaborazione con NVIDIA per massimizzare il potenziale della potenza di calcolo: una maggiore velocità di inferenza

In generale, i modelli di IA più grandi comportano una maggiore latenza, il che significa che gli utenti devono attendere più a lungo per ottenere i risultati quando chiedono all’IA di eseguire un’attività. La maggiore potenza di calcolo di Arion, combinata con l’abilitazione da parte di NVIDIA dell’addestramento FP8 e dell’inferenza FP4, contribuisce a cambiare questa situazione. Ciò significa che i nostri modelli più grandi e potenti possono comunque eseguire le attività in modo estremamente rapido. 

Arion aiuta gli agenti IA a eseguire compiti complessi alla velocità richiesta dagli utenti. Consente inoltre di realizzare progetti ambiziosi come il nostro approccio rivoluzionario alla traduzione da voce a voce, che dipende dalla capacità di prevedere in modo intelligente ciò che le persone stanno dicendo e di tradurre mentre parlano.

Noi di DeepL non siamo mai stati interessati all’innovazione fine a sé stessa. Puntiamo piuttosto a idee innovative che abbiano un impatto concreto, in particolare per quanto riguarda l’esperienza lavorativa e di vita delle persone. Le capacità di DeepL Arion e la nostra collaborazione con NVIDIA ed EcoDataCenter, che ne costituiscono la base, ci consentono di testare una gamma molto più ampia di idee per questo tipo di impatto concreto. Sono proprio queste possibilità in rapida espansione a rendere DeepL AI Labs uno spazio così entusiasmante.

Condividi

Segui i nostri sviluppi

Scopri in anteprima il futuro dell’IA.