DeepL AI Labs

NVIDIA : La technologie qui alimente DeepL AI Labs

Les nouveaux produits et solutions que nous développons chez DeepL AI Labs sont rendus possibles grâce à notre collaboration de longue date avec NVIDIA. La dernière étape importante de ce partenariat a été franchie plus tôt cette année, lorsque DeepL a déployé le premier NVIDIA DGX SuperPOD avec des systèmes DGX GB200 en Europe. Ce nouveau superordinateur ouvre de nouvelles perspectives en matière de formation et de déploiement de solutions d’IA.

Nous avons nommé notre nouveau NVIDIA SuperPOD DeepL Arion. Il utilise l’architecture Grace Blackwell de NVIDIA, qui relie entre elles des « îlots » de 72 puissants GPU Blackwell afin qu’ils puissent fonctionner comme une seule unité. Plus un SuperPOD connecte de GPU de cette manière, plus il devient puissant, et Arion est beaucoup plus puissant que notre précédent superordinateur NVIDIA, Mercury. Mercury aurait nécessité 193 jours pour traduire l’intégralité du contenu sur Internet. Si nous confions cette tâche hypothétique à Arion, il pourrait la réaliser plus de 10 fois plus rapidement, en un peu plus de 18 jours.

Des machines plus rapides entraînent des modèles plus grands

Traduire l’intégralité du Web semble impressionnant, mais l’impact d’Arion sur notre capacité à entraîner des grands modèles linguistiques (LLM) est encore plus significatif. En résumé, plus les GPU communiquent rapidement, plus les modèles que nous pouvons créer avec eux sont grands. Avec Arion, nous pouvons utiliser des architectures simples et évolutives pour construire des LLM beaucoup plus importants.

Nous sommes en mesure d’entraîner ces grands modèles linguistiques à l’aide de données d’entraînement à grande échelle, grâce à des techniques sophistiquées que nous avons mises au point pour entraîner nos modèles d’IA linguistique. Il s’agit d’une approche éprouvée pour générer des données synthétiques qui nous a permis d’améliorer continuellement la qualité des LLM DeepL au fil du temps, et qui nous aidera à exploiter tout le potentiel des modèles plus grands que nous construisons.

Innover grâce à des capacités émergentes

Les recherches en IA démontrent que lorsque l’on développe des modèles plus complexes et qu'on les entraîne à partir de grands volumes de données de haute qualité, ces modèles peuvent commencer à présenter des capacités jusqu’alors imprévisibles.

Cela se traduit souvent par une évolution rapide du modèle, qui passe d’une tâche considérée comme extrêmement difficile à une tâche jugée relativement facile. De telles capacités émergentes récompensent les chercheurs qui repoussent les limites de ce que l’IA peut accomplir, en imaginant de nouveaux problèmes à résoudre et en expérimentant de nouvelles façons de les résoudre. Nous avons créé DeepL AI Labs afin de mettre en place un pipeline pour ces expériences. Ce faisant, nous faisons des paris audacieux mais intelligents sur ce que les modèles DeepL pourront accomplir à l’avenir.

Pour ce faire, nous définissons des objectifs ambitieux qui, nous en sommes convaincus, auront un impact significatif sur la manière dont les gens travaillent et sur leur productivité. Nous menons ensuite des expériences approfondies, en testant des idées de nouvelles fonctionnalités susceptibles de nous aider à atteindre ces objectifs. Les capacités émergentes signifient que même les expériences les plus ambitieuses peuvent s’avérer étonnamment fructueuses. L’élargissement de la gamme d’objectifs et de solutions auxquels nous appliquons nos modèles contribue à accélérer l’émergence de nouvelles capacités.

Offrir des expériences d’IA plus interactives et plus enrichissantes

L’impact d’une puissance de calcul accrue et de capacités émergentes façonne déjà les fonctionnalités de DeepL et l’expérience des utilisateurs de nos outils.

Clarify, l’expert en traduction à la demande qui sait quand poser des questions pertinentes pour clarifier le sens, en est un exemple précoce. Lorsque les modèles sont capables de comprendre l’ambiguïté et de détecter les suppositions comme le fait Clarify, ils peuvent interagir avec les utilisateurs de manière plus utile et plus naturelle. Cela contribue à offrir une expérience de travail avec l’IA plus réactive et qui donne des résultats bien plus pertinents et impressionnants qu’un modèle qui tente de raisonner par lui-même.

Nous avons initialement développé ces capacités interactives pour des tâches de traduction, mais elles sont également très utiles pour presque toutes les applications de l’IA. En développant des modèles capables de collaborer de manière plus naturelle, plus intelligente et plus productive avec les personnes, nous sommes en mesure d’aider les entreprises et autres organisations à tirer davantage parti de l’IA.

Une série de projets liés à l’IA

Les projets en cours de développement au sein du DeepL AI Labs explorent de nouvelles méthodes innovantes pour exploiter ce potentiel. Ce faisant, ils bénéficient d’un autre résultat de notre étroite collaboration avec NVIDIA visant à maximiser le potentiel de la puissance de calcul : une vitesse d’inférence accrue.

En règle générale, les modèles d’IA plus volumineux présentent une latence plus importante, ce qui signifie que les utilisateurs doivent patienter plus longtemps pour obtenir les résultats lorsqu’ils demandent à l’IA d’effectuer une tâche. La puissance de calcul accrue d’Arion, combinée à la prise en charge par NVIDIA de l’entraînement FP8 et de l’inférence FP4, contribue à changer cette situation. Cela signifie que nos modèles plus grands et plus puissants peuvent toujours exécuter des tâches avec une grande rapidité.

Arion assiste les agents IA dans l’exécution de tâches complexes à la vitesse requise par les utilisateurs. Cela permet également de réaliser des projets ambitieux tels que notre approche révolutionnaire de la traduction voix-à-voix, qui repose sur la capacité à prédire intelligemment ce que les gens disent et à traduire leurs propos au fur et à mesure qu’ils les prononcent.

Chez DeepL, nous n’avons jamais été intéressés par l’innovation pour l’innovation. Nous privilégions plutôt les idées novatrices qui ont un impact concret, en particulier en ce qui concerne l’expérience professionnelle et personnelle des individus. Les capacités de DeepL Arion, ainsi que notre collaboration avec NVIDIA et EcoDataCenter, nous permettent d’explorer un éventail beaucoup plus large d’idées pour ce type d’impact concret. Ce sont ces possibilités en pleine expansion qui font de DeepL AI Labs un environnement si passionnant.