DeepL AI Labs
Os novos produtos e soluções que desenvolvemos no DeepL AI Labs são possíveis graças à nossa longa colaboração com a NVIDIA. O marco mais recente desta parceria foi a implementação do primeiro NVIDIA DGX SuperPOD com sistemas DGX GB200 na Europa pela DeepL no início deste ano. Este novo supercomputador abre novas possibilidades para o treino e a utilização de soluções de IA.
Demos ao nosso novo NVIDIA SuperPOD o nome DeepL Arion. Utiliza a arquitetura Grace Blackwell da NVIDIA, que interliga "ilhas" de 72 potentes GPU Blackwell, permitindo que funcionem como uma única unidade. Quanto mais GPU um SuperPOD conecta dessa forma, mais potente se torna, e o Arion é ainda mais potente do que o nosso supercomputador NVIDIA anterior, o Mercury. O Mercury demoraria 193 dias para traduzir toda a Internet. Se atribuíssemos esta tarefa hipotética ao Arion, ele poderia realizá-la mais de dez vezes mais rápido, em pouco mais de 18 dias.
Traduzir a Internet parece impressionante, mas o que o Arion representa para a nossa capacidade de treinar modelos de linguagem de grande dimensão (LLM) é ainda mais significativo. Em termos simples, quanto mais rápido as GPU conseguem comunicar, maiores são os modelos que desenvolver com elas. Com o Arion, podemos utilizar arquiteturas simples e escaláveis para desenvolver LLM muito maiores.
Podemos treinar esses LLM maiores com dados alargados, utilizando técnicas sofisticadas que desenvolvemos para treinar os nossos modelos de linguagem baseados em IA. É uma abordagem comprovada para gerar dados sintéticos que nos permitiu aperfeiçoar de forma contínua a qualidade dos nossos LLM ao longo do tempo e que nos ajudará a tirar proveito de todo o potencial dos modelos maiores que construímos.
A investigação em IA mostra que modelos maiores, treinados com grandes quantidades de dados de alta qualidade, podem desenvolver funcionalidades até agora imprevistas.
Isso manifesta-se frequentemente no facto de um modelo evoluir muito rapidamente e uma tarefa que antes era considerada extremamente difícil passar a ser considerada relativamente fácil. As novas funcionalidades recompensam os investigadores que expandem os limites do que a IA pode fazer, imaginando novos problemas que podem ser resolvidos e experimentando novas formas de os resolver. Criámos o DeepL AI Labs para disponibilizar um canal para estas experiências. Ao fazê-lo, estamos a fazer apostas ousadas, mas inteligentes, sobre o que os modelos da DeepL podem fazer a seguir.
Definimos metas ambiciosas que sabemos que farão uma grande diferença na forma como as pessoas trabalham e na sua produtividade. Em seguida, realizamos experiências intensivas, testando ideias para novas funções que possam ajudar-nos a atingir esses objetivos. Graças a novas funcionalidades, mesmo experiências muito ambiciosas podem ser surpreendentemente bem-sucedidas. Ampliar o leque de objetivos e soluções aos quais aplicamos os nossos modelos contribui para que novas funcionalidades surjam ainda mais rapidamente.
O impacto de um maior poder de computação e das novas funcionalidades já está a moldar as funções do DeepL e a experiência das pessoas que utilizam as nossas ferramentas.
Clarify, o nosso especialista em traduções a pedido, que sabe quando fazer perguntas inteligentes para esclarecer ambiguidades, é um dos primeiros exemplos disso. Quando os modelos conseguem compreender ambiguidades e detetar suposições da forma que o Clarify o faz, são capazes de interagir com os utilizadores de maneiras mais valiosas e naturais. Isto contribui para proporcionar uma experiência de trabalho com IA mais interativa e produz resultados muito mais pertinentes e impressionantes do que os de um modelo que tenta argumentar de forma independente.
Desenvolvemos inicialmente estas capacidades interativas para tarefas de tradução, mas concluímos que são igualmente valiosas para quase todas as aplicações de IA. Ao desenvolver modelos que podem colaborar de forma mais natural, inteligente e produtiva com as pessoas, podemos ajudar as empresas a tirarem muito mais proveito da tecnologia de IA.
Os projetos que estão a ganhar vida no DeepL AI Labs exploram novas formas inovadoras de concretizar esse potencial. Ao mesmo tempo, beneficiam de outro resultado da nossa estreita colaboração com a NVIDIA para maximizar o potencial da capacidade de processamento: maior velocidade de inferência.
De modo geral, modelos de IA maiores apresentam maior latência, o que significa que os utilizadores precisam de esperar mais tempo pelos resultados quando solicitam que a IA execute uma tarefa. A combinação do desempenho computacional aprimorado do Arion e do suporte da NVIDIA para treino FP8 e inferência FP4 permite que essas limitações sejam superadas. Isto significa que os nossos modelos maiores e mais potentes ainda podem realizar tarefas com extrema rapidez.
O Arion ajuda os agentes de IA a realizarem tarefas complexas na velocidade exigida pelos utilizadores. Além disso, permite realizar projetos ambiciosos, como a nossa abordagem revolucionária à tradução de voz para voz, que depende da capacidade de prever de forma inteligente o que as pessoas estão a dizer e traduzir enquanto falam.
A DeepL não procura inovar apenas pela inovação em si. Pretendemos, antes, ideias inovadoras que tenham um impacto concreto, em particular no que diz respeito à experiência profissional e à vida das pessoas. As capacidades do DeepL Arion e a nossa colaboração com a NVIDIA e a EcoDataCenter, que as sustentam, estão a permitir-nos testar uma gama muito mais ampla de ideias para este tipo de impacto no mundo real. São precisamente estas possibilidades em rápida expansão que tornam o DeepL AI Labs um espaço tão entusiasmante.