Como funciona o DeepL?

Por DeepL Team

Muitas vezes nos perguntam como o Tradutor DeepL pode funcionar melhor do que os sistemas dos principais gigantes da tecnologia. Há várias razões para isso. Como a maioria dos sistemas de tradução automática, o Tradutor DeepL traduz textos usando redes neurais artificiais. Essas redes são formadas a partir de milhões de textos previamente traduzidos. No entanto, nossos pesquisadores conseguiram aplicar inúmeras melhorias na metodologia geral das redes neurais, principalmente em quatro áreas.

Arquitetura de rede

Quase todos os sistemas de tradução disponíveis no mercado são modificações diretas da arquitetura Transformer. Naturalmente, as redes neurais do DeepL também contêm partes desta arquitetura, tais como mecanismos de atenção. Contudo, existem outras diferenças significativas na topologia das redes que levam a uma melhoria geral significativa na qualidade da tradução, especialmente quando comparada com o nível geral de tradutores automáticos. Essas diferenças na qualidade da arquitetura de rede tornam-se claramente visíveis quando treinamos os nossos modelos internamente e os comparamos com as melhores arquiteturas Transformer baseadas nos mesmos dados.

Dados de treinamento

Boa parte dos nossos concorrentes diretos são grandes empresas de tecnologia, que já há muitos anos desenvolvem web crawlers. Portanto, eles têm uma vantagem distinta em relação à quantidade de dados de treinamento disponíveis. Nós, por outro lado, damos grande ênfase à aquisição direcionada de dados de treinamento especiais que ajudam nossa rede a obter maior qualidade de tradução. Para isso, desenvolvemos, entre outras coisas, crawlers exclusivos que encontram automaticamente traduções na internet e avaliam sua qualidade.

Metodologia de treinamento

De um modo geral, as redes são treinadas utilizando o método de "aprendizagem supervisionada". Nessa abordagem, a rede é constantemente confrontada com diferentes exemplos. As suas próprias traduções são, assim, sistematicamente comparadas com as traduções dos dados de treinamento. Se houver discrepâncias, os pesos da rede serão ajustados de acordo. Também usamos outras técnicas de outras áreas de aprendizado de máquina ao treinar as redes neurais. Isso também nos permite melhorar significativamente.

Tamanho da rede

Tal como nossos maiores concorrentes, treinamos nossas redes de tradução utilizando bilhões de parâmetros. Essas redes são tão grandes que só podem ser treinadas de forma distribuída em clusters de computação dedicados muito grandes. Entretanto, em nossa pesquisa, damos grande importância ao fato de que os parâmetros da rede são usados de forma muito eficiente. Deste modo, conseguimos alcançar a mesma elevada qualidade de tradução com redes menores e mais rápidas. Por esta razão, temos a capacidade de oferecer traduções de qualidade também aos usuários do nosso serviço gratuito.

Estamos sempre procurando bons matemáticos e cientistas da computação com interesse em impulsionar o desenvolvimento, melhorar ainda mais o Tradutor DeepL e quebrar barreiras linguísticas em todo o mundo. Se você também tem experiência com matemática e treinamento de redes neurais e se você se sente satisfeito em trabalhar em um produto que é usado gratuitamente em todo o mundo, inscreva-se em DeepL !

Compartilhar