Como funciona o DeepL?

Por DeepL Team

Perguntam-nos frequentemente porque é que o Tradutor DeepL funciona melhor do que os sistemas concorrentes das principais empresas tecnológicas. Por várias razões. Como a maioria dos sistemas de tradução automática, o Tradutor DeepL traduz textos usando redes neuronais artificiais. Essas redes são formadas com recurso a milhões de textos previamente traduzidos. No entanto, os nossos investigadores conseguiram introduzir inúmeras melhorias na metodologia geral das redes neuronais, principalmente em quatro áreas.

Arquitetura de rede

A maioria dos sistemas de tradução disponíveis no mercado são modificações diretas da arquitetura Transformer. Também as redes neuronais do DeepL contêm partes desta arquitetura, tais como mecanismos de atenção. Contudo, existem diferenças consideráveis na topologia das redes que levam a uma melhoria significativa na qualidade da tradução, especialmente quando comparada com o nível geral dos tradutores automáticos. Estas diferenças na qualidade da arquitetura de rede tornam-se claramente visíveis quando treinamos os nossos modelos internamente e os comparamos com as melhores arquiteturas Transformer baseadas nos mesmos dados.

Dados de treino

A maioria dos nossos concorrentes são grandes empresas de tecnologia que têm vindo a desenvolver web crawlers ao longo dos anos. Portanto, eles têm uma vantagem distinta na quantidade de dados de treino disponíveis. Nós, por outro lado, damos grande ênfase à aquisição direcionada de dados de treino especiais que auxiliam a nossa rede a alcançar uma qualidade de tradução superior. Para este fim, desenvolvemos, entre outras coisas, crawlers especiais que encontram automaticamente traduções na internet e avaliam a sua qualidade.

Metodologia de treino

De um modo geral, as redes são treinadas utilizando o método de "aprendizagem supervisionada". Nesta abordagem, a rede é sistematicamente confrontada com exemplos diferentes. A rede compara repetidamente as suas próprias traduções com as traduções dos dados de treino. Se houver discrepâncias, os pesos da rede neuronal são ajustados em conformidade. Também utilizamos outras técnicas de outras áreas da aprendizagem automática ao treinar as redes neuronais. Isso também nos permite aperfeiçoar significativamente.

Tamanho da rede

Entretanto, tal como os nossos maiores concorrentes, treinamos redes de tradução utilizando milhares de milhões de parâmetros. Essas redes são tão grandes que só podem ser treinadas de forma distribuída em clusters de computação dedicados muito grandes. No entanto, em nossa pesquisa, atribuímos grande importância ao fato de que os parâmetros da rede são utilizados de forma muito eficiente. Deste modo, conseguimos alcançar a mesma elevada qualidade de tradução com redes mais pequenas e mais rápidas. Por esta razão, temos também a capacidade de oferecer uma elevada qualidade de tradução aos utilizadores do nosso serviço gratuito.

Estamos sempre à procura de bons matemáticos e cientistas informáticos com interesse em impulsionar o desenvolvimento, melhorar ainda mais o Tradutor DeepL e ultrapassar as barreiras linguísticas em todo o mundo. Se possui experiência em matemática e no treinamento de rede neuronal, e se se sente realizado ao trabalhar em um produto utilizado grátis em todo o mundo, então inscreva-se na DeepL.

Partilhar