¿Cómo funciona DeepL?

Autor - DeepL TeamÚltima actualización: 31 de octubre de 2021

Nos soléis preguntar que cómo es posible que el Traductor de DeepL funcione a menudo mejor que los traductores automáticos de los gigantes tecnológicos. Esto se debe a varias razones: al igual que la mayoría de sistemas de traducción, el Traductor de DeepL emplea redes neuronales artificiales para traducir textos. A estas redes neuronales se les entrena mediante millones de textos traducidos. Sin embargo, el equipo de investigación de DeepL ha introducido muchas innovaciones en la metodología de las redes neuronales, especialmente en cuatro ámbitos:

Arquitectura de las redes neuronales

Es bien sabido que la mayoría de los sistemas de traducción a disposición del público son modificaciones directas de la arquitectura Transformer. Las redes neuronales de DeepL también contienen partes de esta arquitectura, como los mecanismos de atención. No obstante, nuestras redes neuronales presentan diferencias significativas en topología que han implicado un avance notable en cuanto a calidad de traducción, en especial en comparación con la calidad de otros traductores automáticos. Estas diferencias en la calidad de la arquitectura se aprecian especialmente cuando entrenamos y comparamos internamente a nuestras redes neuronales con las redes más conocidas basadas en la arquitectura Transformer empleando los mismos datos.

Datos de entrenamiento

La mayoría de nuestros competidores directos son gigantes tecnológicos que tienen años de experiencia en el desarrollo de rastreadores web. Por lo tanto, tienen una clara ventaja en cuanto a la cantidad de material de aprendizaje disponible. DeepL, en cambio, da gran importancia a la adquisición selectiva de datos de entrenamiento específicos que contribuyen a que nuestras redes neuronales logren una mayor calidad de traducción. Para ello, hemos desarrollado, entre otras cosas, unos rastreadores web únicos que encuentran automáticamente traducciones en internet y evalúan la calidad.

Metodología de entrenamiento

En general, en la investigación se entrena a las redes neuronales empleando el método del aprendizaje supervisado. Con este método, se muestran a las redes neuronales los mismos ejemplos una y otra vez. Estas proceden entonces a comparar continuamente sus propias traducciones con las de los datos de entrenamiento. Si hay discrepancias, los pesos de la red se ajustan en consecuencia. También utilizamos otras técnicas de otras áreas del aprendizaje automático al entrenar las redes neuronales. Esto nos permite lograr innovaciones significativas.

Tamaño de las redes neuronales

Al igual que nuestros principales competidores, entrenamos a las redes neuronales con miles de millones de parámetros. Estas redes son tan grandes que solo pueden entrenarse de forma distribuida en clústeres informáticos dedicados muy grandes. Sin embargo, en nuestra investigación concedemos gran importancia al hecho de que los parámetros de la red se utilicen de forma muy eficiente. Así hemos conseguido que nuestras redes neuronales pequeñas sean capaces de producir una calidad de traducción casi igual a la de nuestras redes más grandes. Por ello, ofrecemos una calidad de traducción muy alta también para los usuarios de la versión gratuita del Traductor de DeepL.

Siempre estamos en busca de nuevo personal dedicado al ámbito de las matemáticas o la informática que nos quieran ayudar a impulsar el desarrollo del Traductor de DeepL y a seguir perfeccionándolo, para acabar con las barreras del idioma en el mundo. Si tienes experiencia en el sector de las matemáticas y el entrenamiento de las redes neuronales y te resultaría gratificante trabajar en un producto que se usa gratis a nivel mundial, ¡te esperamos en DeepL!

Autor - DeepL TeamÚltima actualización: 31 de octubre de 2021