¿Cómo funciona DeepL?
Nos soléis preguntar que cómo es posible que el Traductor de DeepL funcione a menudo mejor que los traductores automáticos de los gigantes tecnológicos. Esto se debe a varias razones: al igual que la mayoría de sistemas de traducción, el Traductor de DeepL emplea redes neuronales artificiales para traducir textos. A estas redes neuronales se les entrena mediante millones de textos traducidos. Sin embargo, el equipo de investigación de DeepL ha introducido muchas innovaciones en la metodología de las redes neuronales, especialmente en cuatro ámbitos:
Arquitectura de las redes neuronales
Es bien sabido que la mayoría de los sistemas de traducción a disposición del público son modificaciones directas de la arquitectura Transformer. Las redes neuronales de DeepL también contienen partes de esta arquitectura, como los mecanismos de atención. No obstante, nuestras redes neuronales presentan diferencias significativas en topología que han implicado un avance notable en cuanto a calidad de traducción, en especial en comparación con la calidad de otros traductores automáticos. Estas diferencias en la calidad de la arquitectura se aprecian especialmente cuando entrenamos y comparamos internamente a nuestras redes neuronales con las redes más conocidas basadas en la arquitectura Transformer empleando los mismos datos.
Datos de entrenamiento
La mayoría de nuestros competidores directos son gigantes tecnológicos que tienen años de experiencia en el desarrollo de rastreadores web. Por lo tanto, tienen una clara ventaja en cuanto a la cantidad de material de aprendizaje disponible. Por nuestra parte, ponemos gran énfasis en la adquisición selectiva de material de aprendizaje especial que ayuda a nuestra red a lograr una mayor calidad de traducción. Para ello, hemos desarrollado, entre otras cosas, unos rastreadores web únicos que encuentran automáticamente traducciones en internet y evalúan la calidad.
Metodología de entrenamiento
En general, en la investigación se entrena a las redes neuronales empleando el método del aprendizaje supervisado. Con este método, se muestran a las redes neuronales los mismos ejemplos una y otra vez. Estas proceden entonces a comparar continuamente sus propias traducciones con las de los datos de entrenamiento. Si hay discrepancias, los pesos de la red se ajustan en consecuencia. También utilizamos otras técnicas de otras áreas del aprendizaje automático al entrenar las redes neuronales. Esto nos permite lograr innovaciones significativas.
Tamaño de las redes neuronales
Al igual que nuestros principales competidores, entrenamos a las redes neuronales con miles de millones de parámetros. Estas redes son tan grandes que solo pueden entrenarse de forma distribuida en clústeres informáticos dedicados muy grandes. Sin embargo, en nuestra investigación concedemos gran importancia al hecho de que los parámetros de la red se utilicen de forma muy eficiente. Así hemos conseguido que nuestras redes neuronales pequeñas sean capaces de producir una calidad de traducción casi igual a la de nuestras redes más grandes. Por ello, ofrecemos una calidad de traducción muy alta también para los usuarios de la versión gratuita del Traductor de DeepL.
Siempre estamos en busca de nuevo personal dedicado al ámbito de las matemáticas o la informática que nos quieran ayudar a impulsar el desarrollo del Traductor de DeepL y a seguir perfeccionándolo, para acabar con las barreras del idioma en el mundo. Si además tienes experiencia en matemáticas y en entrenar red neuronal, y te motiva trabajar en un producto que se utiliza gratis en todo el mundo, ¡envía tu solicitud a DeepL!