Jak DeepL funguje?

Autor: DeepL Team

Často se nás ptáte, jak to, že Překladač DeepL často funguje lépe než konkurenční systémy od velkých technologických společností. Existuje pro to několik důvodů. Stejně jako většina překladových systémů překládá Překladač DeepL texty pomocí umělých neuronových sítí. Tyto sítě jsou trénovány na mnoha milionech přeložených textů. Naši výzkumníci však dokázali zlepšit celkovou metodiku neuronové sítě, a to hlavně ve čtyřech oblastech.

Architektura sítě

Je dobře známo, že většina veřejně dostupných překladových systémů jsou přímé modifikace architektury Transformer. Samozřejmě, neuronové sítě DeepL také obsahují části této architektury, jako jsou mechanismy pozornosti. Existují však také významné rozdíly v topologii sítí, které vedou k celkovému významnému zlepšení kvality překladu oproti nejmodernějším veřejným výzkumným metodám. Tyto rozdíly v kvalitě architektury sítě jasně vidíme, když interně trénujeme a porovnáváme naše architektury s nejznámějšími architekturami Transformer na stejných datech.

Tréninková data

Většina našich přímých konkurentů jsou velké technologické společnosti, které mají historii mnoha let vývoje webových prohledávačů. Mají proto výraznou výhodu v množství dostupných tréninkových dat. My naopak klademe velký důraz na cílené získávání speciálních tréninkových dat, která pomáhají naší síti dosahovat vyšší kvality překladu. Za tímto účelem jsme mimo jiné vyvinuli speciální vyhledávače, které automaticky vyhledávají překlady na internetu a hodnotí jejich kvalitu.

Metodika trénování

Ve veřejném výzkumu se tréninkové sítě obvykle trénují pomocí metody „supervizovaného učení“. Síť je opakovaně zobrazována na různých příkladech. Síť opakovaně porovnává své vlastní překlady s překlady z tréninkových dat. V případě nesrovnalostí se váhy sítě odpovídajícím způsobem upraví. Při trénování neuronových sítí používáme také další techniky z jiných oblastí strojového učení. To nám také umožňuje významně zlepšit se.

Velikost sítě

Mezitím my (stejně jako naši největší konkurenti) trénujeme překladatelské sítě s mnoha miliardami parametrů. Tyto sítě jsou tak rozsáhlé, že je lze trénovat pouze distribuovaným způsobem na velmi velkých specializovaných výpočetních klastrech. V našem výzkumu však klademe velký důraz na to, aby byly parametry sítě využívány velmi efektivně. Takto se nám podařilo dosáhnout podobné kvality překladu i s našimi menšími a rychlejšími sítěmi. Proto můžeme uživatelům naší bezplatné služby nabídnout také velmi vysokou kvalitu překladů.

Samozřejmě neustále hledáme velmi dobré matematiky a informatiky, kteří by nám pomohli s vývojem, dále zlepšit Překladač DeepL a odstraňovat jazykové bariéry po celém světě. Pokud máte také zkušenosti s matematikou a trénováním neuronových sítí a pokud vás naplňuje práce na produktu, který se používá po celém světě zdarma, pak se přihlaste do DeepL!

Share