DeepL nasıl çalışır?

Yazar: DeepL Team

DeepL Translator'ın büyük teknoloji şirketlerinin rakip sistemlerinden neden daha iyi çalıştığı sık sık sorulmaktadır. Bunun birkaç nedeni vardır. Çoğu çeviri sistemi gibi, DeepL Translator da yapay nöral ağlar kullanarak metinleri çevirir. Bu ağlar, milyonlarca çevrilmiş metin üzerinde eğitilmiştir. Ancak, araştırmacılarımız genel nöral ağ metodolojisinde, özellikle dört alanda birçok iyileştir yapmayı başardılar.

Ağ mimarisi

Halka açık çeviri sistemlerinin çoğunun Transformer mimarisinin doğrudan modifikasyonları olduğu iyi bilinmektedir. Elbette, DeepL'nin nöral ağları da dikkat mekanizmaları gibi bu mimarinin bazı bölümlerini içermektedir. Bununla birlikte, ağların topolojisinde de önemli farklılıklar vardır ve bu da kamu araştırmalarının son teknolojisine kıyasla çeviri kalitesinde genel olarak önemli bir iyileştir sağlar. Aynı veriler üzerinde kendi mimarilerimizi ve en iyi bilinen Transformer mimarilerini dahili olarak eğitip karşılaştırdığımızda, ağ mimarisi kalitesindeki bu farklılıkları açıkça görebiliyoruz.

Eğitim verileri

Doğrudan rakiplerimizin çoğu, uzun yıllardır web tarayıcıları geliştiren büyük teknoloji şirketleridir. Bu nedenle, mevcut eğitim verilerinin miktarı açısından belirgin bir avantaja sahiptirler. Öte yandan, bizler, ağımızın daha yüksek çeviri kalitesine ulaşmasına yardımcı olan özel eğitim verilerinin hedefli bir şekilde elde edilmesine büyük önem veriyoruz. Bu amaçla, diğer şeylerin yanı sıra, internette çevirileri otomatik olarak bulan ve kalitelerini değerlendiren özel tarayıcılar geliştirdik.

Eğit metodolojisi

Kamu araştırmalarında, eğitim ağları genellikle "denetimli öğrenme" yöntemi kullanılarak eğitilir. Ağa farklı örnekler tekrar tekrar gösterilir. Ağ, kendi çevirilerini eğitim verilerindeki çevirilerle tekrar tekrar karşılaştırır. Eğer tutarsızlıklar varsa, ağın ağırlıkları buna göre ayarlanır. Nöral ağları eğitirken, makine öğreniminin diğer alanlarından gelen diğer teknikleri de kullanıyoruz. Bu da önemli iyileştirme elde etmemizi sağlıyor.

Ağ boyutu

Bu arada, biz (en büyük rakiplerimiz gibi) milyarlarca parametre içeren çeviri ağlarını eğitiyoruz. Bu ağlar o kadar büyüktür ki, yalnızca çok büyük özel hesaplama kümelerinde dağıtık bir şekilde eğitilebilirler. Ancak, araştırmamızda ağ parametrelerinin çok verimli bir şekilde kullanılmasına büyük önem veriyoruz. Bu sayede, daha küçük ve daha hızlı ağlarımızla bile benzer bir çeviri kalitesine ulaşmayı başardık. Bu sayede, ücretsiz hizmetimizin kullanıcılarına da çok yüksek kalitede çeviri sunabiliyoruz.

Elbette, gelişimi desteklemek, DeepL Translator'ı daha da iyileştirme ve dünya çapında dil engellerini ortadan kaldırma isteyen çok iyi matematikçiler ve bilgisayar bilimcileri arıyoruz. Matematik ve nöral ağ eğitimi konusunda da deneyiminiz varsa ve dünya çapında ücretsiz olarak kullanılan bir ürün üzerinde çalışmak sizi mutlu ediyorsa, lütfen DeepL'e başvurun!

Paylaş