DeepL AI Labs

NVIDIA:DeepL AI Labsを支える最先端技術

DeepL AI Labsで開発中の新製品やソリューションは、NVIDIAとの長年にわたる協力関係によって実現しています。今年初め、DeepLは欧州初となる NVIDIA DGX SuperPOD with DGX GB200を導入しました。このスーパーコンピュータは、AIソリューションのトレーニングや展開に新たな可能性をもたらします。

このSuperPODは「DeepL Arion」と名付けられ、NVIDIAのGrace Blackwellアーキテクチャを採用。72基の高性能Blackwell GPUからなる「アイランド」を相互接続することで、単一ユニットとして動作します。接続GPU数が増えるほど処理能力は向上し、Arionは従来のスーパーコンピュータ「Mercury」を大幅に上回る性能を発揮します。例えば、インターネット全体の翻訳にMercuryが193日かかった作業は、Arionならわずか18日で完了します。

高速マシンが大型モデルの訓練を可能に

Arionの高速通信能力により、大規模言語モデル(LLM)の訓練も飛躍的に効率化されます。GPU間の通信速度が高ければ、より大規模で拡張性のあるモデルの構築が可能です。DeepLでは高度な訓練技術と豊富なデータセットを活用し、LLMの性能を着実に向上させてきました。

今後、より大規模なモデルを構築する上でも、この環境が大きな力となります。

創発能力による革新

AI研究によれば、規模の大きいモデルを高品質データで訓練すると、予測不可能な新しい能力が現れることがあります。 

モデルが「困難」と感じていたタスクを短期間で「容易」に処理できるようになるのです。 DeepL AI Labsでは、この創発能力を活かすための実験パイプラインを整備しています。これにより、次にモデルが何をできるかを大胆かつ知的に予測することが可能です。 

具体的には、人々の働き方や生産性に影響を与える野心的な目標を設定し、それを達成するための新機能やアイデアを集中的に実験・検証します。突発的な能力の発現により、非常に挑戦的な実験でも驚くほどの成果が生まれることがあります。目標や応用範囲を広げることで、新たな能力はさらに迅速に現れるのです。

さらにインタラクティブで価値あるAI体験の提供

計算能力の向上と新たな能力の創発は、すでにDeepLのサービスやユーザー体験に反映されています。

たとえばClarifyは、意味を明確化するために適切なタイミングで知的な質問を行うオンデマンド翻訳エキスパートです。文脈を理解し、前提条件を検出できるモデルにより、より人間らしい、価値のある対話が可能となります。結果として、ユーザーは応答性の高い、印象的な体験を得られるのです。

こうした対話機能は翻訳タスクに留まらず、ほぼすべてのAIアプリケーションで価値を発揮します。人間と自然で知的な協働が可能なモデルの開発により、企業や組織はAIを活用してより大きな成果を上げることができます。

AIプロジェクトのパイプラインと高速推論

DeepL AI Labsで進行中のプロジェクトは、NVIDIAとの協力により演算能力を最大化し、推論速度を向上させています。

一般的にモデルが大きくなるとレイテンシーが増加しますが、ArionとNVIDIAのFP8トレーニングおよびFP4推論により、大規模モデルでも極めて高速にタスクを実行可能です。Arionの能力により、AIエージェントは複雑なタスクをユーザーが望む速度で処理でき、 

音声から音声への翻訳などの革新的プロジェクトも実現します。話者の発言をリアルタイムで予測し翻訳するような高度な体験が可能になったのです。

DeepLでは、単なる技術的挑戦のための革新ではなく、現実世界で人々の仕事や生活に影響を与える革新を追求しています。DeepL Arionの能力とNVIDIA、EcoDataCenterとの協力により、こうした影響力あるアイデアを広範囲で検証可能となっています。この急速な可能性の拡大こそが、DeepL AI Labsを非常にエキサイティングな場としている理由です。

共有

DeepLとつながる

AIの最新技術に関する情報をいち早くご覧ください。