DeepL AI Labs
得益于我们与英伟达的长期合作,DeepL 人工智能实验室正在研发的新产品和解决方案得以实现。该合作关系的最新里程碑是DeepL部署了首个 NVIDIA DGX SuperPOD系统 。这款新型超级计算机正在为人工智能解决方案的训练和部署开辟新的可能性。
我们把这款全新的NVIDIA SuperPOD命名为DeepL Arion。它采用NVIDIA的Grace Blackwell架构,将72个强大的Blackwell GPU组成的"岛屿"相互连接,使其能够作为单一单元协同工作。SuperPOD通过这种方式连接的GPU越多,其性能就越强大。Arion的性能甚至远超我们之前的NVIDIA超级计算机Mercury。水星需要193天才能翻译完整个互联网。如果我们给阿里昂分配这个假设任务,它能在短短18天多一点的时间内完成,速度比人类快10倍以上!
翻译万维网听起来很了不起,但Arion对我们训练大型语言模型(LLMs)能力的影响更为深远。简而言之,GPU通信速度越快,我们就能构建更大的模型。借助Arion,我们可以使用简约、可扩展的架构来 构建规模更大的大型语言模型。
我们能够运用为训练语言人工智能模型而开创的先进技术,通过扩展训练数据来训练这些更大型的语言模型。这是经实践验证的合成数据生成方法,它使我们能够持续修订DeepL大型语言模型的质量,并将助力我们充分发挥所构建更大规模模型的全部潜力。
人工智能研究表明,当构建更大规模的模型,并利用海量高质量数据进行训练时,这些模型便可能展现出此前未曾预见的卓越能力。
这种情况通常表现为:模型在短时间内从认为某项任务极其困难,迅速转变为认为该任务相对容易。此类 新兴能力 激励着研究人员不断拓展人工智能的边界,构想可解决的新问题,并尝试新的解决途径。我们创建了DeepL人工智能实验室,旨在建立此类实验的持续推进机制。通过这样做,我们正在对DeepL模型未来的发展方向进行大胆而明智的押注。
我们通过设置雄心勃勃的目标来实现这一目标,这些目标必将对人们的工作方式和生产力产生重大影响。随后,我们开展密集实验,测试各种新功能创意,以期实现这些目标。涌现能力意味着,即使是雄心勃勃的实验也可能取得令人惊讶的成功。扩大模型应用的目标与解决方案范围,有助于新能力更快地涌现。
更强大的计算能力和新兴能力的影响,正在塑造DeepL的功能特性,并改变用户使用我们工具的体验。
Clarify——这款按需翻译专家懂得何时主动提出智能问题以消除歧义,堪称此类应用的早期典范。当模型能够像Clarify那样理解模糊性并识别隐含假设时,它们便能以更具价值、地道的方式与用户互动。这有助于提供 与人工智能协作时获得更敏捷的响应体验,其产出的结果远比试图独立推理的模型更具相关性与震撼力。
我们最初为翻译任务开发了这些交互能力,但它们 对几乎所有人工智能应用程序同样具有重要价值。通过开发能够与人类更自然、更智能、更高效地协作的模型,我们能够帮助企业及其他组织充分释放人工智能的潜力。
DeepL人工智能实验室正在推进的项目,正致力于探索创新途径以实现这一潜力。通过这种方式,他们正受益于我们与英伟达紧密合作所取得的另一项成果——在最大化计算能力潜能方面: 推理速度的提升。
一般来说,更大的人工智能模型会带来更高的延迟,这意味着当用户要求人工智能执行任务时,需要等待更长时间才能获得结果。阿里昂增强的计算能力,结合英伟达对FP8训练和FP4推理的支持,正助力变更这一现状。这意味着我们更大、更强大的模型仍能以极快的速度完成任务。
Arion助力人工智能代理以用户所需的速度执行复杂任务。它还支持诸如我们革命性的语音到语音翻译技术这类雄心勃勃的项目,该技术依赖于智能预测人们正在表达的内容,并在他们说话时实时进行翻译。
在DeepL,我们从未对为创新而创新感兴趣。相反,我们追求具有现实影响力的创新理念——尤其是在人们的工作与生活体验方面。DeepL Arion的能力,以及支撑这些能力的与NVIDIA和EcoDataCenter的合作,使我们能够测试更多此类具有现实影响力的创新方案。正是这些迅速扩展的可能性,使DeepL人工智能实验室成为如此令人兴奋的领域。