DeepL AI Labs
DeepL AI Labs에서 개발 중인 신제품과 솔루션은 NVIDIA와의 장기적인 협력을 통해 가능해졌습니다. 해당 파트너십의 최신 성과로, DeepL은 올해 초 유럽 최초로 NVIDIA DGX GB200 시스템을 포함한 NVIDIA DGX SuperPOD을 도입했습니다. 이 새로운 슈퍼컴퓨터는 AI 솔루션의 훈련과 배포에 있어 새로운 가능성을 열어주고 있습니다.
새로운 NVIDIA SuperPOD은 DeepL Arion이라는 이름이 붙여졌습니다. Arion은 NVIDIA의 Grace Blackwell 아키텍처를 기반으로 하며, 72개의 고성능 Blackwell GPU로 구성된 '아일랜드'를 서로 연결해 하나의 단위로 작동하도록 설계되었습니다. 이처럼 연결된 GPU가 많을수록 성능은 더 향상되며, Arion은 기존 NVIDIA 슈퍼컴퓨터인 Mercury를 크게 능가하는 강력한 성능을 제공합니다. Mercury가 인터넷 전체 콘텐츠를 번역하는 데 약 193일이 걸렸다면, Arion은 동일한 작업을 단 18일 만에 완료할 수 있어 10배 이상의 성능 향상을 보여줍니다.
인터넷 콘텐츠를 번역하는 성능도 인상적이지만, Arion이 대규모 언어 모델(LLM) 학습에 미치는 영향은 훨씬 더 중요합니다. 간단히 말해, GPU 간 통신 속도가 빠를수록 더 큰 모델을 효율적으로 구축할 수 있기 때문입니다. DeepL은 Arion을 통해 간단하고 확장성 있는 아키텍처를 기반으로 훨씬 더 큰 규모의 LLM을 구축할 수 있습니다.
DeepL은 언어 AI 모델 학습을 위해 개발한 정교한 기법과 확장된 학습 데이터를 활용해 이러한 대규모 LLM을 훈련할 수 있습니다. 이는 합성 데이터를 생성하는 검증된 접근 방식으로, 시간이 지나면서 DeepL LLM의 품질을 지속적으로 향상하고, DeepL이 구축하는 더 큰 규모 모델의 잠재력을 효과적으로 활용할 수 있습니다.
AI 연구에 따르면 대규모 모델을 구축하고 더 많은 고품질 데이터로 학습시킬수록 이전에는 예측하지 못했던 새로운 기능이 나타난다고 합니다.
이는 특정 작업을 매우 어렵게 수행하던 모델이 짧은 시간 안에 이를 훨씬 더 손쉽게 처리할 수 있는 형태로 나타나기도 합니다. 이러한 신규 기능은 연구진이 AI의 한계를 넘어서고, 해결할 수 있는 새로운 문제를 구상하며, 이를 위한 새로운 접근 방법을 실험하도록 이끕니다. DeepL은 이러한 실험을 체계적으로 추진하기 위해 DeepL AI Labs를 출범했습니다. 이를 통해, DeepL 모델의 새로운 가능성을 과감하면서도 신중하게 탐색하고 있습니다.
DeepL은 사람들이 일하는 방식과 생산성에 의미 있는 변화를 불러올 수 있도록 도전적인 목표를 설정하고 있습니다. 또한, 이러한 목표 달성에 기여하는 새로운 기능에 대한 아이디어를 테스트하고 집중적으로 실험합니다. 신규 기능은 대담한 실험에서도 놀라운 성과를 끌어낼 수 있음을 보여줍니다. 모델을 적용하는 목표와 솔루션의 범위가 확장될수록 새로운 기능의 등장 가능성도 더 커집니다.
더 강력해진 컴퓨팅 파워와 새롭게 등장하는 기능은 이미 DeepL의 기능과 사용자 경험에 변화를 불러오고 있습니다.
그 대표적인 사례가 Clarify입니다. Clarify는 의미를 명확히 하기 위해 적절한 시점에 지능적인 질문을 던지는 온디맨드 번역 전문가입니다. 모델이 Clarify처럼 모호성을 이해하고 가정을 식별할 수 있을 때, 사용자와 더 자연스럽고 가치 있는 방식으로 상호작용할 수 있습니다. 이는 반응성이 뛰어난 AI와의 협업 경험을 제공하며 스스로 추론하는 모델보다 훨씬 더 관련성 있고 의미 있는 결과로 이어집니다.
처음 DeepL은 번역 작업을 위해 이러한 상호작용 기능을 개발했지만, 이는 AI의 다양한 활용 분야에도 동일하게 적용될 수 있습니다. 사람과 더 자연스럽고, 지능적이며, 생산적으로 협업할 수 있는 모델을 개발함으로써, DeepL은 기업과 조직이 AI를 통해 더 큰 성과를 달성할 수 있도록 지원합니다.
DeepL AI Labs에서 진행되는 프로젝트는 이러한 잠재력을 실현하기 위한 새롭고 혁신적인 접근 방식을 탐구합니다. 이를 통해 연구진은 NVIDIA와의 긴밀한 협력을 바탕으로 컴퓨팅 성능의 잠재력을 극대화하는 과정에서 얻은 또 다른 성과인 추론 속도 향상의 혜택을 누리고 있습니다.
일반적으로 대규모 AI 모델은 더 긴 지연 시간을 수반하며, 이는 사용자가 AI에게 작업을 수행하도록 요청하면 결과를 얻기까지 더 오래 기다려야 함을 의미합니다. Arion의 향상된 컴퓨팅 성능과 NVIDIA의 FP8 학습 및 FP4 추론 지원이 결합하면서 이러한 한계를 극복할 수 있게 되었습니다. 이를 통해 DeepL의 더 큰 규모의 고성능 모델에서도 빠른 응답 속도를 유지할 수 있습니다.
Arion은 AI 에이전트가 사용자가 요구에 맞춰 복잡한 작업을 신속하게 수행하도록 지원하며, 발화를 예측하고 즉시 번역하는 혁신적인 음성 대 음성 번역과 같은 야심 찬 프로젝트를 가능하게 합니다.
DeepL은 혁신 자체를 위한 혁신을 추구하지 않습니다. 대신, 현실에 실질적인 영향을 미치는 의미 있는 혁신을 지향합니다. 특히 사람들이 일하고 소통하는 방식을 개선하는 데 집중하고 있습니다. DeepL Arion의 성능과 이를 뒷받침하는 NVIDIA 및 EcoDataCenter와의 협력을 통해, DeepL은 이러한 실질적인 영향력을 만들어낼 수 있는 더욱 다양한 아이디어를 실험할 수 있게 되었습니다. 이렇게 빠르게 확장되는 가능성은 DeepL AI Labs를 역동적이고 흥미로운 공간으로 만들고 있습니다.