DeepL AI Labs

실시간 음성 대 음성 번역: DeepL이 변화시키는 글로벌 커뮤니케이션의 미래

시작하기: 탄탄한 기반 구축

DeepL의 여정은 하나의 핵심 과제에서 시작되었습니다. 바로 DeepL의 높은 정확도 기준을 충족하는 음성 텍스트 변환 엔진을 개발하는 일이었습니다. DeepL은 기존 아키텍처의 한계를 넘어, 고도화된 학습과 엄선된 데이터를 기반으로 독자적인 모델을 구축했습니다. 이러한 접근을 통해 명확한 기능적 우위를 달성할 수 있었습니다.

DeepL의 내부 벤치마크 결과, DeepL의 모델은 업계 최고 수준의 정확도를 입증했으며, 경쟁사 대비 더 낮은 단어 오류율(WER)을 기록했습니다. 공개 벤치마크에만 의존하지 않고, 실제 고객의 비즈니스 사용 사례를 반영하여 신중하게 선별된 독점 테스트셋을 통해 변환된 텍스트의 품질을 평가합니다.

[모델의 음성 텍스트 변환 정확도(단어 오류율, WER) 비교. DeepL Voice는 Amazon Transcript 및 Microsoft Azure AI Speech 대비 더 낮은 WER을 기록했으며, WER은 낮을수록 더 높은 정확도를 의미합니다.]

과제: 지연 텍스트 깜빡임 문제 해결

정확한 음성-텍스트 변환은 시작에 불과합니다. 변환된 텍스트를 실시간으로 번역하는 과정에서는 또 다른 연구 과제로 이어집니다. 특히 긴 문장의 초반부를 번역할 때는 화자가 이후 어떤 내용을 이어갈지 알 수 없으므로 정확성과 속도를 유지하기 어렵습니다. 기존의 1세대 솔루션은 이 문제를 두 가지 방식 중 하나로 처리해 왔습니다. 전체 문장이 완성될 때까지 기다리는 방식은 높은 번역 지연을 초래하고, 실시간으로 번역 결과를 수정하는 방식은 텍스트가 반복적으로 변경되는 '깜빡임' 현상을 유발하여 불쾌한 사용자 경험으로 이어집니다(자세한 내용은 여기를 참고).

DeepL Voice는 높은 번역 품질과 낮은 지연 시간을 유지하면서 원활한 사용자 경험을 제공하는 것을 목표로 합니다. DeepL은 신경망 기계번역 분야에서 축적한 연구와 기술력을 바탕으로 실시간 번역의 한계를 극복하고 끊김없이 안정적인 텍스트 번역 흐름을 제공합니다.

아래 화면에서 DeepL Voice for Meetings(오른쪽)와 Microsoft Teams 번역(왼쪽)의 차이를 직접 확인해 보세요.

이처럼 안정적인 텍스트 흐름을 구현함으로써, DeepL은 고품질의 원활한 음성 대 음성 커뮤니케이션을 실현하는 데 있어 핵심적인 기술적 장벽을 극복했습니다. 불안정하고 깜빡이는 텍스트에서는 자연스러운 오디오 출력을 구현할 수 없기 때문입니다.

마지막 단계: 실시간 음성 대 음성 번역

핵심 기술 기반이 마련됨에 따라, DeepL AI Labs는 현재 음성 대 음성 번역 프로젝트를 활발히 개발하고 있습니다. 초기 결과는 매우 긍정적이며, 

이는 글로벌 비즈니스를 위한 AI 워크플로의 미래를 구축한다는 DeepL의 비전을 반영합니다. 다양한 언어에서 고품질 실시간 음성 대 음성 번역 서비스를 이제 손쉽게 이용할 수 있습니다!

연구진이 현재 개발 중인 음성 복제 기능을 지원하는 텍스트 음성 변환(TTS) 모델의 초기 시연 영상을 살펴보고 직접 품질을 확인해 보세요.

EN
Voice sample
EN
TTS with Voice Cloning
DE
Voice sample
DE
TTS with Voice Cloning
ES
Voice sample
ES
TTS with Voice Cloning
ZH
Voice sample
ZH
TTS with Voice Cloning

그러나, 자연스러운 음성 대 음성 번역 경험을 구현하기 위해서는 우수한 TTS 모델만으로는 충분하지 않습니다. 실시간으로 작동하는 제품을 구축하려면 분할 추론 전략, 오디오 출력의 자연스러운 연결, 그리고 지연 시간을 최소화하기 위한 정밀한 출력 속도 제어 등 다양한 핵심 기술이 필요합니다.

방금 들으신 음질이 DeepL의 새로운 기준입니다. 이 기술은 DeepL의 핵심 연구 분야이며, 올해 후반 예정된 주요 이벤트에서 더 많은 업데이트와 심층 분석을 공개할 예정입니다. AI 커뮤니케이션의 미래를 향한 DeepL의 여정은 계속됩니다!

공유

최신 정보 확인

차세대 AI 혁신 기술을 미리 살펴보세요.