Мы интегрируем Mixhalo в платформу DeepL, чтобы ускорить развитие инноваций в области голосовых технологий и обеспечить рост. Вот как это происходит.

Этот год уже стал значимым годом для DeepL Voice. Мы представили функцию голосового перевода в режиме реального времени, благодаря которой вы слышите на выбранном вами языке то, что говорят собеседники на своем. Функция «Групповые разговоры» позволяет вести многоязычные личные беседы для групп любого размера на столько языков, сколько необходимо. С помощью DeepL Voice API мы даем разработчикам возможность интегрировать функции перевода «голос-текст» и «голос-голос» в системы поддержки клиентов, продукты и платформы. А в апреле издание Slator заявило, что DeepL Voice является явным лидером рынка как по качеству, так и по стабильности субтитров, переводимых в режиме реального времени.

Теперь мы развиваем этот успех, дополняя платформу DeepL новым компонентом, который ещё больше ускорит темпы инноваций в области голосового перевода. Мы привлекаем команду из Mixhalo и их революционную технологию потоковой передачи аудио в режиме реального времени с ультранизкой задержкой. Эта платформа известна тем, что обеспечивает невероятную потоковую передачу аудио в режиме реального времени на концертах, спортивных мероприятиях и ведущих мировых конференциях для тысяч участников одновременно.

Передача аудио, превосходящая скорость звука

Чтобы понять, почему мы так рады присоединению Mixhalo к платформе DeepL, представьте себе следующую ситуацию: Вы находитесь на рок-концерте и наблюдаете за сольным выступлением барабанщика на сцене. Когда он ударяет палочкой по малым барабанам, вы слышите звук, транслируемый через ваш смартфон, именно в тот момент, когда вы этого ожидаете, как при естественном прослушивании. То же самое происходит с каждым другим фанатом на арене. Высококачественный звук Mixhalo доходит до слушателей через их телефоны одновременно с тем, как звуковые волны достигают их по воздуху. Это потоковая передача звука, которая соответствует скорости самого звука, и делает это в больших масштабах. На самом деле, Mixhalo иногда приходится слегка замедлять передачу звука, чтобы сделать его более естественным. Это не просто работа в режиме реального времени. На самом деле это даже быстрее.

Эта сверхнизкая задержка является результатом глубокой экспертизы Mixhalo в области сетей и понимания кодеков, коррекции ошибок и интерполяции, что позволяет передавать аудио с такой скоростью, которая словно изгибает время. Обслуживать тысячи одновременных пользователей в условиях реального времени сложно, а сделать это качественно — еще сложнее. Mixhalo справляется с обеими задачами. Когда мы объединяем усилия, чтобы применить это к голосовому переводу, ситуация становится действительно захватывающей — и очень быстро.

Как сверхнизкая задержка выводит Voice-перевод на новый уровень

Mixhalo опирается на преимущество в скорости, которым DeepL уже обладает при голосовом переводе. Это преимущество обусловлено превосходным пониманием контекста, которое позволяет начинать перевод, не дожидаясь завершения предложения. Дальнейшие усовершенствования в области инференса и потока голосового перевода приближают DeepL Voice ещё ближе к режиму реального времени. Добавить к этому повышенную благодаря Mixhalo скорость, с которой голосовые переводы доходят до аудитории, и опыт становится поистине бесшовным. 

А что можно сделать с дополнительными преимуществами в скорости, которые даёт сверхнизкая задержка? В спорте есть поговорка, что у лучших игроков всегда кажется, что у них больше времени. То же самое верно и в сфере голосового перевода. 

Экономия в 500 миллисекунд на скорости, с которой устный перевод доходит до аудитории, даёт нам время на обработку данных, чтобы лучше передать характер перевода. Мы можем добавить персонализацию и клонирование голоса, нюансированную интонацию и эмоции. Одним словом, это даёт нам время сделать голосовой перевод более точным воспроизведением речи говорящего. Совместно с Mixhalo у нас появилось больше времени для создания лучшего в мире опыта голосового перевода.

Помощь технологическим компаниям в ускорении разработки с помощью DeepL Voice

Этих причин вполне достаточно, чтобы мы с воодушевлением приветствовали присоединение Mixhalo к DeepL. Однако мы не менее рады тому, что это означает для предоставления наших решений большему количеству клиентов по всему миру.

Для начала, присоединение Mixhalo к платформе DeepL означает открытие нашего первого офиса в Сан-Франциско и значительное расширение нашего присутствия на рынке США. 

Но, что еще важнее, это партнерство, совместная ценность которого уже доказана на рынке. Mixhalo Translate использует API DeepL Voice для обеспечения перевода в режиме реального времени крупнейших международных конференций и выступлений. Вместе мы создали пилотные проекты, которые помогают внедрять голосовой перевод в режиме реального времени в центры поддержки клиентов через такие платформы, как Amazon Connect. А инженеры Mixhalo используют свои знания и опыт, чтобы помочь клиентам быстрее создавать решения с помощью DeepL Voice API, ускоряя внедрение этой технологии в самом сердце технологической индустрии США.

Наша дорожная карта по Voice стала еще более динамичной

Присоединение команды Mixhalo и её технологий к DeepL является прорывом во многих отношениях. Благодаря многоканальной передаче аудио без использования аппаратного обеспечения мы можем обеспечить новое поколение аудиорешений в режиме реального времени в глобальном масштабе. Мы ускорим реализацию нашего плана развития продуктов, чтобы воспользоваться этой возможностью, превратив DeepL Voice в полностью интегрированный уровень коммуникации в режиме реального времени для встреч, семинаров, поддержки клиентов и корпоративных рабочих процессов. 

Этот захватывающий год для Voice стал еще лучше. Мы с нетерпением ждем возможности показать вам, что мы создадим вместе.

Попробуйте DeepL Voice прямо сейчас!

Поделиться