Ми інтегруємо Mixhalo в платформу DeepL, щоб прискорити розвиток інновацій у сфері голосових технологій та зростання компанії. Ось як це відбувається.

Цей рік вже став важливим для DeepL Voice. Ми оголосили про голосовий переклад в режимі реального часу, що означає: ви чуєте обраною мовою те, що люди говорять своєю. Функція «Групові розмови» дозволяє вести багатомовні особисті розмови для груп будь-якого розміру, на стільки мов, скільки потрібно. Завдяки DeepL Voice API ми даємо розробникам можливість інтегрувати переклад «голос-у-текст» та «голос-у-голос» у системи підтримки клієнтів, продукти та платформи. А в квітні Slator оголосив, що DeepL Voice є безперечним лідером ринку як за якістю, так і за стабільністю субтитрів, перекладених у режимі реального часу.

Зараз ми розвиваємо цей успіх, додавши до платформи DeepL нову функцію, яка ще більше прискорить темпи інновацій у галузі голосового перекладу. Ми залучаємо команду з Mixhalo та їхню революційну технологію аудіопотоку в режимі реального часу з надзвичайно низькою затримкою. Ця платформа відома тим, що забезпечує неймовірну потокову передачу аудіо в режимі реального часу на концертах, спортивних заходах та провідних міжнародних конференціях для тисяч учасників одночасно.

Передача аудіо, що перевершує швидкість звуку

Щоб зрозуміти, чому ми так раді інтеграції Mixhalo в платформу DeepL, уявіть собі таке: Ви на рок-концерті, дивитеся, як барабанщик виконує соло на сцені. Коли він б’є паличкою по малій барабані, ви чуєте звук, що транслюється через ваш смартфон, саме в той момент, коли ви б очікували його почути, слухаючи наживо. Те саме відбувається з кожним іншим фанатом на арені. Аудіо високої якості від Mixhalo досягає слухачів через їхні телефони одночасно з тим, як звукові хвилі досягають їх через повітря. Це потокове аудіо, яке відповідає швидкості самого звуку, і робить це у великому масштабі. Насправді Mixhalo іноді доводиться дещо уповільнювати передачу звуку, щоб зробити її більш природною. Це не просто реальний час. Насправді це навіть швидше.

Ця надзвичайно низька затримка є результатом глибокої експертизи Mixhalo в галузі мереж та розуміння кодеків, виправлення помилок та інтерполяції, що робить можливою передачу аудіо з такими швидкісними викривленнями часу. Обслуговувати тисячі одночасних користувачів у режимі реального часу важко, а зробити це добре — ще важче. Mixhalo робить і те, і інше. Коли ми працюємо разом, щоб застосувати це до голосового перекладу, все стає справді захоплюючим, і дуже швидко.

Як наднизька затримка виводить Voice-переклад на новий рівень

Mixhalo спирається на перевагу в швидкості, якою DeepL вже користується у голосовому перекладі. Ця перевага походить від чудового розуміння контексту, яке дозволяє починати переклад, не чекаючи на завершення речення. Подальші вдосконалення в нашій системі інференції та потоку голосового перекладу наближають DeepL Voice ще ближче до режиму реального часу. Додайте до цього покращену завдяки Mixhalo швидкість, з якою голосові переклади доходять до аудиторії, і досвід стає справді безперервним. 

А що можна зробити з додатковими перевагами швидкості, які надає наднизька затримка? У спорті є приказка, що найкращі гравці завжди здаються такими, що мають більше часу. Те саме стосується сфери голосового перекладу. 

Економія часу в 500 мілісекунд у швидкості, з якою голосовий переклад досягає аудиторії, дає нам час на обробку, щоб зробити більше з тим, як цей переклад сприймається. Ми можемо додати персоналізацію та клонування голосу, нюанси інтонації та емоцій. Коротше кажучи, це дає нам час зробити цей голосовий переклад більш точним відтворенням людини, яка говорить. Разом із Mixhalo ми маємо більше часу, щоб створити найкращий досвід голосового перекладу.

Допомога технологічним компаніям у прискоренні розробки за допомогою DeepL Voice

Цього достатньо, щоб ми з радістю вітали Mixhalo у DeepL. Однак ми не менш раді тому, що це означає для того, як ми будемо пропонувати наші рішення більшій кількості клієнтів по всьому світу.

По-перше, приєднання Mixhalo до платформи DeepL означає, що DeepL відкриває свій перший офіс у Сан-Франциско та значно розширює свою присутність на ринку США. 

Але що ще важливіше, це партнерство, спільна цінність якого вже була доведена на ринку. Mixhalo Translate використовує DeepL Voice API для перекладу в режимі реального часу основних міжнародних конференцій та виступів. Разом ми створили пілотні проекти, які допомагають впроваджувати голосовий переклад у режимі реального часу в центри підтримки клієнтів через такі платформи, як Amazon Connect. А інженери Mixhalo використовують свої знання та досвід, щоб допомогти клієнтам швидше створювати рішення з DeepL Voice API, прискорюючи впровадження в самому серці американської технологічної індустрії.

Наш план розвитку Voice став ще швидшим

Приєднання команди Mixhalo та її технологій до DeepL є революційним у багатьох аспектах. Завдяки багатоканальній передачі аудіо без використання апаратного забезпечення ми можемо забезпечити наступне покоління аудіопослуг у реальному часі на міжнародному рівні. Ми прискоримо реалізацію нашої дорожньої карти продуктів, щоб скористатися цією можливістю, перетворивши DeepL Voice на повністю інтегрований рівень комунікації в режимі реального часу для зустрічей, семінарів, підтримки клієнтів та корпоративних робочих процесів. 

Цей захоплюючий рік для Voice став ще кращим. Ми з нетерпінням чекаємо, щоб показати вам, що ми створимо разом.

Спробуйте DeepL Voice вже зараз!

Share