SyncWordsとDeepLが協働しライブストリーミングで言語の壁を乗り越えた経緯

ライブストリーミング向け字幕技術のリーダー的企業と、ニュアンスを汲んだAI翻訳の先進企業が提携すると、どのような相乗効果が生まれるでしょうか。SyncWordsとDeepLが動画の多言語化をどのように変革し、8秒あった字幕の遅延をほぼゼロに短縮できたか。さらに、SyncWordsの顧客がなぜDeepLを提携相手として推奨したか、詳細をお読みください。

ラップトップの画面を見ながら協働する二人の人物

要約

  • SyncWordsはDeepLの導入によって高品質のリアルタイム字幕翻訳を実現し、ライブストリーミングで字幕の遅延を8秒からほぼゼロに短縮

  • SyncWordsの顧客は、主にヨーロッパ言語の翻訳精度の高さを理由にDeepLをSyncWordsに推奨

  • クラウドベースのソリューションはトラフィックの急増にも動的に対応でき、数百万時間にわたる動画を100以上の言語に翻訳

  • SyncWordsの顧客はDeepLを連携させたソリューションの利用によって、視聴者のエンゲージメントの4倍向上とグローバルリーチの改善を実現

業界
インターネットソフトウェア・サービス, メディア・エンターテインメント
DeepLのプロダクト
DeepL API
主な市場
ヨーロッパ, 北米, 南米, アジア, グローバル
主な言語
ヨーロッパ言語, 北欧言語

DeepLとSyncWordsの出会い

全豪オープンのような世界的なイベントを観賞したり、ニュース速報をリアルタイムの字幕付きで視聴したりする際、私たちがその背後にあるテクノロジーを意識することはあまりありません。しかし、世界中の何百万人もの視聴者にとって、シームレスな字幕翻訳は言語の壁を取り払う重要な存在です。そして現在、この分野で効果的なソリューションを提供しているのがSyncWordsです。

米国を拠点とし、ライブストリーミングとオンデマンド配信向けの字幕とその翻訳、およびAI音声翻訳でリードするSyncWordsは、世界最大規模のイベント、ウェビナー、産業用動画など、数百万時間に上るコンテンツの配信を100以上の言語でサポートしています。

近年、高品質の多言語化を求める傾向がヨーロッパの顧客を中心に強まり、同社はスピード、精度、拡張性に優れた翻訳ソリューションが必要になりました。そのような中で、SyncWordsにDeepLとの協働を勧めたのは同社の顧客でした。

「当社の顧客は、より質の高い翻訳を必要としていました。特にヨーロッパ言語の需要が高く、それに応える必要があったため、ライブ配信のワークフローにDeepLを導入しました。実は、DeepLを要望したのは顧客でした」

SyncWords 事業開発戦略部門の副部長 Giovanni Galvez氏

SyncWordsの課題:動画の多言語化を品質を損なわずに拡張するには

SyncWordsの使命は翻訳を自動化することだけでなく、世界中の視聴者にネイティブスピーカーと同じ視聴体験をシームレスに提供することです。

しかし、ニュース速報、スポーツの国際大会、企業のウェビナーなど様々なライブイベントで常に質の高い字幕翻訳を実現することは大きな課題となっていました。

スピード

従来の字幕システムでは、翻訳された字幕が表示されるまでに4~8秒の遅れがあっため、リアルタイム動画で集中力を保つのは困難でした。この状況を克服するために、SyncWordsはライブ映像のスピードに対応できるAI翻訳が必要でした。

正確性と文脈の把握

AI翻訳ツールは、業界用語、話し手の語調やコンテンツの文脈を適切に反映できないことが多々ありました。

多様なイベントや業界への対応

SyncWordsはニュース、スポーツ、メディア、エンターテインメント、企業イベントなどを対象に、大規模な字幕表示と翻訳を行っています。膨大な量の翻訳に迅速に対応するには、精度を損なうことなく翻訳プロセスをシームレスに自動化する必要がありました。

DeepL/Interpreter
言語の動的なスケーリング

SyncWordsのプラットフォームは、わずか数秒で数言語から数十言語まで動的に言語を追加できます。その結果、様々なライブストリーミングや配信を世界中の多様な視聴者に即座に届けられます。

パーソナライズされた翻訳:語調と意図の反映

字幕翻訳と音声翻訳は自然でなければなりません。SyncWordsは元の話し手の口調やスピード、ニュアンスを保持できるソリューションを開発しました。

ストリーミングのプラットフォームとプロトコルとの互換性

AIエンジンは、RTMP、SRT、HLS、CMAFインジェストなどのライブ映像ストリーミングのフォーマットに即座に対応できるわけではありません。SyncWordsは、最新のストリーミング技術を使ったストリーミングシステムを確立するとともに、AI技術をプラグ・アンド・プレイで使えるようにしました。

DeepLがもたらした違い

  • 顧客が推奨するAI翻訳

DeepL翻訳を連携させる前に、SyncWordsは複数のAI翻訳ツールをテストし、言語的なニュアンス、専門用語の扱い、文脈の違いを踏まえた翻訳能力を評価しました。質の高い多言語サポート、特にヨーロッパ言語に対する需要の高まりを受け、様々な分野のコンテンツを流暢に翻訳でき、文章構造の処理に優れ、用語管理機能を備えたソリューションが必要となりました。

DeepLの連携は、SyncWordsの顧客にとっても嬉しいニュースとなりました。連携を通してDeepLの最新イノベーションにアクセスし、自分たちの動画で即座に字幕翻訳の効果を確認できるようになったからです。

  • 遅延のないリアルタイムの字幕表示と翻訳

ライブストリーミングの場合、字幕が少しでも遅れると没入感が損なわれてしまいます。AIによって業務フローを強化するまで、SyncWordsの字幕は遅延が多く、視聴者にとってフラストレーションの溜まるものでした。

「ライブ配信中、字幕が映像や音声から4~8秒遅れることが多く、スペルミスがあったり、単語や文の一部が完全に欠落したりすることがありました。このような問題は、ユーザー体験にマイナスに影響します」

SyncWordsとAWS Elemental Media Services​に関するAWSブログ記事

SyncWordsはこの課題に正面から取り組み、AI搭載のライブストリーミングプラットフォームの調整を重ね遅れを最小限に抑制。視聴者にシームレスな体験を提供できる水準まで性能を向上させました。DeepLの高速なAPIは瞬時に動作するため、ライブ翻訳はスピーディーな会話にも遅れることなく対応できました。

  • 視聴者の心に届くパーソナライゼーション

映像のローカライゼーションは単なる翻訳ではなく、文脈や話し手の意図を的確に反映する必要があることをSyncWordsは理解しています。そのため、DeepLの用語集を積極的に活用し、企業のウェビナー、法律分野、ITセクターなど分野ごとに翻訳の正確性と一貫性を確保しています。

「用語集を使用することで、複雑な技術翻訳や専門性の高いコンテンツの一貫性を保てるようになったのは画期的です」

SyncWords 事業開発戦略部門副部長 Giovanni Galvez氏

SyncWordsはAIを活用した音声翻訳の語調の調整でも先駆者的存在です。吹き替え映像では、元の話し手の口調、感情、話し方を維持することで元の言語と変わらない視聴体験を追求しています。さらに、同社のプラットフォームは複数の話し手が存在するグループの会話でも優れた成果を達成しています。これは、ライブニュースやスポーツ中継のAI翻訳が今後目指すべき方向だと同社は考えています。

  • 簡単でシームレスなAPIの連携

SyncWordsはコンテナオーケストレーションにKubernetesを活用することで、個々のライブ映像の字幕とその翻訳のインスタンスを需要に応じて動的に拡張できます。この設定により、同社のシステムでは次のことが可能です。

  1. テニスのグランドスラムやオリンピック、選挙討論、ニュース速報などによるトラフィックの急増時にリソースを動的にスケール
  2. KubernetesのポッドでDeepLのAPIを実行し、レイテンシーが非常に低いリアルタイム翻訳の負荷を分散
  3. 必要なときにのみリソースを起動できるため、コストがかかるオンプレミスのインフラストラクチャーを維持する必要がなくなり、コスト効率を最適化
  4. ライブストリーミングの業務フローをソースに忠実に保ちながら、世界各地でリアルタイムの字幕表示と翻訳をデプロイ
  5. デュアルビデオパイプラインによる冗長化とグローバルリージョン内の回復性を必要とする、ライブストリーミングの既存業務フローに統合

「ライブストリーミングは需要が大きく変動するため、スケーリングが非常に重要です。Kubernetesを活用することで、ライブストリーミングがまさに必要とするリソース、つまり過負荷や遅延のない、AIがもたらす即時性と正確性を確保できています。何百、何千ものライブ映像のストリーミングで即座に字幕や翻訳を表示できるようになりました」

SyncWords 事業開発戦略部門副部長 Giovanni Galvez氏

前述のとおり、SyncWordsは大規模なリアルタイム字幕表示と翻訳に対応できるマイクロサービスベースのアーキテクチャーをすでに構築しています。では何が課題だったのでしょうか?それは、同社のシステムに円滑に連携でき、需要に応じたスケーリングが可能で、需要の急増時にも正確性を損なわない翻訳APIを見つけることでした。DeepLのAPIは、特別なハードウェアや手動による設定を必要としないプラグ・アンド・プレイの機能によって高い拡張性を提供し、1日数百万時間に及ぶ映像のスムーズな配信を可能にしました。 

またDeepLのAPIをKubernetesベースの環境に完全に組み込むことで、SyncWordsは以下を実現しました。

  • 何千ものライブストリームの同時配信でもボトルネックなしでリアルタイムのAI翻訳をデプロイ
  • コンテナ化されたライブストリーミングの全てのインスタンスに対し、DeepLの翻訳モデルへのアクセスを提供し、高品質の翻訳をリアルタイムで実現
  • 高価な専用翻訳サーバーの必要性を排除し、完全にクラウドベースで自動スケーリングするモデルをデプロイ
「DeepLのAPIは当社の開発チーにとって連携が容易なものでした。これがサービスを迅速に拡張するための鍵となりました」

SyncWords 事業開発戦略部門副部長 Giovanni Galvez氏

顧客のグローバル展開をサポート

SyncWordsは単なる翻訳サービスプロバイダーではなく、国際的な成長を目指す企業にとって信頼の置ける戦略的パートナーです。

DeepLの導入によって、SyncWordsは以下を提供できるようになりました。

  • ヨーロッパの主要言語への即時アクセス:これは欧州市場への拡大に欠かせません。
  • 視聴者のエンゲージメント向上:字幕付きの動画が最後まで視聴される頻度が4倍向上しました。
  • シームレスな法令遵守:DeepLは国際的な法的要件を満たしているため、企業は世界各地で法令遵守を確保できます。
  • 収益性と配信:配信会社は世界中でライブコンテンツのライセンスを付与し収益向上につなげられます。
SyncWordsの顧客の評価ポイント

精度の高いAI翻訳とニュアンス

• 主要なストリーミングプラットフォームとAPIの容易な連携

• ライブおよびオンデマンド配信用翻訳にかかる時間の短縮

即座の拡張性

今後の展望:
AIを活用した動画ローカライゼーションの未来

動画コンテンツの重要性が増し、コンテンツの多言語化に対する需要が急増する中、SyncWordsは誰もが簡単にアクセスできる、よりパーソナライズされた多言語コミュニケーションに取り組んでいます。

  • 元の音声の口調に合わせたAI翻訳:人が行ったような自然な吹き替えを実現
  • スケーラブルな高速な業務フローの実現:1日の処理力を数百万単語まで増強
  • 新規市場へ拡大:DeepLを活用してグローバル展開を促進
  • 新しいストリーミングビデオ技術に対応:スポーツイベントの4Kライブ動画にサラウンドサウンドの字幕翻訳を付けて低遅延で配信

「DeepLを導入したことで、要件の厳しいライブイベントでも高品質の翻訳をリアルタイムで提供できます」

SyncWords 事業開発戦略部門副部長 Giovanni Galvez氏

これからはライブ映像の時代だと言われますが、それは視聴者が自分の言語で体験できる場合に限ります。SyncWordsとDeepLは共に手を組むことで、ライブ動画の多言語化を簡単かつリアルタイムで、しかも大規模に実現しています。

  • 4〜8秒字幕の遅延を削減
  • 4倍字幕付き動画のエンゲージメント向上
  • 数百万時間動画の配信時間

DeepLの高度な言語AIの活用

あらゆる言語のニーズに対応した包括的なソリューションにより、お客様のグローバルなコミュニケーションを強化できます。