GEMINI 3.5 LIVE TRANSLATE

Google DeepMindによる、流暢で自然な音声翻訳

ライブ翻訳の新時代

Gemini 3.5 Live Translate は、リアルタイムの音声翻訳のための最新のオーディオモデルです。ストリーミング中に音声を継続的に処理し、コンテキストが改善されるのを待つことと、話者と同期するために即座に翻訳することのバランスを取ります。複数の言語を自動的に検出し、多言語入力を処理して、不自然な一時停止を回避します。

Live API
パブリックプレビュー
Multilingual
シームレスな処理
Robust
ノイズ処理
AI Studio
開発者アクセス

主な機能

継続的なストリーミング

音声を継続的に処理し、話者が話し終わるのを待たずに流暢な翻訳を可能にします。

ノイズの堅牢性

うるさくて予測不可能な環境でもアプリケーションが処理できるようにし、高い翻訳忠実度を維持します。

多言語入力

設定を手動で構成する必要なく、さまざまな言語の入力を処理します。

Gemini 3.5 Live Translateによる構築

Gemini Live APIを使用すると、開発者は音声翻訳アプリを簡単に構築して展開できます。複雑なリアルタイムメディアストリーミングを処理することで、プラットフォームは多言語通話、会議、レッスン、放送のユーザーエクスペリエンスの向上に集中できます。

Gemini Live API および Google AI Studio を通じてパブリック プレビューで利用可能