ライブ翻訳の新時代
Gemini 3.5 Live Translate は、リアルタイムの音声翻訳のための最新のオーディオモデルです。ストリーミング中に音声を継続的に処理し、コンテキストが改善されるのを待つことと、話者と同期するために即座に翻訳することのバランスを取ります。複数の言語を自動的に検出し、多言語入力を処理して、不自然な一時停止を回避します。
Live API
パブリックプレビュー
Multilingual
シームレスな処理
Robust
ノイズ処理
AI Studio
開発者アクセス
主な機能
継続的なストリーミング
音声を継続的に処理し、話者が話し終わるのを待たずに流暢な翻訳を可能にします。
ノイズの堅牢性
うるさくて予測不可能な環境でもアプリケーションが処理できるようにし、高い翻訳忠実度を維持します。
多言語入力
設定を手動で構成する必要なく、さまざまな言語の入力を処理します。
Gemini 3.5 Live Translateによる構築
Gemini Live APIを使用すると、開発者は音声翻訳アプリを簡単に構築して展開できます。複雑なリアルタイムメディアストリーミングを処理することで、プラットフォームは多言語通話、会議、レッスン、放送のユーザーエクスペリエンスの向上に集中できます。
Gemini Live API および Google AI Studio を通じてパブリック プレビューで利用可能