Google は 2026 年 6 月 9 日(現地時間)、リアルタイムの音声対音声翻訳に特化した新しいオーディオモデル「Gemini 3.5 Live Translate」を発表しました。
現在、Android および iOS の Google 翻訳アプリへの展開が始まっており、Google Meet への導入も予定されています。
Gemini 3.5 Live Translate とは
Gemini 3.5 Live Translate は、70 以上の言語を自動検出し、話し手のイントネーション・テンポ・声のピッチを維持したまま翻訳音声を生成するオーディオモデルです。
話し手の発話が終わるまで待ってから翻訳するターン制の方式とは異なり、発話と並行して継続的に翻訳音声を出力するため、数秒程度の遅れを保ちながら途切れのない自然な音声になります。
騒がしい環境でも安定して動作するノイズ耐性も備えており、空港やイベント会場など音が混在する場面での利用も想定されています。
Google 翻訳アプリへの展開と新機能「listening mode」
Google 翻訳アプリでは、イヤホンまたはヘッドホンを装着した状態で利用できる「ライブ翻訳」機能が、Gemini 3.5 Live Translate にアップグレードされます。
また、Android 版では、イヤホンがない状況でもスマートフォンを通常の電話と同じように耳に当てることで、翻訳音声を聞くことのできる新しい「listening mode(リスニングモード)」が導入されます。


これにより、周囲に翻訳内容を聞かれたくない場面や、イヤホンがない場面でも翻訳された音声を聞くことができます。
Google Meet への導入と対応状況
Google Meet の音声翻訳機能についても、Gemini 3.5 Live Translate へアップグレードされます。
従来の音声翻訳は対応言語が 5 言語に限られており、翻訳の組み合わせは英語を起点とするものだけでしたが、今回のアップグレードにより、対応言語が 70 以上に拡大し、1 回の会議内で 2,000 以上の言語の組み合わせが利用できるようになります。
また、Web 版 Google Meet では、音声翻訳をすぐに開始できる新しいボタンがコントロール行に追加されます。
Google Meet 上における Gemini 3.5 Live Translate の展開は段階的に行われており、今月から一部の Google Workspace アカウントでプレビューが開始され、今年後半の一般提供が予定されています。
開発者向けには、Gemini Live API および Google AI Studio でのパブリックプレビューがすでに利用可能です。
SynthID による透明性の確保
Gemini 3.5 Live Translate が生成するすべての音声には、AI 生成コンテンツであることを示す電子透かし「SynthID」が埋め込まれます。
これは Gemini や Nano Banana、Lyria など、Google が提供するサービスで AI が生成した画像・動画・音声などに含まれています。
- 関連記事:








