Google は Android 版 Gemini アプリにおいて、ユーザーの声のトーンや感情を読み取り、応答を変化させる「Gemini Live」の新しい音声出力機能を有料プラン「Google AI Pro」のユーザー向けに広く展開し始めたことが報じられました。
これにより、機械的な応答ではなく、より人間同士の会話に近い、自然なコミュニケーションが可能になります。
Gemini Liveの新機能:声から感情を読み取る、より自然な対話
今回のアップデートで中心となるのは、Google が開発した新しい AI モデル(Gemini 2.5 Flash Live API のネイティブオーディオと推測される技術)による音声出力の向上です。
ユーザーの話し方を考慮した応答
Gemini Live は、ユーザーが話す際の抑揚、リズム、高さといった要素を解析します。これにより、単に言葉の意味を理解するだけでなく、その裏にある感情や状況を推察できるようになります。
例えば、ユーザーがストレスを感じているような話し方をした場合、AI はそれを察知し、より穏やかで落ち着いた声で応答するなど、状況に応じたコミュニケーションを行います。
AIの話し方をカスタマイズ
ユーザー側から Gemini の話し方を制御することも可能です。以下のような設定を会話の途中で変更できます。
- アクセントの変更: イギリス英語やオーストラリア英語など、特定のアクセントで話すように指示できます。
- 速度の調整: 応答の速度を速めたり、逆に遅くしたりして、聞き取りやすさを調整できます。
これらの設定は現在の会話中のみ有効で、新しい会話を始めると標準設定に戻ります。
この新しい音声出力機能は、まず有料プランの Android ユーザーから展開されており、iOS での対応は現時点では確認されていません。
なお、筆者も試してみましたが、速度やアクセントを変更することはできないと言われてしまったので、展開は英語ユーザーなど一部の言語や地域に限られている可能性が高いです。

その他のアップデート情報
音声機能の強化に加え、Gemini アプリには以下の機能改善やデザイン変更も行われています。
ビジュアルガイダンス機能が無料ユーザーにも拡大
カメラで写した現実世界の物体をハイライトし、視覚的に指示を出すことができる「ビジュアルガイダンス機能」が、Android の無料アカウントでも利用可能になりました。Pixel 10 シリーズで初搭載されたこの機能は、「これを見せて」「どこにある?」といったコマンドで起動し、AI との対話をより直感的にします。ただし、こちらもまだ確認することはできませんでした。
アカウントメニューのデザイン刷新
Android と iOS の両方で、Google アカウントのメニュー画面が全画面表示の新デザインに変更されました。これにより、設定項目へのアクセス方法が一部変更されています。

出典: 9to5Google