Google は、Android と iOS の Gemini アプリにおいて、音声で対話する「Gemini Live」に字幕(キャプション)を表示する機能の展開を広く開始しました。
このアップデートにより、音声でプロンプトを入力し、Gemini からの応答をテキストで読むことが可能になります。
Gemini Live の字幕機能について
この新機能は、今月初めから一部のユーザーに先行して表示されていましたが、今回、より多くのユーザーが利用できるようになりました。
Gemini Live を起動すると、画面の右上隅に新しく長方形の字幕(キャプション)ボタンが表示されます。このボタンをタップすると、Gemini の応答を文字起こしするフローティングボックスが現れます。


現在、ユーザー自身の発言はリアルタイムで字幕表示されず、Gemini からの応答のみを字幕で表示しますが、会話終了後の完全な文字起こしで確認することは引き続き可能です。
字幕の表示はオーディオのみのモードでは画面の中央付近に、動画機能を有効にしている場合は画面上部に表示されます。このボックスは 3 行のテキストで構成され、現時点では位置の移動やサイズ変更はできません。
一度有効にすると、その設定は次回以降のライブ会話でも維持されます。Live の UI を一旦終了すると字幕は非表示になりますが、会話の途中で戻れば再び表示される仕様です。
Android の場合、Gemini の設定メニュー内にある「Gemini Live 応答を中断する」トグルスイッチの下に「字幕を設定」という新しい項目が追加されており、ここからシステムの「字幕の設定」にアクセスできます。


この機能の最大の利点は、ヘッドフォンがない状況や静かな環境でも、音声でプロンプトを伝え、応答はテキストで読むことができる点です。これまで、デバイスの音量が低すぎるとライブ会話を開始できませんでしたが、このアップデートによってその制限がなくなりました。
まとめ
この字幕機能は、Android 向けの Google アプリ安定版 (バージョン 16.23) とベータ版のユーザーに広く展開されています。また、iOS 向けにも同日のリリースで提供が開始されています。もし機能が表示されない場合は、スマートフォンの設定からアプリ情報を開き、Google アプリを一度強制停止してから再度起動すると、機能が利用可能になる場合があります。
今回の Gemini Live への字幕機能の追加は、公共の場所やオフィス、図書館といった静かな環境で Gemini を利用したいユーザーにとって、利便性の向上が期待できます。また、聴覚に障がいのあるユーザーのアクセシビリティを高めるという点でも良い改善となるはずです。
出典: 9to5Google