Google は騒がしい場所や聴覚障害のあるユーザーも Gemini Live を活用しやすいように、リアルタイムで字幕(自動文字起こし)を生成するための新しいボタンを導入する可能性が報告されました。
現在、Gemini アプリで利用できる Gemini Live は、会話の終了後に会話の記録だけが表示されます。しかし、Android Authority が Google アプリのベータ版 v16.6.23 で発見した新機能では、Google が Gemini Live の応答をリアルタイムで文字起こしをして字幕を表示できるように取り組んでいることがわかりました。
以下は、実際に機能を有効にできたとして共有されたスクリーンショットです。

Gemini Live の画面の右上に、お馴染みの字幕を表示するためのボタンが追加されています。字幕を有効にすると、Gemini Live の応答が画面の中央に表示されます。
また、このリアルタイム字幕をカスタマイズするオプションも Gemini アプリの設定に導入されることも確認されています。このオプションでは、文字のサイズとスタイルを変更することができます。

現時点ではベータ版でも機能していませんが、意図したとおりに機能しているようで、リリースの準備が整っている可能性は高いようです。今後のアップデートで展開される可能性はありますが、いつリリースされるかはまだわかりません。