Android 版の Gemini アプリが、将来的に音声ファイル (MP3 など) を添付して、その内容について Gemini とライブで対話できるようになる可能性が報告されました。
これは Android Authority が Google アプリのベータ版 (v16.30.59.sa.arm64) の APK 解析によって発見したもので、まだ開発中の機能ですが、実際に提供されれば Gemini の活用法がさらに広がるかもしれません。
Gemini アプリで音声ファイルの添付が可能に?
今回、Google アプリの最新ベータ版から、Gemini とのチャットに音声ファイルを添付する機能が開発されていることが発見されました。この機能が有効になると、ユーザーは MP3 などの音声ファイルをアップロードできるようになります。ファイルをアップロードすると、「これについて Live で話す」 という提案プロンプトが表示されるようになります。

ただし、この機能はまだ完全には動作していないようです。現状では、音声ファイルをアップロードしたあと、テキストで質問を入力するか 「これについて Live で話す」 を選択しても、Gemini はファイルの内容を正確に理解して応答することができないとしています。場合によっては音声ファイルを完全に無視したり、あるいはもっともらしい作り話を応答したりすることもあるようです。
API ではすでに音声入力をサポート済み
開発者向けの Gemini API はすでに音声入力をサポートしており、MP3、WAV、FLAC などの形式の音声ファイルに対して、内容の説明、要約、文字起こしなどを実行できます。
今回発見された機能は、この API の能力を Android アプリに統合するための準備段階であると考えられます。Gemini アプリではすでに画像や PDF の内容について「これについて Live で話す」機能が提供されていることを考えれば、音声ファイルのサポートも自然な流れと言えます。
まとめ
Android 版 Gemini アプリに音声ファイル添付機能が追加される可能性が示唆されましたが、まだ開発の初期段階です。正式なリリース時期は不明ですが、実現すれば Gemini の利用シーンがさらに拡大することが期待されます。