Android 版 Gemini、音声ファイルをアップロードして Live で話す機能を準備中か

当サイトは Google Adsense、Amazon アソシエイト等 アフィリエイト広告を利用して収益を得ています.
Gemini アプリのプロンプト入力フィールドの写真

Android 版の Gemini アプリが、将来的に音声ファイル (MP3 など) を添付して、その内容について Gemini とライブで対話できるようになる可能性が報告されました。

これは Android Authority が Google アプリのベータ版 (v16.30.59.sa.arm64) の APK 解析によって発見したもので、まだ開発中の機能ですが、実際に提供されれば Gemini の活用法がさらに広がるかもしれません。

目次

Gemini アプリで音声ファイルの添付が可能に?

今回、Google アプリの最新ベータ版から、Gemini とのチャットに音声ファイルを添付する機能が開発されていることが発見されました。この機能が有効になると、ユーザーは MP3 などの音声ファイルをアップロードできるようになります。ファイルをアップロードすると、「これについて Live で話す」 という提案プロンプトが表示されるようになります。

ただし、この機能はまだ完全には動作していないようです。現状では、音声ファイルをアップロードしたあと、テキストで質問を入力するか 「これについて Live で話す」 を選択しても、Gemini はファイルの内容を正確に理解して応答することができないとしています。場合によっては音声ファイルを完全に無視したり、あるいはもっともらしい作り話を応答したりすることもあるようです。

API ではすでに音声入力をサポート済み

開発者向けの Gemini API はすでに音声入力をサポートしており、MP3、WAV、FLAC などの形式の音声ファイルに対して、内容の説明、要約、文字起こしなどを実行できます。

今回発見された機能は、この API の能力を Android アプリに統合するための準備段階であると考えられます。Gemini アプリではすでに画像や PDF の内容について「これについて Live で話す」機能が提供されていることを考えれば、音声ファイルのサポートも自然な流れと言えます。

まとめ

Android 版 Gemini アプリに音声ファイル添付機能が追加される可能性が示唆されましたが、まだ開発の初期段階です。正式なリリース時期は不明ですが、実現すれば Gemini の利用シーンがさらに拡大することが期待されます。

出典: Android Authority

この記事をシェア

著者情報

Masahide Omuraのアバター Masahide Omura Technical Writer

月間平均130万PVの当サイトを8年以上運営している 尾村 真英 です。これまでに 50台以上の Chromebook をレビュー しており、主に小規模事業者を対象に Chromebook や Google Workspace の導入・活用支援も行っています。
現在は、Chrome Enterprise 公式ユーザーコミュニティのモデレーターとしても活動中で、Professional ChromeOS Administrator 資格を保有しています。

\Google ニュースで配信中!/

Google ニュース リンクバナー

目次