Google は、Gemini アプリが新たに音声ファイルのアップロードに対応したことを発表しました。
この機能は Android、iOS、Web 版で利用でき、音声ファイルの文字起こしや要約などに活用できますが、無料プランと有料プランでは、利用できる音声の長さに違いがあります。
Gemini アプリで音声ファイルのアップロードが可能に
Google によると、音声ファイルのアップロードはユーザーから最も要望が多かった機能の一つであり、今回の対応で利便性が大きく向上します。
利用方法とファイル形式
モバイルアプリでは [+] メニューから [ファイル] を、Web 版では [ファイルをアップロード] を選択することで、音声ファイルをアップロードできます。対応しているファイル形式は MP3、M4A、WAV などです。

利用時間の上限
アップロードできる音声ファイルの長さは、無料ユーザーの場合は最大 10 分です。一方、有料の Google AI Pro または Google AI Ultra プランのユーザーは、最大 3 時間までの音声ファイルに対応します。
動画やその他のファイルアップロード制限
Gemini は音声ファイルのほか、動画やその他のファイル形式のアップロードにも対応しています。それぞれの制限は以下の通りです。
- 動画: 無料ユーザーは最大 5 分、有料ユーザーは最大 1 時間(最大 2GB)。
- その他サポートファイル: 最大 100MB。
- コードフォルダ / GitHub リポジトリ: 最大 5,000 ファイル、合計 100MB まで。
- ZIP ファイル: 最大 10 ファイルまで。
形式を問わず、一度にアップロードできるファイルは合計 10 ファイルまでとなります。
まとめ
これまで動画ファイルを使った文字起こしは可能でしたが、今回のアップデートで音声ファイルに直接対応したことで、より手軽に利用できるようになりました。
インタビューの録音や会議の議事録作成、語学学習など、様々な場面での活用が期待されます。
ただし、HelenTech で試してみたところ、Android の Gemini アプリで音声ファイル(Pixel レコーダーアプリからダウンロードした m4a ファイル)のアップロードと指示はできましたが、「抽出可能なテキストが見つかりませんでした」と表示されてしまい、文字起こしができませんでした。
一方で、Web 版 Gemini を使用した場合には、日本語でも問題なく文字起こしすることができました。Android アプリの対応は、まだ段階的な展開であるか、あるいは今後のアップデートで改善される可能性があります。
出典: 9to5Google