Gemini アプリ、音声ファイルのアップロードに対応。文字起こしなどに活用可能

当サイトは Google Adsense、Amazon アソシエイト等 アフィリエイト広告を利用して収益を得ています.

Google は、Gemini アプリが新たに音声ファイルのアップロードに対応したことを発表しました。

この機能は Android、iOS、Web 版で利用でき、音声ファイルの文字起こしや要約などに活用できますが、無料プランと有料プランでは、利用できる音声の長さに違いがあります。

目次

Gemini アプリで音声ファイルのアップロードが可能に

Google によると、音声ファイルのアップロードはユーザーから最も要望が多かった機能の一つであり、今回の対応で利便性が大きく向上します。

利用方法とファイル形式

モバイルアプリでは [+] メニューから [ファイル] を、Web 版では [ファイルをアップロード] を選択することで、音声ファイルをアップロードできます。対応しているファイル形式は MP3、M4A、WAV などです。

利用時間の上限

アップロードできる音声ファイルの長さは、無料ユーザーの場合は最大 10 分です。一方、有料の Google AI Pro または Google AI Ultra プランのユーザーは、最大 3 時間までの音声ファイルに対応します。

動画やその他のファイルアップロード制限

Gemini は音声ファイルのほか、動画やその他のファイル形式のアップロードにも対応しています。それぞれの制限は以下の通りです。

  • 動画: 無料ユーザーは最大 5 分、有料ユーザーは最大 1 時間(最大 2GB)。
  • その他サポートファイル: 最大 100MB。
  • コードフォルダ / GitHub リポジトリ: 最大 5,000 ファイル、合計 100MB まで。
  • ZIP ファイル: 最大 10 ファイルまで。

形式を問わず、一度にアップロードできるファイルは合計 10 ファイルまでとなります。

まとめ

これまで動画ファイルを使った文字起こしは可能でしたが、今回のアップデートで音声ファイルに直接対応したことで、より手軽に利用できるようになりました。

インタビューの録音や会議の議事録作成、語学学習など、様々な場面での活用が期待されます。

ただし、HelenTech で試してみたところ、Android の Gemini アプリで音声ファイル(Pixel レコーダーアプリからダウンロードした m4a ファイル)のアップロードと指示はできましたが、「抽出可能なテキストが見つかりませんでした」と表示されてしまい、文字起こしができませんでした。

一方で、Web 版 Gemini を使用した場合には、日本語でも問題なく文字起こしすることができました。Android アプリの対応は、まだ段階的な展開であるか、あるいは今後のアップデートで改善される可能性があります。

出典: 9to5Google

この記事をシェア

著者情報

HelenTech の運営をしている 尾村 真英 です。これまでに 50台以上の Chromebook をレビュー しており、主に小規模事業者を対象に Chromebook や Google Workspace の導入・活用支援も行っています。
現在は、Chrome Enterprise 公式ユーザーコミュニティのモデレーターとしても活動中で、Professional ChromeOS Administrator 資格を保有しています。

HelenTech の最新情報を見逃さない

Google News をフォローすると、最新のニュースやレビューがあなたのフィードに直接届きます。

Google ニュース リンクバナー
目次