Google は2024年に NotebookLM で「音声概要」と呼ばれる機能を導入し、選択したドキュメントファイルなどの内容について、AI 仮想ホストがポッドキャストのように会話する音声を生成できるようになりました。今回、Google は Gemini から直接 NotebookLM の「音声概要」を利用できるようになったことを発表しました。
Gemini の「音声概要」では、アップロードされたドキュメントやスライド、Deep Research のレポートなどのファイルに基づいて、2人の AI ホストが話すポッドキャスト形式の音声メディアを生成することができます。これにより、様々なノートや論文、長いメールスレッド、Deep Research で生成されたレポートなどを自動的に要約して音声で聞くことができるようになります。
この機能が Gemini で利用可能になると、Android アプリまたは Web アプリを使用して、ドキュメントを Gemini にアップロードするとチップが表示されます。それをタップまたはクリックすることで、音声概要を生成することができます。
本日から Gemini および Gemini Advanced ユーザーにグローバルで展開されますが、まずは英語での提供となります。他の言語も近日中に提供される予定です。
これまで「音声概要」には NotebookLM または NotebookLM Plus で機能にアクセスする必要がありましたが、Gemini から直接利用可能になるので、手間なく使えるようになります。また、NotebookLM だとハードルが高かったかもしれませんが、Gemini に組み込まれたことで試しやすくなりました。