Google は2025 年 12 月 11 日(現地時間)、同社の AI エージェント機能である「Gemini Deep Research エージェント」を大幅にアップデートし、開発者が自身のアプリケーションに組み込むことができる「Interactions API」を通じて提供を開始したことを発表しました。
また、この強化されたエージェント機能は、近日中に Gemini アプリや Google 検索、NotebookLM などの一般ユーザー向けサービスにも提供される予定です。
さらに強力になった調査エージェント
新しい Gemini Deep Research エージェントの最大の特徴は、推論のコアに Google の最新モデルである Gemini 3 Pro を採用している点です。
Gemini 3 Pro は Google が「最も事実に基づいたモデル」と位置づけるモデルであり、このエージェントは特に複雑なタスクにおいてハルシネーション(事実ではない情報の生成)を低減し、レポートの品質を最大化するように特別なトレーニングを受けています。
さらに、検索タスクに対して「マルチステップの強化学習」を適用することで、複雑な情報環境においても迷うことなく、高い精度で自律的なナビゲーションが可能になっています。
これにより、表面的な情報のまとめだけでなく、信頼性の高い詳細な調査結果を生成できるようになりました。
ベンチマーク結果
Google が公開した新しいベンチマーク「DeepSearchQA(複雑なウェブ調査タスクの包括性をテストするもの)」において、Gemini Deep Research エージェントは 66.1% のスコアを記録しました。これはベースモデルである Gemini 3 Pro 単体の 56.6% を大きく上回る結果です。

また、難解な推論を要する「Humanity’s Last Exam (HLE)」や、情報の探索能力を測る「BrowseComp」といったベンチマークでも最高レベルの結果(SOTA)を達成しており、パフォーマンスの高さが裏付けられています。
「自律的」に計画し、修正する調査プロセス
従来の大規模言語モデル(LLM)による検索と、今回の Gemini Deep Research エージェントの決定的な違いは、「自律的なプロセス」にあるとしています。
例えば、ユーザーがプロンプトを入力すると、エージェントは以下のようなサイクルを反復して実行します。
- 調査計画の策定: 目的を達成するために必要なステップを計画
- クエリの作成と検索: 適切な検索ワードを作成し、実行
- 結果の読み込みと知識ギャップの特定: 得られた情報を読み解き、「何が足りないか」、「どこが不明確か」という知識の穴(ギャップ)を自ら特定
- 再検索と深堀り: 不足している情報を補うために、再び検索を実行。今回のアップデートでは、特定のデータを見つけるためにウェブサイトの深い階層まで潜って探索する能力が大幅に向上
このように、人間が試行錯誤しながら裏付けを取っていくようなプロセスが再現されています。
開発者が制御可能な「Interactions API」
このエージェント機能は、新たに公開された「Interactions API」を通じて開発者が利用できるようになりました。
実務向けに、次のような制御が可能になっています。
- 統合された情報合成: PDF や CSV などの独自ドキュメントと、Web 上の公開情報を組み合わせて分析させることが可能
- レポートの完全な制御(Steerability): プロンプトで指示することで、見出し構成やデータテーブルの作成など、出力形式を細かく指定可能
- 構造化出力(JSON): 下流のアプリケーションで処理しやすい JSON スキーマでの出力に対応しており、システム連携が可能
- 詳細な引用: 生成された主張の元となるソースを詳細に提示し、検証可能性を担保
まとめ
Google は Gemini Deep Research エージェントの大幅なアップグレードにより、リサーチがより効率的に実行できるようになりました。
現時点では開発者向けの提供となりますが、今後 Gemini アプリや NotebookLM でもこの機能が使えるようになることで、研究・開発に携わる学生やビジネスユーザーは恩恵を受けられることが期待されます。
出典: Google Blog


