Google、最新 AI モデル「Gemini 2.5」シリーズを発表。Deep Think やネイティブ音声出力など新機能多数

当サイトは Google Adsense、Amazon アソシエイト等 アフィリエイト広告を利用して収益を得ています.

Google は 2025 年 5 月 20 日(米国時間)に開催された Google I/O 2025にて、これまでで最も高性能な AI モデルである Gemini 2.5 Pro と、速度と効率性に優れた Gemini 2.5 Flash のアップデートを発表しました。

今回のアップデートでは、Gemini 2.5 Pro 向けの実験的な強化推論モード「Deep Think」や、より自然な会話体験を実現するネイティブ音声出力など、多くの新機能が追加されています。

目次

Gemini 2.5 Pro:パフォーマンスのさらなる向上と新機能

Gemini 2.5 Pro は、特にコーディングにおいて高い評価を得ており、WebDev Arena および LMArena の両リーダーボードで現在世界トップのモデルとなっています。また、学習支援の分野でも最高レベルの性能を発揮していることが示されています。

主なアップデート内容

  • Deep Think: 非常に複雑な数学やコーディングの問題に対応するために設計された、実験的な強化推論モードです。応答前に複数の仮説を検討することで、より高度な思考を可能にします。現在、最も難しい数学ベンチマークの一つである 2025 USAMO や、競技レベルのコーディングベンチマーク LiveCodeBench で優れたスコアを記録しています
  • ネイティブ音声出力: より自然で表現力豊かな会話体験を可能にします。ユーザーは話し方、アクセント、スタイルの指示を出すことができ、例えば物語を語る際にドラマチックな声にするようモデルに指示できます
  • Project Mariner によるコンピューター利用: Gemini API や Vertex AI を通じて、コンピューター操作の自動化機能を提供開始します
  • セキュリティの強化: 間接プロンプトインジェクションのようなセキュリティ脅威に対する保護が大幅に強化され、これまでで最も安全性の高いモデルファミリーとなっています

Gemini 2.5 Flash:速度と効率性をさらに追求

Gemini 2.5 Flash は、速度と低コストを重視して設計されたモデルです。今回のアップデートで、推論、マルチモーダル、コード、長文コンテキストといった主要なベンチマーク全体で性能が向上し、さらに効率化も進み、トークン使用量が 20〜30% 削減されたと報告されています。

Gemini 2.5 Flash は現在、Gemini アプリを通じて誰でも利用可能となっており、2025 年 6 月上旬には Google AI Studio (開発者向け) および Vertex AI (企業向け) で一般提供が開始される予定です。

Gemini 2.5 シリーズ共通の新機能と強化

ネイティブ音声出力と Live API の改善

Live API にネイティブ音声出力による対話機能のプレビュー版が導入され、開発者はより自然で表現力豊かな会話体験を構築できるようになります。また、初期段階の実験的機能として、ユーザーの声の感情を検知して応答する「Affective Dialogue(感情認識対話)」や、バックグラウンドノイズを無視してスムーズな会話を実現する「Proactive Audio(プロアクティブ音声)」なども試用可能です。

セキュリティの向上

  • 間接プロンプトインジェクション攻撃に対する保護率を大幅に向上させるなど、セキュリティ対策が強化されています。

開発者体験の強化

  • 思考サマリー: モデルの思考プロセスをヘッダー、主要な詳細、アクションに関する情報とともに明確な形式で整理し、開発者がモデルの動作を理解しやすく、デバッグを容易にします。
  • 思考バジェット: 開発者がレイテンシと品質のバランスを取りながらコストを管理できるよう、モデルが応答前に思考に使用するトークン数を制御できる機能です。Gemini 2.5 Flash に続き、2.5 Pro にも拡張されます。
  • MCP (Model Context Protocol) のサポート: オープンソースツールとの連携を容易にするため、Gemini API に MCP 定義のネイティブ SDK サポートが追加されます。

Google は今後もユーザーからのフィードバックを元に、モデルの改善と安全かつ責任ある開発を続けるとしています。

まとめ

今回発表された、新しい Gemini 2.5 シリーズは次のようなリリーススケジュールとなっています。

  • Gemini 2.5 Flash: 現在 Gemini アプリでプレビュー版を提供中。2025年 6月上旬に Google AI Studio および Vertex AI で一般提供開始予定。
  • Gemini 2.5 Pro: まもなく一般提供開始予定。
  • Deep Think (Gemini 2.5 Pro 向け): Gemini API を通じてテスター向けに提供し、フィードバックを収集予定。

今回の Gemini 2.5 シリーズのアップデートは、AI の能力をさらに押し上げ、開発者やユーザーに新たな可能性を提供するものです。特に「Deep Think」のような先進的かつ高度な機能は、複雑な問題解決への応用が期待されます。

とはいえ、いちユーザーの立場からすると便利になることは歓迎すべきことですが、 AI の進化が早すぎて、現状では次々に新しいモデルや AI サービスが登場してくるので、情報に追いつくだけでも大変です。

出典: Google The Keyword

この記事をシェア

著者情報

Masahide Omuraのアバター Masahide Omura Technical Writer

月間平均130万PVの当サイトを8年以上運営している 尾村 真英 です。これまでに 50台以上の Chromebook をレビュー しており、主に小規模事業者を対象に Chromebook や Google Workspace の導入・活用支援も行っています。
現在は、Chrome Enterprise 公式ユーザーコミュニティのモデレーターとしても活動中で、Professional ChromeOS Administrator 資格を保有しています。

目次