Google、最新 AI モデル「Gemini 3」を正式発表。推論・マルチモーダル性能が大幅強化

当サイトは Google Adsense、Amazon アソシエイト等 アフィリエイト広告を利用して収益を得ています.
Gemini 3
Advertisement

Google が、Gemini アプリと開発者向けの Gemini API に対して、最新の AI モデル「Gemini 3」シリーズを導入しました。

Gemini 3 モデルは、応答品質、マルチモーダル理解、推論性能が大幅に強化されており、個人利用からビジネス用途、アプリ開発まで幅広い作業効率の向上が期待できます。

目次

Workspace 向け:Geminiアプリで「Gemini 3 Pro」提供開始。思考モードで利用可能

Google Workspace ユーザー向けの Gemini アプリに、最新モデル「Gemini 3 Pro」の「思考モード」が導入されました。

デスクトップ、モバイルアプリ、モバイルウェブのモデルメニューで「思考モード」を選択すると利用できます。

また、従来の「Flash」に相当するモデルは、「Fast (すぐに回答)」に置き換わり、軽量・高速モデルとして提供されます。

Web 版 Gemini における Gemini 3 のモデル選択画面。「Fast」と「思考モード(3 Pro)」を選べる
Web 版 Gemini における Gemini 3 のモデル選択画面。「Fast」と「思考モード(3 Pro)」を選べる

現在、筆者の管理する Google Workspace アカウントでは Gemini 3 Pro の「思考モード」を確認ができていますが、個人の Google アカウントではまだ確認できていません。

Gemini 3 Pro は、応答の構造化と読みやすさが改善され、画像・音声・動画をまたぐマルチモーダル推論性能も向上しています。

Google は、この Pro モデルが「世界最高レベルのマルチモーダル理解」を備えていると説明しており、複雑な情報の抽出や要約もこれまで以上に自然に行えます。

インターフェースも刷新され、モダンで整理されたデザインへと更新されました。新しいサイドバーの「作成したもの」には生成した画像や動画、レポートなどがまとまり、素早くアクセスできます。

このアップデートは、Gemini アプリが利用可能なすべての国・言語で展開されており、18 歳以上のユーザーへ最大 15 日間かけて順次提供中です。

Gemini 3 Deep Think も登場

Google は Gemini 3 Pro よりさらに高度な推論能力を持つ「Gemini 3 Deep Think」も発表しています。

複雑な問題解決に特化したモードで、Gemini 3 Pro を上回るベンチマーク結果が示されていますが、安全性評価のため、現時点では Google AI Ultra 向けの限定提供前段階となっています。

開発者向け:推論性能・コーディング・エージェント構築が大幅進化

開発者向けには、Google の最新モデル「Gemini 3」が公開されました。こちらは Workspace 向けとは異なり、Pro ではなくモデル名としての「Gemini 3」 が正式です。

コーディング能力の向上

Gemini 3 は、これまでの 2.5 Pro を大きく上回るコーディング性能を持ち、複雑なゼロショットタスクやエージェントワークフローにも対応できます。

ターミナル経由での操作能力を測る Terminal-Bench 2.0 では 54.2% を記録し、既存のプロダクションエージェントにも組み込みやすい設計になっています。

エージェント開発基盤「Google Antigravity」

Gemini 3 と連携するエージェント開発プラットフォーム「Antigravity」も公開され、エディター・ターミナル・ブラウザをモデルが自律操作する高度な開発が可能です。

Mac / Windows / Linux向けのプレビューは無料で利用できます。

Gemini APIの強化

  • bash実行を提案するクライアントサイドツール
  • セキュアなサーバーサイドbashツール
  • Google Search を用いたグラウンディング
  • URLコンテキスト + 構造化出力の統合

これらにより、外部データ取得から整形、出力までの一連の処理を AI エージェントに委ねやすくなりました。

自然言語でアプリ開発「Vibe Coding」

Gemini 3 の推論力向上により、自然言語だけでアプリ構築を行う「Vibe Coding」が実用性をさらに増しています。

WebDev Arena では 1487 Elo を記録しており、フロントエンド開発の速度向上が期待されます。

マルチモーダル理解・動画推論の進化

Gemini 3 は、MMMU-Pro(画像推論)や Video MMMU(動画理解)で新記録を達成し、複雑な視覚的タスクに強くなっています。

OS画面の読み取り能力も向上しており、コンピューター操作エージェントの性能も伸びています。

動画推論では、高フレームレートの動作や長時間映像のストーリー化も可能になりました。OpusClip によれば、ツール呼び出し速度は従来より 32% 以上向上しています。

料金と提供プラットフォーム

Google AI Studio では無料利用枠(レート制限あり)が提供され、Gemini API は AI Studio と Vertex AI 経由で利用できます。

以下は 20 万トークン以下のプロンプト時の Gemini API の料金です。

  • 入力トークン:$2 / 100 万トークン
  • 出力トークン:$12 / 100 万トークン

Cursor・Android Studio・JetBrains など多くの開発ツールにも統合済みです。

APIパラメータの更新

  • thinking level
  • media resolution
  • thought signatures の厳格化

これにより、長文脈や高精細処理を必要とするアプリの設計がより柔軟に行えるようになっています。

まとめ

今回のアップデートにより、大幅にパフォーマンスを高めた「Gemini 3」シリーズが提供開始となりました。

Google の最新の研究成果が盛り込まれており、文章作成からエージェント開発、動画解析まで幅広いユースケースで能力が向上しています。

特に開発者領域では、Antigravity や Vibe Coding、構造化出力との統合など、実務レベルの開発効率を高めるアップデートが目立ちます。

Workspace では日常の質問・要約がより自然に、開発者領域ではアプリ開発とエージェント構築が一段階進化したと言えます。

筆者も実際に試してみましたが、従来のモデルよりも言うことをちゃんと聞くようになり、抜けも少なくなっているように感じます。

出典: Google Blog, Google Cloud Blog, Google Workspace Updates

Advertisement

Google 検索で最新記事を見つけやすく!

「優先するソース」に追加すると、検索結果や AI 検索で HelenTech が表示されやすくなります。


Google 検索 優先ソースに登録

尾村 真英
Technical Writer
HelenTech を運営している 尾村 真英 です。これまでに 50 台以上の Chromebook をレビュー しており、主に小規模事業者を対象に Chromebook や Google Workspace の導入・活用支援も行っています。
現在は、Chrome Enterprise 公式ユーザーコミュニティのモデレーターとしても活動し、Professional ChromeOS Administrator 資格を保有しています。

HelenTech の最新情報をフォロー

Google ニュース リンクバナー
目次