Google は 2026 年 6 月 24 日(現地時間)、Gemini 3.5 Flash に computer use 機能をビルトインツールとして統合したことを発表しました。
これまで独立したモデルとして提供されていた「Gemini 2.5 Computer Use」の機能が、メインの Flash モデルに移行されています。
現在、Gemini API および Gemini Enterprise Agent Platform から利用できます。
Gemini 2.5 の単体モデルから統合へ
Gemini はすでに検索やマップのグラウンディングをビルトインツールとして備えており、今回 computer use も統合されました。
これにより、Gemini 3.5 Flash はブラウザ、モバイル、デスクトップの各環境で、画面の認識から判断、操作までを一貫して処理できるようになります。
Google はソフトウェアの継続テストや、複数の業務アプリケーションを横断したナレッジワークなど、複数ステップを要する長期タスクへの活用を想定しており、エンタープライズ用途での自動化への応用を見込んでいます。


セキュリティへの対応
エージェントが実際の環境で動作する性質上、外部からプロンプトを注入される「プロンプトインジェクション」への対策が課題となります。
Google は Gemini 3.5 Flash の computer use に対して敵対的学習(adversarial training)を適用したうえで、エンタープライズ向けの任意の保護機能を 2 つ提供しています。
- 機密性の高い操作や取り消しのできない操作の前にユーザーの明示的な確認を要求
- 間接的なプロンプトインジェクションを検知した場合にタスクを自動停止
Google の公式ドキュメントでは、セキュアなサンドボックス化、人間による承認ループ、厳格なアクセス制御との組み合わせを推奨しており、多層防御のアプローチを取るよう開発者に呼びかけています。








