Google は 2025 年 7 月 22 日(米国時間)、Gemini 2.5 モデルファミリーの中で最も高速かつ低コストな「Gemini 2.5 Flash-Lite」の安定版をリリースしたことを発表しました。このモデルは、パフォーマンスとコストのバランスを重視して設計されており、特にリアルタイム性が求められるタスクでの活用が期待されます。
Gemini 2.5 Flash-Lite の主な特徴
Gemini 2.5 Flash-Lite は、速度、コスト、品質の3つの側面で優れた特徴を持っています。
クラス最高の速度とコスト効率
Gemini 2.5 Flash-Lite は、幅広いプロンプトにおいて、旧モデルである 2.0 Flash-Lite や 2.0 Flash よりも低いレイテンシ(遅延)を実現しています。
料金は、入力トークン 100 万あたり 0.10 ドル、出力トークン 100 万あたり 0.40 ドルと、Gemini 2.5 ファミリーの中で最も低コストに設定されています。これにより、大量のリクエストを手頃な価格で処理することが可能になります。また、プレビュー版からオーディオ入力の価格が 40% 引き下げられたことも発表されています。

小型ながら高品質
低コストでありながら、コーディング、数学、科学、推論、マルチモーダル理解といった幅広いベンチマークにおいて、2.0 Flash-Lite を上回るスコアを示しています。
豊富な先進機能
Gemini 2.5 Flash-Lite は、以下の機能もサポートしています。
- 100 万トークンのコンテキストウィンドウ
- 制御可能な思考バジェット
- Google 検索によるグラウンディング、コード実行、URL コンテキストなどのネイティブツール
これらの機能により、より複雑で高度なタスクにも対応可能です。
すでに生まれている活用事例
正式リリースに先立ち、Gemini 2.5 Flash-Lite はすでに多くの企業で導入され、成果を上げています。
- Satlyt: 分散型宇宙コンピューティングプラットフォームを構築しており、衛星データのリアルタイム要約などに活用。Flash-Lite により、重要な診断における遅延を 45% 削減し、消費電力を 30% 削減しました。
- HeyGen: AI を活用したビデオコンテンツ用アバターを作成。Flash-Lite を用いてビデオ企画の自動化やコンテンツの最適化、180 以上の言語への翻訳を実現しています。
- DocsHound: 製品デモ動画からドキュメントを自動生成。Flash-Lite の高速処理により、長時間のビデオから数千のスクリーンショットを低遅延で抽出し、包括的なドキュメントを作成しています。
- Evertune: AI モデルにおけるブランド表現を分析。Flash-Lite の高速性能により、分析とレポート生成を劇的に高速化し、クライアントにタイムリーな洞察を提供しています。
利用方法と今後の予定
Gemini 2.5 Flash-Lite は、コード内でモデル名として gemini-2.5-flash-lite を指定することで利用できます。現在プレビュー版を利用している場合も、同じモデルであるため、この安定版に切り替えることが推奨されます。
なお、プレビュー版のエイリアスは、2025 年 8 月 25 日に削除される予定です。すぐに試したい方は、Google AI Studio および Vertex AI から利用を開始できます。
まとめ
Gemini 2.5 Flash-Lite の登場は、AI 開発のハードルを大きく下げる可能性があります。その圧倒的なコストパフォーマンスと速度は、これまでリソースの制約で高度な AI モデルの導入をためらっていた中小企業や個人の開発者にとっても、大きなチャンスとなることが期待されます。
出典: Google