Google は本日、最新のオープン AI モデル「Gemma 3」を発表しました。このモデルは、単一の GPU または TPU 上で動作する最も強力なモデルとして位置づけられており、開発者がスマートフォンからワークステーションまで、さまざまなデバイス上で AI アプリケーションを構築できるよう設計されています。
Gemma 3 は、1B、4B、12B、27B の4つのサイズで提供されており、35以上の言語をサポートし、テキスト、画像、短いビデオの分析が可能です。特に、4B以上のモデルはマルチモーダル機能を備え、テキストと画像の入力を処理できます。

また、これらのモデルは、Llama-405B、DeepSeek-V3、o3-mini などの他のモデルを上回る性能を示しており、NVIDIA の GPUや専用の AI ハードウェア上での最適化が施されています。さらに、128k トークンのコンテキストウィンドウを持ち、複雑なタスクの処理やエージェント機能の構築を支援するファンクションコールと構造化出力をサポートしています

安全性の面では、Gemma 3 は、危険なコンテンツ、性的に露骨な内容、暴力的な内容を分類する 4B の画像安全性チェッカー「ShieldGemma 2」を導入しています。これにより、画像生成モデルからの出力や自然画像の安全性を確保することが可能です。
Gemma 3 は、Google AI Studio での即時アクセスが可能であり、Kaggle や Hugging Face を通じてモデルのダウンロードも提供されています。また、Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM、Gemma.cpp などのツールやフレームワークとシームレスに統合でき、開発者はプロジェクトに最適なツールを選択できます。
今回の発表の詳細については、以下の公式記事をご覧ください。