Google は、最新の画像生成・編集 AI モデルである「Gemini 2.5 Flash Image」が正式に利用可能になったことを発表しました。
これにより、本番環境での利用に対応したほか、10 種類のアスペクト比のサポートや、画像のみを出力する指定が可能になるなど、複数の新機能が追加されています。
Gemini 2.5 Flash Image は、Google AI Studio の Gemini API や、エンタープライズ向けの Vertex AI を通じて利用できます。
Gemini 2.5 Flash Image の主な特徴
Gemini 2.5 Flash Image は、単に画像を生成するだけでなく、高度な編集機能も備えています。主な特徴は以下の通りです。
- 複数画像の合成: 異なる画像をシームレスに組み合わせることが可能です。
- キャラクターの一貫性: 物語性のあるコンテンツ作成のために、同じキャラクターを異なるシーンで一貫して描写できます。
- 自然言語による編集: 「1980 年代風にして」といった自然な言葉の指示で、特定の箇所を編集できます。
- 豊富な知識の活用: Gemini モデルが持つ広範な知識を利用して、文脈に沿った画像生成や修正を行います。
新機能:10 種類のアスペクト比に対応
今回のアップデートで特に注目されるのが、対応アスペクト比の拡充です。新たに追加された比率により、映画のような横長の画像から、SNS 投稿に適した縦長の画像まで、さまざまなフォーマットのコンテンツを容易に作成できます。
サポートされるアスペクト比は以下の 10 種類です。
- 横長: 21:9, 16:9, 4:3, 3:2
- 正方形: 1:1
- ポートレート: 9:16, 3:4, 2:3
- フレキシブル: 5:4, 4:5
この機能により、ブログのアイキャッチ画像や YouTube のサムネイル、Instagram のストーリーなど、用途に応じた最適な画像を効率的に生成できます。
実際の活用事例
すでに多くの開発者や企業が Gemini 2.5 Flash Image を活用して、新しいサービスを構築しています。
Cartwheel 社:キャラクターコントロールの実現
AI アートツールを開発する Cartwheel 社は、キャラクターのポーズを自由に制御できる「Pose Mode」機能に Gemini 2.5 Flash Image を採用しました。
同社の共同設立者である Andrew Carr 氏は、「他のモデルでは、任意のカメラアングルからのキャラクター描画やポーズへの忠実性を維持できませんでしたが、新しい Gemini 2.5 Flash Image モデルは、その両方を初めて実現できました」と述べています。
Volley 社:ゲーム内でのリアルタイム画像生成
AI ダンジョンクローラー「Wit’s End」を開発する Volley 社は、ゲームセッション中にキャラクターのポートレートやシーンの画像をリアルタイムで生成・編集するために、このモデルを活用しています。
これにより、プレイヤーはチャットや音声でスタイルを選択し、繰り返し修正を加えるといった対話的な操作が可能になります。
利用方法と料金
Gemini 2.5 Flash Image は、開発者向けに Gemini API を通じて提供されており、Google AI Studio でテストできます。
料金は、画像 1 枚あたり $0.039 、または出力トークン 100 万あたり $30.00 に設定されています。その他の入出力に関する価格は、標準の Gemini 2.5 Flash の料金体系に準じます。
Python のサンプルコード
以下は、既存の画像を 1980 年代風に変換する簡単なサンプルコードです。
from google import genai
from google.genai import types
from PIL import Image
client = genai.Client()
prompt = "Create a photograph of the subject in this image as if they were living in the 1980s. The photograph should capture the distinct fashion, hairstyles, and overall atmosphere of that time period."
image = Image.open('/path/to/image.png')
response = client.models.generate_content(
model="gemini-2.5-flash-image",
contents=[prompt, image],
config=types.GenerateContentConfig(
response_modalities=["IMAGE"],
image_config=types.ImageConfig(
aspect_ratio="16:9",
)
))
for part in response.parts:
if part.inline_data is not None:
generated_image = part.as_image()
generated_image.show()
まとめ
Gemini 2.5 Flash Image は、正式リリースによって信頼性が向上し、アスペクト比の追加といった新機能により、さらに幅広いクリエイティブな用途に対応できるようになりました。
開発者やクリエイターは、この強力な AI モデルを活用して、これまで以上に質の高い画像コンテンツを効率的に制作できる可能性があります。
一方、コンシューマー向けに提供されている Gemini アプリでは、現在画像のアスペクト比を指定しても 1:1 の正方形で出力されてしまうという問題が発生しています。
