Google は、AI アシスタント「Gemini」アプリに搭載されている画像編集機能のアップデートを発表しました。
新しい画像編集モデルの導入により、これまで課題となっていた AI 画像編集時の人物の見た目の一貫性が向上し、複数の高度な新機能が追加されました。
Gemini の画像編集、人物の見た目を維持する新モデルを搭載
これまでの Gemini アプリの画像編集機能では、AI によって生成・編集された画像の人物が、元の写真と微妙に異なって見えることがありました。
今回、Google DeepMind が開発した新しい画像編集モデル(開発中は “nano banana” と呼ばれていたもの)が Gemini アプリに統合されました。
このアップデートでは、編集を重ねても人物の見た目の一貫性を維持することに重点が置かれており、編集のたびに顔つきが変わってしまうといった問題が解消されます。
新たに追加された高度な編集機能
今回のアップデートでは、人物の見た目を維持する機能と連携して、以下のような高度な編集機能が利用できるようになります。
服装や場所の変更
人物やペットの写真をアップロードし、プロンプトで指示するだけで、被写体の見た目を維持したまま、服装を変えたり、全く異なる場所に移動させたりすることができます。
例えば、自分自身を異なる職業の服装にしたり、別の時代にいるかのような写真を作成したりすることが可能です。

複数の写真の合成
複数の写真をアップロードし、それらを組み合わせて全く新しいシーンを生成する機能も追加されました。
Google が示した例では、人物の写真と犬の写真を組み合わせ、「バスケットボールコートで女性が犬を抱きしめている画像を作成して」というプロンプトで、自然な合成画像が生成されています。

連続編集とデザインの融合
連続編集(Multi-turn editing)は、一度生成した画像に対して、さらに編集を加えられる機能です。例えば、空の部屋の画像から壁をピンク色に塗り、その後で本棚や家具を追加するといった段階的な編集が、最初からやり直す必要なく行えます。

また、Design mixing は、ある画像のスタイル(色や質感)を、別の画像のオブジェクトに適用する機能です。例として、花びらの模様をレインブーツに適用したり、蝶の羽のパターンをドレスのデザインに取り入れたりする様子が公開されています。

AI 生成画像には 2 種類の透かし
Gemini アプリで作成または編集されたすべての画像には、AI によって生成されたことを示すための2種類の透かしが入ります。
一つは画像の隅に表示される目に見えるウォーターマーク、もう一つは Google が開発した SynthID という目に見えない電子透かしです。これにより、画像の出所が明確になります。
まとめ
Gemini アプリの画像編集機能は、今回のアップデートで、人物の見た目を維持できるようになり、ユーザーは安心して自身の写真を編集に利用できます。服装や場所の変更、複数画像の合成といった新機能を活用することで、これまで以上に多彩な表現が可能になります。
これらの新機能は本日から順次展開されます。
出典: Google