Google は、Gemini アプリに搭載された新しい画像編集機能の性能を示す 10 個の作例を公式ブログで公開しました。
この機能は、Google DeepMind が開発した「Nano Banana」と呼ばれる新しい画像生成・編集モデルによって実現されており、ユーザーはこれまで以上に高度な画像編集を行えます。
例えば、特定の人物やペットを一貫して維持したまま編集したり、複数の写真を自然に合成したり、画像の一部だけを変更したりすることが可能です。
Google が公開した 10 個の作例
Google が紹介したプロンプト(指示文)と、それによって生成された画像の概要は以下の通りです。実際の生成画像は、出典元の Google 公式ブログでご覧いただけます。
- 猫を16ビットのビデオゲームキャラクターに プロンプト: 「この猫を16ビットのビデオゲームキャラクターとして再現し、2Dの16ビットプラットフォームビデオゲームのステージに配置してください」
- 大人の自分と子供の頃の自分がティーパーティー プロンプト: 「これは大人になった私の写真です。プレイルームで子供の頃の自分と一緒に座ってお茶会をしている、大人になった私の写真を作成してください」
- 風景写真をファンタジーゲームのマップに プロンプト: 「この写真を、ファンタジーゲーム用の様式化された3D世界のマップに変えてください。村と港を含めてください」
- 写真を鉛筆画に プロンプト: 「この写真を鉛筆画に変えてください」
- 食材から高級デザートの画像を生成 プロンプト: 「これらの食材から、洗練された美味しそうなデザートを創作してください。5つ星の前衛的なレストランの料理のように盛り付けてください」
- ハサミをファンタジーキャラクターに プロンプト: 「このハサミを、エルフや妖精が登場する映画に出てくるような、リアルなファンタジーキャラクターに変えてください」
- 犬のリアルな3Dモデルを作成 プロンプト: 「この犬のリアルな小さな3Dモデルを作成してください。誰かがギフトとして開けたように見える誕生日プレゼント用の包装の横にある机の上に、そのモデルを置いてください」
- 2人の主人公による9枚の画像ストーリーを作成 プロンプト: 「この2人の主人公が秘密のスーパーヒーローとして冒険する、9枚の画像からなる壮大な物語を作成してください。物語はスリリングで感情的な高低差があり、素晴らしいひねりと最高の結末で終わります。画像に文字は含めず、純粋に画像だけで物語を伝えてください」
- ドレスをテニスボール製に プロンプト: 「この人物のドレスをテニスボール製に変更してください」
- 家をトロピカルなデザインに プロンプト: 「この家を活気のあるトロピカルアイランドデザインに変身させてください。屋根を茅葺きに替え、竹の構造要素を追加してください。緑豊かでカラフルな熱帯植物やヤシの木で囲んでください」
まとめ
これらの作例は、Gemini アプリの画像編集機能が、単なる加工ツールではなく、ユーザーの創造性を拡張するツールへと進化したことを示しています。
このアップデートされた画像編集機能は、Gemini アプリで試すことができます。
なお、以前紹介していますが、この編集機能のおかげで既存の写真に入り込んでしまったフェンス(金網など)を消すことができるようになりました。
出典: Google