Adobe FireflyでAIイラストを生成していて、最近パートナーモデルのプラグインが多岐にわたって搭載されるようになってきたので、これは出力の出来を比べたら面白いだろう、と思い立ちました。プロンプトは全く同じものを使い、画像が参照できるモデルに対しては同じ画像をドロップして比較するというやり方です。参照で用いた画像はこれです。
(c)menehune_yas - イラスト素材 PIXTA -
このイラスト自体がAdobe Fireflyで生成されたものです。気に入ったモデルの表情をその後のイラストにも生かしたいときは「モデルの表情は画像を参照」と入れてやると再現されるケースが多いです。特に顕著なのは〈Gemini 2.5〉ですね。トータルで見ても私的に一番いい結果を出してくれたのは〈Gemini 2.5〉でした。プロンプトの記述方法については諸説・ノウハウが飛び交っていますが、あまりそこに時間を使っても何なので以下のようなシンプルな記述で統一しました。もちろん日本語のままです。
お正月。着物でおめかしした女子高生が正座してカメラに正対している。モデルの両脇には干支の馬を模したぬいぐるみが2体、狛犬のように鎮座している。年賀状のイラストに使えるようにモデルの頭部上には余白を設ける、モデルの表情は画像参照。
という文章です。この条件で、一発勝負。1回限りの出力結果を見比べてみましょう。なお、〈Firefly Image 4〉はカンプを4枚出力してくれるので、一番出来が良いものを選びました。各AIエンジンの背景などは明るくないので省きます。

まずは〈Gemini 2.5〉です。あれだけのプロンプトに対してこれだけのレスポンスを返してくるあたり、ちょっと唸ってしまいます。コピースペースもしっかり設けられていますね。屋内を前提にしてくれてもいます。

続いて、つい最近実装された〈FLUX Kontext Pro〉です。着物のバランスがおかしいですし、正座している下は石畳でしょうか?屋外ですよね。背景の余白も後処理が面倒そうだし、馬?も可愛くありません。参照画像に引っ張られて雪も舞ってしまっています。

こちらは〈FLUX Kontext Max〉です。着物の仕様は良いですが、屋外だし雪は舞ってるし、馬というより犬ですし、、、「狛犬」に引っ張られているようです。プロンプトに「和室の室内」など入れてあげると結果は違ってくるでしょう。

続いては〈Flux 1.1 Ultra(Raw)〉です。室内なのはいいですが貧相ですし、正座用の椅子に座っている感が出ちゃってます。馬ではなく、牛ですよね。着物のデザインも気になります。

これは〈Flux 1.1 Ultra〉の結果です。室内の空間はましになりましたが、正座用椅子なのは相変わらず。照明が暗いですし、モデルの馬耳も好みではありません。ぬいぐるみは豚と牛ですよね。

〈Flux 1.1 Pro〉です。室内の様子と、照明の具合はいい感じですが、着物の裾の広がりが気になりますし、ぬいぐるみというよりも「狛犬」の方に引っ張られているようです。モデル上部の余白ももう少し欲しい。

ここからはAdobeモデルです。これは〈Image 4 Ultra〉です。町並みも含めて参照画像を引きずりすぎ。石畳に正座というのも、お正月感が皆無というのもなんだかなあ。

これは〈Image 4〉で生成された4枚の中で一番良かったもの、と言いますかほかの3枚の出来が酷い。ミニスカ着物だし、正座もしてないし、という感じです。

提携モデルに戻ります。これは〈GPT Image〉による出力。シンプルですが、破綻はしていません。拡張生成でコピースペースもあとで稼げます。でも女性の目線が外れていたり、トータルの出来はイマイチです。

最後に〈Runway Gen-4 Image〉です。なんといいますか、コレジャナイ感が溢れている感じです。
やはり〈Gemini 2.5〉がダントツで抜きん出ている印象を持ちます。以前のエントリでご紹介した画質劣化問題はあるものの、プロンプトの理解度とトータルの演出力には驚かされるものがあります。最後にこの〈Gemini 2.5〉の演出力に唸った例をご紹介して締めます。
(c)menehune_yas - イラスト素材 PIXTA -
参照画像はこれです。古い町並みでたたずむ女子高生。これ自体、Adobe Fireflyで生成しています。実はこのイラスト、PIXTAの審査はパスしていますが、Adobe Stockの審査は保留のまま放置されています。これにどんなプロンプトを当てたかと言いますと、
日本の女子高生、モデルの顔のイメージは画像参照、クローズアップ、嬉しさのあまり、泣き笑い顔になっているが、目はとじない。モデルは画面右に寄せ、左側は余白を作る
で、生成されたイラストがこれです。Adobe Stockの審査も即承認されています。あの黒髪ロングのモデルが嬉しさのあまり嬉し泣きをするとこうなる、という想像力というか、大胆な演出力に驚かされます。〈Gemini 2.5〉は、しばらくいい遊び相手になってくれそうです。これでピクセル寸法がアップされれば無敵レベルかもしれません。



