今回は初心者向けにChatGPTを使って呪術廻戦の有名なセリフのひとつ「人の心とかないんか?」を描画させてみようと思います。
通常は画像生成AIでの絵を作る時は「master piece ...」から始まる呪文を入れたりするのが主流でした。
しかし、普段画像生成AIを使う人にとってはそういったクオリティコントロールの命令はなじみがないですよね。
そこで今回はGPT4 turboに搭載されたDALL-E3を使うと、ほぼ対話形式で理想の画像が作れるので、何とかチャレンジして近づけていこうという企画です。
ChatGPTの有料版導入をお考えの方、初めて画像生成をする方の参考になれば幸いです。
構図を指定して対話形式で画像を作ってもらう【実演】
まず基本的な画像生成の形をとりましょう。
以下のように依頼しました。
AIロボットが正面を向いてこちらを煽っている構図。 セリフを入れるスペースを右側に設ける。 横長。
すると下記の様な画像が生成されました。
い、いや呼んでないですよ?
とりあえず煽るという行動とセリフスペースは作ってくれたようです。
禪院直哉の構図は正面だったのでこれに正面の希望を出します。
表情はとてもいいかな、さすがだね 真正面の構図でやってほしいな 同じAIロボットでいいよ
とりあえず褒めます。
対話型のAIは褒めると機嫌がよくなって能力が向上します。
すると下記の画像が生成されました。
ガッツリ女の子ではないですか!
そうです、実は生成AIは前回と同じ画像というのがあまり得意ではありません。
キャラクターの継続性というのはDALL-Eの作業環境だとちょっと難しいのです。
気を取り直して次の修正命令を入れます。
構図は完ぺきだね さすがだよ もうちょっと無機質なロボットがいいな
とりあえず無機質で性別の無いロボットになってほしいです。
ここでも褒めます。
おお!無機質な正面ができましたね。
あとはあおりを入れるだけです。
なんかこれも煽ってる感はそこそこありますけど。
いいね、この状態を維持してほしいな ・無機質なロボット ・真正面の構図 ・横長 更に要望を付け加えるね 口を左右非対称で開けて憎たらしい表情にしてほしいんだ 煽っているという表現になるような形でおねがい
なんで真正面をやめてしまったのか「もうちょっと頑張ってほしいよ!」と思わず叫んでしまいました。
っていうかこれ進撃の巨…。
本当にあとちょっとだったのにこれは大変ですね。
すごい、これを真正面でお願いできないかな 表情は完ぺきだよ 顔が真正面だと嬉しいな
ほめつつ、表情をロックして顔が真正面ということを強調します。
もはや正解がわかりません。
そこそこいいのができたので思わずOKと言ってしまいました。
でもちょっと近すぎるんですよね。
採用!すごいね この画像の上下を補完することはできる? 頭部分を見たくて
するとこんな返答が。
申し訳ありません、画像を拡張して上下を補完することはできないことになっています。しかし、新しい画像を生成することで、ロボットの頭部全体を表現することじたいはできそうです。そのようにしますか?
なるほどぉ、上下に伸ばしてはくれないんですね。
いいよこれにめちゃくちゃ近い設定で、さらに頭が画面に収まってると嬉しいな
ちょっとだけ頭入ったけど画像の凶悪さがマシマシに!
すごいクオリティだね すこしだけ引きの構図にして、口を不自然に開けてくれる? とてもカッコお願い
ダメ押しでほめます、引いて!お願い!
で、できたぁ。
シンメトリーになっちゃったけど一応ほしい構図に近い物はできました。
結構長かった…。
こんな風に、GPT 4では対話形式で要望尾をしていって徐々に近い構図を作っていくことが可能です。
実際には前の画像をどの程度参照できているのかというのはちぐはぐだったりしますが、「プロンプトなんてわからない」というユーザーの方向けにもわかりやすい画像生成のアプローチではないでしょうか。
最後に、この画像を基に別のソフトで加工仕上げをしてみましたのでご覧ください。
まったく、なんでここまで丁寧に誘導してあげないといけないんだか……
ちなみに、対話形式で構築しない場合は素直に必要なプロンプトをガリガリ書いてあげたほうがよさそうです。
著者はMidjouerneyも多用しています。