日々進化している画像生成AI界隈ですが。
昨今その精度が上がりつつあり、写真と見まごうようなレベルまで来るものもあります。
こちらの記事では、そんな画像生成AIのMidjourneyバージョン6で究極の美女が作れるかについて考察をしていきます。
美女制作の前に
まず基本的なところの単語を選びたいのでGPTに質問してみました。
USER
究極の美女
究極の美少女
それぞれ英語の翻訳候補をください
ChatGPT4.0
「究極の美女」と「究極の美少女」の英語訳は、文脈やニュアンスによって多少異なることがあります。一般的な翻訳を以下に示します。
究極の美女: "The Ultimate Beauty" または "The Epitome of Beauty"
究極の美少女: "The Ultimate Beautiful Girl" または "The Quintessential Beautiful Girl"
「美女」と「美少女」の違いは、年齢や成熟度に関連するニュアンスが含まれている点にあります。「美女」は成熟した女性の美しさを指し、「美少女」は若い女の子または少女の美しさを指します。したがって、英語での翻訳もそのニュアンスを反映させることが重要です。
一旦これをそのままMidjourneyに投下してみます。
画像比率だけ3:4(縦型)にしたいので、そこのみ追加しましょう。
The Ultimate Beauty --ar 3:4
The Ultimate Beauty
The Epitome of Beauty
The Ultimate Beautiful Girl
The Quintessential Beautiful Girl
英語の翻訳において、基本的には美女は20~40代、文脈によっては50代を内包している可能性があるのに対し、美少女は10代中盤から25歳以下と捉えられることが多いです。
さらに、Midjourneyでは素の状態ではエレガント風の作画、顔のアップ、空気管の演出を好んで採用する為、そのあたりの指定が弱いとこのようにバストアップかフェイスの実の画像が出来上がることが多くあります。
また、選出した単語の中にエレガントさや気品を表す言葉が混じっている場合は、その言葉に日木津られる系呼応があります。
美女制作の単語選出
では実際にどの様な単語で美女、あるいは美少女を作っていくといいのでしょうか。
まず、コントロールしたいのは以下の四点です。
- リアル系、写真風であること
- 人種を特定して出すこと
- 年齢を特定して出すこと
- 全身など画面への収まり方
今回はサンプルですので下記の様に定義し解説します。
Hyper realistic photography, Japanese, 25YO, Fullbody, --ar 9:16
それぞれ簡単に解説します。
「Hyper rialistic photography」は超リアル系の出力を促すプロンプトです。類似では「real portrait」や「32K」などがあります。それぞれ微妙に違いますので好みのものを使ってください。
「Japanese」は見たまま日本人の指定です。ここで注意として、日本人と指定すると和装が出現しやすくなります。できれば、服装も指定してあげるといいでしょう。
「25YO」これは25歳という指定で、YOはYears Oldの略です。
「Fullbody」は全身、の意味でこの他にも「Forcus ○○」など色々な方法があります。
「--ar 9:16」は極端な縦長画像です。
一旦これで数回出力してみましょう。
和装のようなものとグラビアのようなものというイメージですね。
顔もあまり日本人に寄せているようには見えません。
ここでいくつか現在足りていない単語を追加します。要素は以下のものです。
- 美を強調した単語
- 服装を指定した単語
- 体勢を指定した単語
- 背景を指定した単語
Hyper realistic photography, Japanese, 25YO, Fullbody, ultimate beauty, shirt and pants, sitting on the sofa, in her room --ar 3:4
究極の美、シャツとズボン、ソファに座る、彼女の部屋にいるを追加しました。画角も3:4に調整済みです。
なんとなく、なんか違うなぁと思っているところでしょう。
実は、現在のAIは直接東洋人種を描くのが苦手なのです、ここからJapaneseを抜いてみます。
Hyper realistic photography, 25YO, Fullbody, ultimate beauty, shirt and pants, sitting on the sofa, in her room --ar 3:4
西洋人種の作画の方がなんとなく安定するというのがなんとなく伝わるでしょうか。
今回は単語を切ってお見せしていますがそれぞれはシチュエーション的につなげても構いません。
例えば家具類と彼女の部屋は繋げることができますし、究極の美女と年齢も繋げることができます。
文章をつなげることによって多少描画が変わる可能性もあります。
今回の記事はここまでです。
次回は、好みの顔の画像をまず作るところから始めます。