AIによる画像生成を始めて、より自分の理想とする画像を出力できるようになりたいと思ったことはありませんか。
前回の動画生成の入門記事では基本的なことを紹介しましたが、こちらの記事ではより使われる単語について紹介していきます。
前回の記事(初心者向け必読)をまだ読んでいない場合は、ぜひ合わせて読んでみてください。
基本的な書き方と、頻出する使いやすい単語を是非学んでいきましょう。
今回はLeonardo.AiでのAI Image Generation機能のAbsolute Reality v1.6モデルで試してみました。
★無料で画像生成を試すなら、以下がオススメ★
関連記事:【Leonardo.AI】初心者でも使える画像生成AIツールの使い方、登録方法などを解説→
関連記事:【イデオグラムAI】ideogramAIの登録方法と基本的な使い方→
最も基本的なコツとしてはなるべく英語で生成することです。
今回は例として日本語を併記していますが、実際は英語部分のみでプロンプトを構成しましょう。
光の表現から考える違い
色彩やシチュエーションは画像の雰囲気を決定する重要な要素です。
例を考えてみましょう。下記に、夕日と月明りを例にした二つの構文と出力を用意しました。
Warm evening light shining on a small wooden house.「温暖な夕陽が小さな木造の家を照らす」
A terrifying small wooden house under the cold moonlight.「冷たい月明かりの下にある、怖い雰囲気の小さな木造の家」
これら2つの例は、同じ対象木造の小屋という指定であっても、雰囲気が全く異なる為、見る側に様々な感情を呼び起こします。
さらに、光と影の使い方も、画像に深さとリアリティを与える重要な要素です。
明るい陽光、柔らかい月光、陰鬱な影など、光の表現方法を変えることで、画像の雰囲気が大きく変わります。
A sandy beach under intense sunlight.「強烈な日光の下の砂浜」
A meadow illuminated by soft light.「柔らかな光が草原を照らす」
と、人工知能に異なる光の効果を表現するよう要求します。
これらの微妙な違いをヒントに加えることで、人工知能はよりリアルで感情豊かな画像を生成することができます。
空から降ってくる光だけでもこのようにシチュエーションが変わってくることがわかりました。
つまり、月明りと書けば当然夜になりますし、不気味な雰囲気が出てくる確率も上がります。
逆に強烈な日光であったり砂浜といった言葉は明るいシチュエーションを呼び起こします。
背景の要素一つを取ってみても、全体に与える雰囲気に影響が出るということですね。
背景と背景シチュエーションの単語や文章の例
質感の描写も忘れてはいけません。光沢のある表面、粗い岩の表面、柔らかい布などの材料の質感を詳細に説明することで、人工知能はよりリアルな画像を生成することができます。
例えば背景に使える単語を考えてみましょう。
Town | 町 |
City | 都市 |
Cafe | カフェ |
Skyscraper | 高層ビル |
Underpass | 高架下 |
Residential area | 住宅地 |
Shopping street | 商店街 |
Chinatown | チャイナタウン |
Night view | 夜景 |
Factory | 工場 |
Alleyway | 路地 |
Village | 村 |
Mansion | 邸宅 |
Room | 部屋 |
Bedroom | ベッドルーム |
Bathroom | 風呂場 |
Park | 公園 |
Garden | 庭園 |
Plant | 植物 |
Orchard | 果樹園 |
Onsen | 温泉 |
Pool | プール |
Waterfall | 滝 |
Harbor | 港 |
Ocean | 海洋 |
Lake | 湖 |
Forest | 森 |
Mountain | 山 |
Beach | ビーチ |
Desert | 砂漠 |
Church | 教会 |
Graveyard | 墓地 |
Cemetery | 墓地 |
Castle | 城 |
Bowling alley | ボウリング場 |
Amusement park | 遊園地 |
Concert hall | コンサートホール |
Movie theatre | 映画館 |
Library | 図書館 |
Museum | 博物館 |
Bowling alley | ボウリング場 |
Amusement park | 遊園地 |
Ice skating rink | アイススケートリンク |
Baseball Ground | 野球場 |
Soccer field | サッカー場 |
Tennis court | テニスコート |
School classroom | 学校の教室 |
Snow scene | 雪景色 |
まだまだいくらでもありますが、このように1~2語程度で1つの単語を構成できるとAIは理解し易くなります。
また、自然物の横には自然物が、人工物の横には人工物がといったように、連想しやすい物はついでに書かれる可能性があります。
ですので、仮に「人通りの多い交差点」を指定した場合は、特に指定をしなくても「高層ビル」が出る割合も他に比べて高くなります。
背景の構造物は、絵を考えるヒントに十分なりますので、まずどういったものが背景に描かれる場面なのか想像して単語を選ぶといいでしょう。
さらにこれらの背景に加えて修飾語を付け加えます。
Misty forest with ancient towering trees | 古代の高木に覆われた霧の森 |
Tranquil lake reflecting the twilight sky | 夕暮れの空を映す静かな湖 |
Bustling cityscape at night with glowing lights | 夜の光に輝く活気ある都市風景 |
Snow-covered mountain peaks under clear blue skies | 晴れ渡る青空の下の雪山 |
Historic castle surrounded by colorful autumn leaves | 彩り豊かな秋の葉に囲まれた歴史的な城 |
Sun-kissed beach with gentle waves | 穏やかな波のある日差しの浴びるビーチ |
Desert landscape with towering sand dunes | 高い砂丘のある砂漠の風景 |
Vibrant coral reef teeming with marine life | 海洋生物に溢れる鮮やかな珊瑚礁 |
Serene pathway through a flowering meadow | 花が咲き乱れる草原を抜ける穏やかな小道 |
Majestic waterfall cascading into a crystal-clear pool | 澄んだ水の池へ流れ落ちる壮大な滝 |
Serene riverside with blossoming wildflowers | 野生の花が咲き乱れる静かな川辺 |
Vibrant market street bustling with locals | 地元の人々で賑わう活気ある市場通り |
Hauntingly beautiful abandoned amusement park | 幽玄の美を持つ廃墟となった遊園地 |
Picturesque windmill overlooking a golden field | 金色の野を望む風景画のような風車 |
Cozy cabin in a snowy forest at dusk | 夕暮れ時の雪林にある居心地の良いキャビン |
Ancient temple shrouded in morning mist | 朝霧に包まれた古代の寺院 |
Bustling harbor with colorful boats and bustling fishermen | 色とりどりのボートと忙しい漁師で賑わう港 |
Quiet orchard ripe with the season’s fruit | 季節の果実で実る静かな果樹園 |
Grand city square lit up during a festival | 祭りで灯される壮大な市庁舎広場 |
Old library filled with towering bookshelves | 高い書棚が並ぶ古い図書館 |
Remote island with pristine beaches and lush jungles | 純白のビーチと茂るジャングルがある遠隔の島 |
Starry night sky over a peaceful desert oasis | 平和な砂漠のオアシスに広がる星空 |
Foggy city streets in the early morning | 早朝の霧が濃い都市の通り |
Hilltop view of a sprawling urban landscape | 広がる都市風景を一望できる丘の上 |
こういった感じです。なるべく雰囲気が合う単語を使ってみるのがコツですね。
世界観のプロンプト
世界観を抑えるには世界観を表す単語を表現するのが簡単です。
これは歴史的な名称である○○時代、やジャンルを含みます。
以下のような表現方法があり、この記載であればほとんどの画像生成AIが対応できますので参考にしてみてください。
Cyberpunk | サイバーパンク |
Edo Period | 江戸時代風 |
Fantasy | ファンタジー |
Sci-Fi | SF(サイエンスフィクション) |
Steampunk | スチームパンク |
Dystopian | ディストピア |
Historical Fiction | 歴史小説 |
Horror | ホラー |
Noir | ノワール |
Romantic | ロマンス |
Mystery | ミステリー |
Western | ウェスタン |
Superhero | スーパーヒーロー |
Space Opera | スペースオペラ |
Gothic | ゴシック |
こういった単語を単体でもプロンプト内に仕込むことによって、それに沿ったシチュエーションをAIに与えることができます。
もちろん組み合わせてもいいですし、他の単語を追加してみるのもいいでしょう。
また、国名を入れていくとそれにちなんだ意匠が発現しやすくなります。
例えば「日本」と入れると芸者さんが出やすくなったり、京都っぽい背景や丸の内や渋谷っぽい背景などが出やすくなります。
この辺は好みとなりますので、特に国を意識したい画像がなければ入れる必要はありません。
ただし[Anime Feat Japan]などは効果的な場合もあります。
視点やポーズのプロンプト
人物のポーズや動きは、感情や状況を表現するだけでなく、イラスト全体に動きを与える重要な役割を果たします。
A Girl, Looking at Viewer
例えばこういったプロンプトにすると少女が、こちらをカメラ目線で見ている。
という命令になります。
look at viewerは非常に優秀で、作品を発表する時に対象ユーザーを引き付けやすくなります。
Bird Viewの場合は、上から見たといった意味合いになったりします。
参考ではこんな感じです。
First-Person View | 一人称視点 |
Third-Person View | 三人称視点 |
Bird's Eye View | 鳥瞰図(バードビュー) |
Worm's Eye View | 地面視点(ワームズアイビュー) |
Over-the-Shoulder View | 肩越し視点 |
Point of View Shot | 主観撮影 |
Side View | 横からの視点 |
Rear View | 後ろからの視点 |
Look at Viewer | 視聴者を見る視点 |
Panoramic View | パノラマ視点 |
このほか○○angleも有効です。
ただし、低い視点のアングルは生成ではじかれる場合があります。
また○○poseやKnee up などはポーズに直結するプロンプトです。
Standing Pose | 立ち姿勢 |
Sitting Pose | 座り姿勢 |
Crouching Pose | しゃがみ姿勢 |
Lying Down Pose | 横たわり姿勢 |
Reclining Pose | 寝そべり姿勢 |
Jumping Pose | ジャンプ姿勢 |
Running Pose | 走り姿勢 |
Leaning Pose | もたれる姿勢 |
Cross-legged Pose | 脚を組む姿勢 |
Hands on Hips | 手を腰に |
Arms Crossed | 腕を組む |
Hand Raised | 手を挙げる |
Looking Over Shoulder | 肩越しに見る |
Pointing | 指差す |
Bowing | お辞儀をする |
キャラクターの前後にこれらを付けることで、より鮮明にキャラクターが描かれます。
表情や人体パーツのプロンプト
表情や人体パーツに関しては細かい指定も可能です。
唯一難しいのが左右に関する指定で、こちらはランダムになる可能性が高いですがそれ以外はある程度操ることができます。
例えば瞳であれば「ツリ目」や「金色の目」といった形や色の表現が適当です。
Almond Eyes | アーモンドアイ |
Round Eyes | 丸い目 |
Slanted Eyes | 斜めの目 |
Hooded Eyes | フード付き目(上瞼が重たい目) |
Monolid Eyes | 一重まぶた |
Upturned Eyes | ツリ目 |
Downturned Eyes | たれ目 |
Wide-set Eyes | 離れ目 |
Close-set Eyes | 近眼(目が近い) |
Deep-set Eyes | 深窓の目(奥二重の目) |
髪型の入力なども有効になります。
Short Hair | ショートヘア |
Long Hair | ロングヘア |
Curly Hair | カーリーヘア |
Straight Hair | ストレートヘア |
Ponytail | ポニーテール |
Bun | まとめ髪(バン) |
Braided Hair | 編み込みヘア |
Mohawk | モヒカン |
Bob Cut | ボブカット |
Layered Hair | レイヤードヘア |
Side Part | サイドパート |
Buzz Cut | バズカット |
Pixie Cut | ピクシーカット |
Undercut | アンダーカット |
Side Swept Bangs | サイドスウェプトバング |
髪型は肩まで、腰まで、などの指定も有効です。
その他体型などもあります。
Slim | スリム |
Athletic | アスレチック |
Muscular | 筋肉質 |
Curvy | 曲線美 |
Pear-shaped | 梨型 |
Apple-shaped | りんご型 |
Hourglass | アワーグラス型 |
Plus-size | プラスサイズ |
Petite | プチ |
Tall | 高身長 |
Short | 低身長 |
Stocky | がっしりとした |
Lean | リーン(細身だが筋肉質) |
Lanky | ガリガリ |
こちらは指定しすぎると全体に影響を及ぼすので、雰囲気のみの指定でもよいでしょう。
[A ○○ Girl]などで適用できます。
小物のプロンプト
人物の身につけているものを指定する際は、[with ○○]などの表現にするか、個別に設定してあげるのが望ましいです。
ただし、Watchのような場合は解釈が変わる可能性があるので十分に注意しましょう。
職業と小物を併記することで、より具体的な描写になる場合もあります。
Smartphone | スマートフォン |
Earrings | イヤリング |
Watch | 腕時計 |
Bracelet | ブレスレット |
Necklace | ネックレス |
Ring | 指輪 |
Sunglasses | サングラス |
Wallet | 財布 |
Keychain | キーホルダー |
Backpack | リュックサック |
Belt | ベルト |
Hat | 帽子 |
Scarf | スカーフ |
Gloves | 手袋 |
Handbag | ハンドバッグ |
単語はでAIの想像力を活用する
これらの単語はほんの一例です。
シチュエーションを感じさせる言葉。色合いを感じさせる言葉、活発さを感じさせる言葉。
沢山の単語の連なりによって画像生成は成り立っています。
Beachと書けば水着が出やすくなりますし、Officeと書けばスーツが出やすくなります。
大事なのはそれらの言葉がどの様に成り立ち、プロンプト内ではどのように解釈されるべきかというのを明瞭に伝えることにあります。
是非、自分だけの特異プロンプトを作ってみましょう。