画像生成AIでプロンプトに記述する便利な単語と考え方

AI_活用術
この記事は約12分で読めます。

AIによる画像生成を始めて、より自分の理想とする画像を出力できるようになりたいと思ったことはありませんか。

前回の動画生成の入門記事では基本的なことを紹介しましたが、こちらの記事ではより使われる単語について紹介していきます。

前回の記事(初心者向け必読)をまだ読んでいない場合は、ぜひ合わせて読んでみてください。

基本的な書き方と、頻出する使いやすい単語を是非学んでいきましょう。

関連記事:画像生成するプロンプトのコツ【初心者向け】→

今回はLeonardo.AiでのAI Image Generation機能のAbsolute Reality v1.6モデルで試してみました。

★無料で画像生成を試すなら、以下がオススメ★

関連記事:【Leonardo.AI】初心者でも使える画像生成AIツールの使い方、登録方法などを解説→

関連記事:【イデオグラムAI】ideogramAIの登録方法と基本的な使い方→

最も基本的なコツとしてはなるべく英語で生成することです。

今回は例として日本語を併記していますが、実際は英語部分のみでプロンプトを構成しましょう。

光の表現から考える違い

色彩やシチュエーションは画像の雰囲気を決定する重要な要素です。

例を考えてみましょう。下記に、夕日と月明りを例にした二つの構文と出力を用意しました。

これら2つの例は、同じ対象木造の小屋という指定であっても、雰囲気が全く異なる為、見る側に様々な感情を呼び起こします。

さらに、光と影の使い方も、画像に深さとリアリティを与える重要な要素です。

明るい陽光、柔らかい月光、陰鬱な影など、光の表現方法を変えることで、画像の雰囲気が大きく変わります。

と、人工知能に異なる光の効果を表現するよう要求します。

これらの微妙な違いをヒントに加えることで、人工知能はよりリアルで感情豊かな画像を生成することができます。

空から降ってくる光だけでもこのようにシチュエーションが変わってくることがわかりました。

つまり、月明りと書けば当然夜になりますし、不気味な雰囲気が出てくる確率も上がります。

逆に強烈な日光であったり砂浜といった言葉は明るいシチュエーションを呼び起こします。

背景の要素一つを取ってみても、全体に与える雰囲気に影響が出るということですね。

背景と背景シチュエーションの単語や文章の例

質感の描写も忘れてはいけません。光沢のある表面、粗い岩の表面、柔らかい布などの材料の質感を詳細に説明することで、人工知能はよりリアルな画像を生成することができます。

例えば背景に使える単語を考えてみましょう。

Town
City都市
Cafeカフェ
Skyscraper高層ビル
Underpass高架下
Residential area住宅地
Shopping street商店街
Chinatownチャイナタウン
Night view夜景
Factory工場
Alleyway路地
Village
Mansion邸宅
Room部屋
Bedroomベッドルーム
Bathroom風呂場
Park公園
Garden庭園
Plant植物
Orchard果樹園
Onsen温泉
Poolプール
Waterfall
Harbor
Ocean海洋
Lake
Forest
Mountain
Beachビーチ
Desert砂漠
Church教会
Graveyard墓地
Cemetery墓地
Castle
Bowling alleyボウリング場
Amusement park遊園地
Concert hallコンサートホール
Movie theatre映画館
Library図書館
Museum博物館
Bowling alleyボウリング場
Amusement park遊園地
Ice skating rinkアイススケートリンク
Baseball Ground野球場
Soccer fieldサッカー場
Tennis courtテニスコート
School classroom学校の教室
Snow scene雪景色

まだまだいくらでもありますが、このように1~2語程度で1つの単語を構成できるとAIは理解し易くなります。

また、自然物の横には自然物が、人工物の横には人工物がといったように、連想しやすい物はついでに書かれる可能性があります。

ですので、仮に「人通りの多い交差点」を指定した場合は、特に指定をしなくても「高層ビル」が出る割合も他に比べて高くなります。

背景の構造物は、絵を考えるヒントに十分なりますので、まずどういったものが背景に描かれる場面なのか想像して単語を選ぶといいでしょう。

さらにこれらの背景に加えて修飾語を付け加えます。

Misty forest with ancient towering trees古代の高木に覆われた霧の森
Tranquil lake reflecting the twilight sky夕暮れの空を映す静かな湖
Bustling cityscape at night with glowing lights夜の光に輝く活気ある都市風景
Snow-covered mountain peaks under clear blue skies晴れ渡る青空の下の雪山
Historic castle surrounded by colorful autumn leaves彩り豊かな秋の葉に囲まれた歴史的な城
Sun-kissed beach with gentle waves穏やかな波のある日差しの浴びるビーチ
Desert landscape with towering sand dunes高い砂丘のある砂漠の風景
Vibrant coral reef teeming with marine life海洋生物に溢れる鮮やかな珊瑚礁
Serene pathway through a flowering meadow花が咲き乱れる草原を抜ける穏やかな小道
Majestic waterfall cascading into a crystal-clear pool澄んだ水の池へ流れ落ちる壮大な滝
Serene riverside with blossoming wildflowers野生の花が咲き乱れる静かな川辺
Vibrant market street bustling with locals地元の人々で賑わう活気ある市場通り
Hauntingly beautiful abandoned amusement park幽玄の美を持つ廃墟となった遊園地
Picturesque windmill overlooking a golden field金色の野を望む風景画のような風車
Cozy cabin in a snowy forest at dusk夕暮れ時の雪林にある居心地の良いキャビン
Ancient temple shrouded in morning mist朝霧に包まれた古代の寺院
Bustling harbor with colorful boats and bustling fishermen色とりどりのボートと忙しい漁師で賑わう港
Quiet orchard ripe with the season’s fruit季節の果実で実る静かな果樹園
Grand city square lit up during a festival祭りで灯される壮大な市庁舎広場
Old library filled with towering bookshelves高い書棚が並ぶ古い図書館
Remote island with pristine beaches and lush jungles純白のビーチと茂るジャングルがある遠隔の島
Starry night sky over a peaceful desert oasis平和な砂漠のオアシスに広がる星空
Foggy city streets in the early morning早朝の霧が濃い都市の通り
Hilltop view of a sprawling urban landscape広がる都市風景を一望できる丘の上

こういった感じです。なるべく雰囲気が合う単語を使ってみるのがコツですね。

世界観のプロンプト


世界観を抑えるには世界観を表す単語を表現するのが簡単です。

これは歴史的な名称である○○時代、やジャンルを含みます。

以下のような表現方法があり、この記載であればほとんどの画像生成AIが対応できますので参考にしてみてください。

Cyberpunkサイバーパンク
Edo Period江戸時代風
Fantasyファンタジー
Sci-FiSF(サイエンスフィクション)
Steampunkスチームパンク
Dystopianディストピア
Historical Fiction歴史小説
Horrorホラー
Noirノワール
Romanticロマンス
Mysteryミステリー
Westernウェスタン
Superheroスーパーヒーロー
Space Operaスペースオペラ
Gothicゴシック

こういった単語を単体でもプロンプト内に仕込むことによって、それに沿ったシチュエーションをAIに与えることができます。

もちろん組み合わせてもいいですし、他の単語を追加してみるのもいいでしょう。

また、国名を入れていくとそれにちなんだ意匠が発現しやすくなります。

例えば「日本」と入れると芸者さんが出やすくなったり、京都っぽい背景や丸の内や渋谷っぽい背景などが出やすくなります。

この辺は好みとなりますので、特に国を意識したい画像がなければ入れる必要はありません。

ただし[Anime Feat Japan]などは効果的な場合もあります。

視点やポーズのプロンプト

人物のポーズや動きは、感情や状況を表現するだけでなく、イラスト全体に動きを与える重要な役割を果たします。

例えばこういったプロンプトにすると少女が、こちらをカメラ目線で見ている。

という命令になります。

look at viewerは非常に優秀で、作品を発表する時に対象ユーザーを引き付けやすくなります。

Bird Viewの場合は、上から見たといった意味合いになったりします。

参考ではこんな感じです。

First-Person View一人称視点
Third-Person View三人称視点
Bird's Eye View鳥瞰図(バードビュー)
Worm's Eye View地面視点(ワームズアイビュー)
Over-the-Shoulder View肩越し視点
Point of View Shot主観撮影
Side View横からの視点
Rear View後ろからの視点
Look at Viewer視聴者を見る視点
Panoramic Viewパノラマ視点

このほか○○angleも有効です。

ただし、低い視点のアングルは生成ではじかれる場合があります。

また○○poseやKnee up などはポーズに直結するプロンプトです。

Standing Pose立ち姿勢
Sitting Pose座り姿勢
Crouching Poseしゃがみ姿勢
Lying Down Pose横たわり姿勢
Reclining Pose寝そべり姿勢
Jumping Poseジャンプ姿勢
Running Pose走り姿勢
Leaning Poseもたれる姿勢
Cross-legged Pose脚を組む姿勢
Hands on Hips手を腰に
Arms Crossed腕を組む
Hand Raised手を挙げる
Looking Over Shoulder肩越しに見る
Pointing指差す
Bowingお辞儀をする

キャラクターの前後にこれらを付けることで、より鮮明にキャラクターが描かれます。

表情や人体パーツのプロンプト

表情や人体パーツに関しては細かい指定も可能です。

唯一難しいのが左右に関する指定で、こちらはランダムになる可能性が高いですがそれ以外はある程度操ることができます。

例えば瞳であれば「ツリ目」や「金色の目」といった形や色の表現が適当です。

Almond Eyesアーモンドアイ
Round Eyes丸い目
Slanted Eyes斜めの目
Hooded Eyesフード付き目(上瞼が重たい目)
Monolid Eyes一重まぶた
Upturned Eyesツリ目
Downturned Eyesたれ目
Wide-set Eyes離れ目
Close-set Eyes近眼(目が近い)
Deep-set Eyes深窓の目(奥二重の目)

髪型の入力なども有効になります。

Short Hairショートヘア
Long Hairロングヘア
Curly Hairカーリーヘア
Straight Hairストレートヘア
Ponytailポニーテール
Bunまとめ髪(バン)
Braided Hair編み込みヘア
Mohawkモヒカン
Bob Cutボブカット
Layered Hairレイヤードヘア
Side Partサイドパート
Buzz Cutバズカット
Pixie Cutピクシーカット
Undercutアンダーカット
Side Swept Bangsサイドスウェプトバング

髪型は肩まで、腰まで、などの指定も有効です。

その他体型などもあります。

Slimスリム
Athleticアスレチック
Muscular筋肉質
Curvy曲線美
Pear-shaped梨型
Apple-shapedりんご型
Hourglassアワーグラス型
Plus-sizeプラスサイズ
Petiteプチ
Tall高身長
Short低身長
Stockyがっしりとした
Leanリーン(細身だが筋肉質)
Lankyガリガリ

こちらは指定しすぎると全体に影響を及ぼすので、雰囲気のみの指定でもよいでしょう。

[A ○○ Girl]などで適用できます。

小物のプロンプト

人物の身につけているものを指定する際は、[with ○○]などの表現にするか、個別に設定してあげるのが望ましいです。

ただし、Watchのような場合は解釈が変わる可能性があるので十分に注意しましょう。

職業と小物を併記することで、より具体的な描写になる場合もあります。

Smartphoneスマートフォン
Earringsイヤリング
Watch腕時計
Braceletブレスレット
Necklaceネックレス
Ring指輪
Sunglassesサングラス
Wallet財布
Keychainキーホルダー
Backpackリュックサック
Beltベルト
Hat帽子
Scarfスカーフ
Gloves手袋
Handbagハンドバッグ

単語はでAIの想像力を活用する

これらの単語はほんの一例です。

シチュエーションを感じさせる言葉。色合いを感じさせる言葉、活発さを感じさせる言葉。

沢山の単語の連なりによって画像生成は成り立っています。

Beachと書けば水着が出やすくなりますし、Officeと書けばスーツが出やすくなります。

大事なのはそれらの言葉がどの様に成り立ち、プロンプト内ではどのように解釈されるべきかというのを明瞭に伝えることにあります。

是非、自分だけの特異プロンプトを作ってみましょう。