ChatGPT・ DALL-E(ダリ)の画像編集が可能に!

AI_活用術
xr:d:DAGBVUo1RNQ:9,j:5617538318532922549,t:24040306
この記事は約4分で読めます。

先日、ChatGPTの画像生成AI DALL-E公式ブログで、画像編集が可能になるというアップデートが発信されました。
従来のDALLEでは、生成された画像が思い通りでない場合、他のソフトで加工したり、何度も何度もプロンプトを磨き上げ理想の画像までもっていたり、という経験から、加工が可能になるというのは、大変嬉しい情報です。

そのアップデートについて具体的にみていきます。

※4月10日 追記:実際に試してみた!

関連記事:DALL-E3に直接プロンプトを入力する方法【ChatGPT】

DALL·E editor interface(ダリエディターインターフェイス)で編集!

公式サイトで冒頭に説明されている変更点は以下。

編集したいエリアを選択し、変更したいイメージをプロンプトに。選択したいエリアは、画面上にある選択のボタンを使わず、チャットで指示することも可能です。

https://help.openai.com/en/articles/9055440-editing-your-images-with-dall-e

画像の右上に編集用ボタンが追加される予定です。
尚、ブログで紹介されているサンプルイメージは「浮世絵の漫画スタイルの猫」となっています。背後の歌舞伎猫も大変歌舞伎らしい表情で秀逸です。

ペンがくるっと回っているボタンが選択用。これで選択し、強調したい部分を選択する事ができます。
実際に加工する範囲よりも広域に選択する事をお勧めすると記載されています。

左上のスライダーでサイズの変更が可能です。また左右対称の矢印ボタンで、元に戻す、取り消しが行えます。

DALL·E(ダリ)エディターインターフェイスで画像の要素追加

遂に来ました。プロンプトで画像編集です。

浮世絵猫の背後を選択し「桜を追加」と記載。サンプルは英語ですが、DALLEは、一度日本語を英語に翻訳した方が精度が高いのは変わらずだと考えられます。

ダリから梅のような満開の桜の追加とともにテキストが返ってきました。

ダリ曰く「桜をあしらいつつ、浮世絵とコミックスタイルの融合を補完する鮮やかな季節の美しさを加えてこのシーンを華やかにしました」

創意工夫もしてくれるのですね!

要素を消してしまうmagicもテキストで容易にできます。

DALLEの本領発揮!表情を変えてしまう!

猫の表情をハッピーに、という至ってシンプルなプロンプトを入力すると・・・

見事な笑顔です!!!

後ろの歌舞伎表情の猫との表情のコントラストが実に見事になりました!

DALLE editor interface (ダリエディターインターフェイス)が始動!試してみた

4月上旬、画像編集機能がアップデートされたので実際に試してみました。

テキストの指示を入れるウインドウの上にスタイルとアスペクトを入力する画面があります。
こちらもさりげなく先にアップデートされていました。
上記の通り、スタイルにポインターを合わせるとサンプルが表示されます。浮世絵、アニメ、ゴシック、クリスタル、夕焼け、魚眼レンズ、等豊富な選択肢ですが、表示されているもの以外を選びたい場合、矢印二つがクロスされたボタンをクリックすると他の選択肢が表示されます。

アスペクトは、縦、横、正方形の3択です。

取り急ぎ、公園にいるかわいい犬、35ミリフィルム調、横長で指示を出してみます。

かわいい2匹の犬が登場しました。スタイルが指定できるようになり従来のテキストでの指示から大幅に表現の幅が広がっている事は明らかです。
編集したい方の画像をクリックで編集画面になります。

かわいらしいドギーで背景も消したいところもないので、ワンコをコピぺしてみることにしました。

するとなんてことでしょう。。。

異なる犬種となって2匹になりました。希望はかなっていますが、前の子犬が消えてしまったのは残念です。

コピペは、アップデートでできるようになることに含まれていなかった為、アップデートでできる事となっていた消しゴム機能を試してみました。

分かりやすくお花を選択。消します。

見事になくなりました。

アップデートでは「選択範囲の削除、追加、変更」が可能だとなっていました。コピペもできそうなものですが姿が変わってしまった為、素直に要素の追加を試してみます。

選択し、チワワを追加、と指示してみます。

なるほど、美しい背景に溶け込むチワワの姿が。

しかし確かに要素の追加できました。

これまでのDALLEでは同じ顔の生成ができない為、背景等を変えたい場合、また一から新しい容姿のキャラクターに再会するしかなかったなか、表情が変えられる、不要なものが消せる、追加できるとなると、シンプルなプロンプトで生成された画像をカスタマイズできるので、何度もプロンプトを練ってみる事が不要に。

複数のスタイルが追加されたことで、DALL-Eで生成された画像が従来よりも表情豊かにもなっています。

画像の編集も、スタイルによってどういう編集なら可能なのか、違いがありそうです。
勝ちパターンを探し、何度もチャレンジしたくなります。

以前よりあきらかに仲良くなりやすいDALL-Eへと進化したように思います。