無料プランでも制限付きで使えると聞いたのですが、最初なぜかChatGPTがそれを認知しておらず、無料版ではできませんと言われてしまいました。 それでもしつこく食い下がったら、「では試しにやってみましょうか」と言われ、実際にできたので本人(ChatGPT)が驚いていました。どんな作りになっているのか…。
実際にどのようなプロンプト(指示文)が画像生成エンジンに渡されているのかはわかりませんが、ChatGPTには日本語で伝えました。
向こうのほうから、「ここはどうしますか」などと、逆に訪ねてくることがあるので、補足を加えることもできます。
おおむね次のような指示内容でした。
まるで蒸気機関車が爆走しているように見える、黒い服を着た人のコミカルなイラスト。
短い煙突のような帽子をかぶり、おでこにはヘッドランプ。石炭が満載されたリヤカーを引いて、勢いよく外を走っている。汗だくで、体からは湯気が出ている。
従来の方法(拡散モデル)と違い、初めに全体のうすぼんやりとした構図が表示され、次に上から順番に幕が下りるように画像が生成されていきます。
1回目はこんな感じでした。特に具体的なイメージを持っていたわけではありませんが、ほぼ指示通りです。
リヤカーの立体構造や引き棒を正しく解釈しているわけではなさそうですが、Stable Diffusionのような従来のAIでハラハラする指の数や手の格好もまずまずでした。
ただ、この人の表情がちょっと辛そうなのが気になりまして(笑)、元気いっぱい・やる気満々で活力あふれた感じがよかったです。
翌日になって、セッションが1度切れてから、次のような追加リクエストを行いました。
辛そうな表情に見えず、やる気満々の挑戦的な表情で。
1日経ったからか、同じ画像の表情違いとはいえず、もしかしたら再作成になったのかもしれません。構図が裏返しになりましたが大体の感じは同じで、表情はかなり元気になりました。
従来のAIだと、前の絵をもとに修正したいと思っても、似ても似つかぬものになることが珍しくないので、意外によかったです(架空の絵柄にいいも悪いもないかもですが)。細部は色々とありますけども。
どちらも色がちょっと変とお感じかもしれませんが、オリジナルはセピア色の加工がされていたのを、私が無理やり白っぽくしたためです。
さて、それでは具体的に何か画像を生成したいかというと、私には特にないことに気づきますので、このへんで。
この機関車マンのフィギュアを作って、実際に走り回るようにしたら面白いかもしれませんが、難易度高そうです。子供泣くかもしれませんし。
最近ひたすら次の模型の3Dモデリングを続けていたので息抜きでした。
このページの画像: OpenAI GPT-4oにて作成、手動で色調とサイズを変更したもの