top of page
  • 執筆者の写真香月葉子

Mac用画像生成AIアプリ【DiffusionBee】(ディフュージョン・ビー)で写真レベルの画像を作るには | 呪文の付録付き

更新日:3月31日



なぜ【DiffusionBee】ひとつあれば何でも描けてしまうの?


 ついさきごろ、2023年の4月17日に、『画像生成AIアプリ【DiffusionBee】(ディフュージョン・ビー)徹底攻略 | 完全利用マニュアル』Mac のパーソナル・コンピュータをお使いの方たちのためにオフライン(スタンドアローン)で遊べる画像生成AIアプリ【DiffusionBee】を紹介させてもらいました。


 ここで、まず最初におことわりしておかなければいけないことがあります。

 この記事は、画像生成AIによるお絵描きを楽しんでみようとお考えの方たちだけを対象にしていますし、MacBook もしくは iMac などですでに【DiffusionBee】を使っておられる方たちだけのために書かれたものです。


 ですから、【DiffusionBee】って何、と首をひねられたお方は、これをお読みになる前に、どうか『画像生成AIアプリ【DiffusionBee】(ディフュージョン・ビー)徹底攻略 | 完全利用マニュアル』へお立ち寄りになってください。そして【DiffusionBee】アプリ本体をダウンロードなさったあと、リンク先から5種類のAIモデル用ファイルを読みこませて、すこしお遊びになったあとで、ふたたびこの記事をお開きになるのがいちばんだとおもいます。


 この【DiffusionBee】は、プログラムの根幹にある情報を無償で公開するというOpen Source(オープンソース)の理念でつくられた Stable Diffusion(ステイブル・ディフュージョン)が元になっているアプリですので、プログラム言語を自由自在にあやつることのできる方々がどんどん参入してきて、さまざまな画風を可能にするAIモデル用ファイルをお作りになって公開したり、このアプリ自体のアップグレード版を作成して公開したりしながら、これから先、その進化の加速は止まらなくなるでしょう。


 そのため、ただ「遊べる」だけのものでもなくて、たぶんデザイナやイラストレータの方々などの「お仕事」にもじゅうぶん応えることのできるアプリではないかと考えています。



 しかもスタンドアローンで動作するアプリですから、お書きになった呪文(プロンプト)の情報や、その他の設定情報が、ほかへ漏れたり、画像生成とは異なる目的のために使用されたりする危険性も、かなり少ないのではないかと考えられます。


 もしかしたら「これひとつでじゅうぶん」というアプリになるかもしれません。


 この記事では、前回の記事にたいする〈付録〉のようなカタチで、わたしがおすすめしたいAIモデル用ファイルのダウンロード先リンクをご紹介しながら、写真レベルに「ほんものそっくりの」美少女画像を生成させるための呪文(プロンプト)をご覧いただくつもりです。



Safetensors(セーフテンサーズ)ファイルが使えないのは Web UI 系の画像生成AIプログラムに比べて不利では?


 2023年の3月末あたりから、YouTube などのプラットフォームで、画像生成AIによる美少女画像集を多く見かけるようになりました。

 いくつか見せていただいたのですけれど、ほとんどの画像は、まるで現実に存在する女の子を写真撮影したかのようなフォトリアリズムで描かれたものが多いようです。

 いわゆる「アート」とはかけはなれた、わかりやすい、よりスピーディに快感原則を満足させる目的のために画像生成AIが使われています。


 たとえばCIVITAI(シヴィットエーアイ:シヴィタイ)にアクセスなさって、このような画像をごらんになったり、もしくはこのような画像にお気づきになったら、その意味がおわかりになるとおもいます。


 わたし自身、女の子が描かれている絵を見るのは好きだし、楽しいので、海外の評論家たちが指摘するように『PromptHero』『CIVITAI』などでは女性のポートレートばかりが多すぎる、という批判には返すことばもありません。


 わたしも読者のみなさんのお叱りを受ける女のひとりかもしれません。


 ただ、最近は極端に Photorealistic なものが増えているようで、画像生成AIを評価する場合にも、生成された画像がどれだけ「ほんものに近いか」とか「まるで実写そのもの」という特性ばかりが注目されているようにも見受けられます。


 スマホのおかげで、ふだんから写真を撮影することになれているわたしたちですから、たしかに「まるで写真みたい」な画像のほうが評価しやすいことはわかります。

 つまり、その評価の裏がわには「AI(人工知能)がここまで進化した」というおどろきがくっついているからだとおもいます。


 ですからわたしもみなさんにそういう「写真みたいな」画像を生成していただこうと考えました。


 その場合「まるでほんとうの写真だとしかおもえない」ような画像を生成するためにいちばん便利なのは「AUTOMATIC 1111版Stable Diffusion Web UI」というプログラムです。


 わたしの『【画像生成AI】との付き合い方とその可能性についてのメモ』を見ていただければおわかりのように、そのなかのいくつかの画像は「AUTOMATIC 1111版Stable Diffusion Web UI」というプログラムを使って生成したものです。

 そして、そういう画像を作るためのAIモデル用ファイルのなかで、いちばんよく知られていて、おそらくいちばんよく使われているものは【ChilloutMix】と呼ばれるフィイルではないでしょうか。

 なかでも特に【KoreanDollLikeness】というファイルが有名だとおもわれます。


 そのAIモデル用ファイルを使用して画像を生成させると、このようなものが出来上がります。


 それをごらんになって「【DiffusionBee】を使ったらわたしでもこういう画像を作れるのでは?」と期待なさった方がいらっしゃるかもしれません。


 でも、『画像生成AIアプリ【DiffusionBee】(ディフュージョン・ビー)徹底攻略 | 完全利用マニュアル』をお読みの方たちはご存知のように、たとえ【Hugging Face】の「Text-to-Image」のなかを検索なさって、【ChilloutMix】ファイルを見つけたとしても、いまご紹介した写真風画像を生成するためのモデル用ファイルはどれもこれも拡張子が〈.safetensors〉(セーフテンサーズ)ばかりです。

 そして残念なことに【DiffusionBee】は safetensors ファイルを読み込むことができません。

 読み込めるファイルは、いまのところ、拡張子が〈.ckpt〉と表記されたチェックポイントファイルだけです。


 でも、ご心配にはおよびません。

 たとえ〈.ckpt〉ファイルでも、下の例をごらんになったらおわかりのように、ちかごろ『hype(ハイプ)』(一時的流行)になっている可愛い日本人っぽい女の子の写真風画像は、とてもかんたんに生成させることができます。

 ほんのすこし呪文(プロンプト)をいじくれば済むことなのです。

 それでは、いまから Hugging FaceCIVITAI へアクセスして、いくつかのAIモデル用ファイルをダウンロードしてみましょう。

 わたしがおすすめしたい、とおもっていたものばかりですから、偏り(かたより)があるかもしれませんが、呪文(prompt)を工夫なさったら、かなり融通(ゆうずう)の効くものばかりです。



とても便利で楽しいAIモデル用ファイルをダウンロードしよう


①写真風画像を生成するためのAIモデル用ファイル

 おすすめのひとつは『Deliberate_v2』というファイルです。

 これを手に入れるために、まず Hugging Faceココへアクセスなさって、「↓ダウンロード」ボタンをクリックなさってください。

 自動的に落ちます。

『Deliberate_v2』という名称の〈.ckpt〉ファイルです。

 

 つぎにおすすめしたいのが、まさに『chilloutmix_koreanDoll』と呼ばれるファイルです。

 その〈.ckpt〉ファイルはココで手に入ります。

 じっさいに落としたファイル名は『chilloutmix_v10.ckpt』 になっているとおもいます。


 けれども、もっとも『ChilloutMix』の[KoreanDollLikeness]の画像に近いものを生成してくれるのは、おそらく『dilmurat_Real』というファイルではないでしょうか。

 CIVITAIでのダウンロード先はココです。

 もしも、このページの青色「↓download (1.99GB) 」ボタンをクリックなさって〈.ckpt〉ファイルのかわりに〈.yaml〉ファイルがダウンロードされはじめたとしたら、まず【CIVITAI】のアカウントを取得なさってから、もういちど試みてください。

 ちゃんと〈.ckpt〉ファイルがダウンロードできるとおもいます。


 ダウンロードなさったあとは『画像生成AIアプリ【DiffusionBee】(ディフュージョン・ビー)徹底攻略 | 完全利用マニュアル』でご説明したように『DiffusionBee』に読み込ませましょう

 この『dilmurat_Real』ファイルひとつでさまざまな写真風画像が作れます。そして〈.ckpt〉ファイルのなかでは、いまのところ、これがいちばん使い勝手が良いのではないかとおもいます。


②アニメ風画像を生成するためのAIモデル用ファイル

 このファイルは、Hugging Face のココへアクセスなさって、〈↓download〉をクリックなさったら、自動的に落ちます。

『ACertainThing』と呼ばれる〈.ckpt〉ファイルです。

 このような画像を生成できます。


 もうひとつは『SlimeX』と呼ばれるファイルで、おなじく Hugging Face のココへアクセスなさって、さきほどと同様に〈↓download〉をクリックなさったら、自動的に落ちます。

 つぎのような画像を作ってくれます。

 もう一種類のアニメ風画像用のファイルは『Counterfeit』と呼ばれるもので、Hugging Face のココへアクセスなさって〈↓download〉をクリックなさってください。

 自動的に落ちます。

 下のような画像を生成できます。



呪文(プロンプト)と秘文(ネガティヴ・プロンプト)をコピーして楽しもう


それでは、今回も、わたしの書いた呪文(じゅもん)と秘文(ひもん)をならべておきますので、どうぞご自由にお使いください。


➡︎『Option』 における設定は 【Resolution : 512 x 704】で【 Steps : 20】です。ほかはいっさいいじっていません。


まず最初に下の秘文(Negative Prompt)を貼りつけてください。


➡︎これは、いったん所定の場所に貼りつけてしまえば、たとえAIモデル用ファイルを切りかえたり、別の呪文を貼りつけたりした場合でも、ずっとこの秘文(ひもん)のままで問題はありません。


秘文(ネガティヴ・プロンプト)

low resolution, low quality, worst quality, blurred eyes and face, (cross eyed), (slanted eyes), unsharp, (extra fingers), (missing fingers), low detail, deformed body and limbs, disfigured face and fingers, extra limbs, ((extra fingers)), reddish eyes, extra digit, (monochrome), ((no blur)), (matte finish), text, letter




①ワンピース水着の女の子 | 高層ビルの屋上にある夜のスイミングプールで

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful chestnut eyes, inviting lips, extremely good-looking Japanese model, mid-length straight chestnut hair, pony tail, one piece swimsuit, sharp focus, intricate detail, swimming pool on the top of a building at night, gorgeous spot lights and city neon lights, dutch angle, god rays, photorealistic, cinematic, high resolution, (vivid color), kawaii, HD, 8k



②サイバーパンクの女の子 | 夜の未来都市でテディベアの耳をつけて

呪文(プロンプト)

masterpiece, high quality, portrait, extremely beautiful cyberpunk girl with beautiful brown clear eyes, detailed symmetrical eyes, extremely good-looking Japanese model, light brown pony tail with bear ear headband, looking at the viewer, kawaii, (proper fingers), (gorgeous black mechanical suit), creamy white skin, beautiful thighs, cyber city at night, gorgeous neon lights, intricate details, sharp focus, upper body, cinematic, highly detailed, high resolution, high contrast, high saturation, photorealistic, studio shot, dramatic lighting, dutch angle, kawaii, HD, 8k



③サイバーパンクの少女 | 大都会のなかで熊耳をつけて

呪文(プロンプト)

very pretty 12 year old cyberpunk girl with beautiful brown clear eyes, detailed symmetrical eyes and slim face, light brown pony tail with bear ear headband, looking at the viewer, kawaii, (proper fingers), (gorgeous black mechanical suit), creamy white skin, beautiful thighs, movie set, intricate details, sharp focus, upper body, cinematic, highly detailed, hyper resolution, photorealistic, studio shot, dramatic lighting, dutch angle, kawaii, genesis life mix, 8k



④ビキニ姿の女の子 | 真夏のスイミングプールで

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful chestnut eyes, half-open lips, short chestnut straight hair, bikini, beautiful thighs, sharp focus, intricate detail, gorgeous swimming pool, summer scenery, dutch angle, god rays, photorealistic, cinematic, high resolution, high contrast, (vivid color), kawaii, HD, 8k



⑤花柄模様のワンピース水着の女の子 | 真夏のスイミングプールで

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with pretty chestnut eyes, soft smile, long chestnut straight hair, one piece swimsuit with floral patterns, beautiful thighs, sharp focus, intricate detail, gorgeous swimming pool, summer scenery, dutch angle, god rays, photorealistic, cinematic, high resolution, (vivid color), model photo shot, kawaii, HD, 8k



⑥可愛らしい女子校生 | 真昼の街景色のなかで

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful chestnut eyes, inviting half-open lips, extremely good-looking Japanese model, mid-length straight chestnut hair, schoolgirl uniform, sharp focus, intricate detail, schoolyard, dutch angle, god rays, photorealistic, cinematic, high resolution, (vivid color), kawaii, HD, 8k



⑦可愛らしい女子校生 | 夜の都会のなかで

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful chestnut eyes, inviting lips, extremely good-looking Japanese model, mid-length straight chestnut hair, pony tail, sailor midi schoolgirl uniform, sharp focus, intricate detail, city street at night, neon lights, dutch angle, god rays, photorealistic, cinematic, high resolution, (vivid color), kawaii, HD, 8k



⑧ロングドレス姿の女の子 | 都会の街路で

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful chestnut eyes, half-open lips, extremely good-looking Japanese model, mid-length straight chestnut hair, long evening dress, sharp focus, intricate detail, city street, dutch angle, god rays, photorealistic, cinematic, high resolution, (vivid color), kawaii, HD, 8k



お好みの呪文を貼りつけてお楽しみください。


[注]

➡︎可愛い日本人っぽい女の子の写真風画像を生成させるためには『dilmurat_Real』をお選びになるのがいちばんかとおもわれます。つぎに『chilloutmix_v10』がおすすめです。もしも『Deliberate_v2』のAIモデル用ファイルをお選びになったときは、呪文のなかの「extremely good-looking Japanese model」という部分から「Japanese」という語を削除して、「extremely good-looking model」になさったほうが良いかもしれません。


➡︎ある特定のAIモデル用ファイル、たとえば『chilloutmix_v10』とか『ACertainThing』とか『SlimeX』などをお選びになったあと、上記の8種類の呪文のなかのどれかを使って画像をお作りになるときは、すくなくとも10回以上はその同じ呪文で画像を生成(Generate)なさることをおすすめします。

 たとえ、ちゃんと秘文(ネガティヴ・プロンプト)を読み込ませていたとしても、腕が3本になったり、指が6本になったり、足が溶けあったりするようなことは起こります。

 ガッカリなさらず、なんども〈Generate〉ボタンをクリックなさってください。

 画像生成AIが計算のプロセスをくりかえしていくうちに、しだいにみなさんが心のなかで思い描いている理想の画像に近いものが、ふいに生成される可能性も、かなり高くなるのではないかとおもいます。



[特別付録]

 AIモデル用ファイルの『chilloutmix_v10』もしくは『Deliberate_v2』を選択なさったときには、ぜひ、つぎの呪文(プロンプト)をお試しください。

 でも、あくまでも、いちばんのおすすめは『dilmurat_Real』です。


①ビキニの女の子 | 真夏のスイミングプールで

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful inviting almond-shaped eyes, defined dark eyebrows, seductive smile, extremely good-looking Japanese model, long straight chestnut hair, bikini, upper body, sharp focus, intricate detail, beautiful swimming pool, summer scenery, god rays, photorealistic, cinematic, (vivid color), kawaii, HD, 8k


②ビルディング屋上のボディスーツ姿の女の子

呪文(プロンプト)

masterpiece, best quality, portrait, beautiful girl with beautiful almond-shaped eyes, defined dark brown eyebrows, sweet smile, extremely good-looking Japanese model, short chestnut bob cut hair, black-lace bodysuit with gorgeous lacy bra, beautiful thighs, sharp focus, intricate detail, on the top of a building at night, cityscape, neon lights, dutch angle, god rays, photorealistic, cinematic, high contrast, high-quality saturation, ultra high resolution, (vivid color), kawaii, HD, 8k


③旅客機のなかの素敵な女性客室乗務員

呪文(プロンプト)

masterpiece, best quality, portrait, one beautiful female cabin crew with beautiful innocent chestnut eyes, detailed eyes and face, extremely good-looking Japanese model, chestnut bob cut hair, (proper fingers), (flight attendant uniform with matching pleated skirt), creamy white skin, beautiful thighs, airliner cockpit, intricate details, sharp focus, cinematic, highly detailed, hyper resolution, photorealistic, studio shot, dramatic lighting, dutch angle, kawaii, HD, 8k



[呪文の裏技]

①髪の毛

ご存知のように「short chestnut bob cut hair」は栗色のおかっぱ髪ですけれど、これを「long straight chestnut hair」に変えたりしてお遊びになってください。


たとえば「chestnut」(栗色)を「silver」や「brunette」や「light brown」や「platinum blonde」などにしてみるのも、おもしろいかも。


②上半身だけか下半身までか

海外のプロンプターが、どうしたら足まで見せることができるのか、という質問をして悩んでいるのを見かけたのですけれど、解決策はいたってシンプルです。


おもに腰から上だけを見せたい、とお考えでしたら「beautiful thighs」の代わりに「upper body」とお書きになってください。


膝下(ひざした)のあたりまで見せようかな、とお思いでしたら、おなじその2種類のプロンプトの代わりに「beautiful legs」をお入れになれば、「beautiful thighs」よりも、さらに下のほうまで見せることができるはずです。


海外の方たちがよく使う「half body」とか「full body」とか「whole body」などは指示言語としてはあまり効き目がないような気がします。


③微妙な感情表現は?

誘いかける雰囲気の目つきとか口もとを作りたい。もしくは清純な雰囲気なのだけれども、はっきりした意志を感じさせる表情をつくりたい。

こういう望みを実現するのがいちばんむつかしいかと思います。


たとえば「bewildered / baffled / confused」(とまどってる)とか「offended / angry」(怒ってる)など、さまざまな感情表現を ChatGPT などでお調べになってお使いになってみるのもいいかもしれません。


ただ、わたし個人の経験では、感情をあらわす抽象的な指示言語そのものにはたいして効果がない、というふうにおもっています。


感情は目もとと口もととの相関関係にあらわれるものですから、片方をいじくれば片方がへこんだり、片方をきわだたせると片方もきわだってきたり、など、さまざまです。


さまざまな形容詞で目を表現しながら、おなじく、さまざまな形容詞を唇や微笑の仕方などにお使いになって、片方を変えるともう一方はどうすればよいのか、など、おたがいの関係をさぐってみるのも楽しみのひとつかもしれません。



これらがDiffusionBee のAIモデル用ファイル『dilmurat_Real』によって生成された画像です。


prompt by Kazuki Yoko | generated by Diffusion Bee

prompt by Kazuki Yoko | generated by Diffusion Bee


prompt by Kazuki Yoko | generated by Diffusion Bee


prompt by Kazuki Yoko | generated by Diffusion Bee

prompt by Kazuki Yoko | generated by Diffusion Bee


prompt by Kazuki Yoko | generated by Diffusion Bee


prompt by Kazuki Yoko | generated by Diffusion Bee


prompt by Kazuki Yoko | generated by Diffusion Bee


prompt by Kazuki Yoko | generated by Diffusion Bee




【備考】

 AIに画像を生成させるための「プロンプト」を書くにあたり、人名はいっさい使っていません。

 ここでいう人名とは、画家、イラストレータ、建築家、各種のアーティストやデザイナ、漫画家、アニメ作家、アニメ制作会社や陶芸家などの名称にくわえて、映画監督や俳優やミュージシャンや著名人、そして一般人をふくめた、ネット上にデジタル化した画像(セルフィーなどの写真をふくむ)をアップロードしているであろう方たちすべてがふくまれます。

 また、現在のネット上に画像としてアップロードされている、あらゆる種類のプロダクトの作り手およびメーカーやブランドの名称(ポルシェ、Honda、ナイキ、VANS、アップル、シャネル、アンダーアーマー、資生堂、H&M、バレンシアガなど)についても同様に使用していませんし、これから先も使うことはありません。

 なお、絵画や芸術における流派(たとえば、印象派、ダダイズム、シュールレアリズム、未来派、ポップアート、コンセプチュアルアートなど)およびサイエンス・フィクションにおけるサブジャンル(たとえば、スティームパンクやサイバーパンクなど)については使用されていますし、これから先も使用する可能性はあります。


[Note]

When writing a "prompt" for AI to generate an image, no names of individuals are used.

By "names" here, it includes not only the names of artists, illustrators, architects, various artists and designers, cartoonists, anime creators, anime production companies, potters, etc., but also all individuals who have uploaded digitally converted images (including photos such as selfies) on the internet, including film directors, actors, musicians, celebrities, and the general public.

Additionally, names of makers, manufacturers, and brands of all types of products uploaded as images on the current internet (such as Porsche, Honda, Nike, VANS, Apple, Chanel, Under Armour, Shiseido, H&M, Balenciaga, etc.) are not used, nor will they be used in the future.

However, the names of artistic genres (such as Impressionism, Dadaism, Surrealism, Futurism, Pop Art, Conceptual Art, etc.) and of subgenres in science fiction (such as Steampunk and Cyberpunk) are currently being used and may be used in the future.





無断引用および無断転載はお断りいたします

All Materials ©️ 2021 Kazuki Yoko

All Rights Reserved.


Comments


bottom of page