「Stable Diffusion」のAI美少女生成における「Txtual Inversion」の効果確認

Stable Diffusion web UI

ネガティブプロンプトの効果

「Stable Diffusion」のtxt2imgで生成される画像は、ポジティブプロンプトだけでなく、ネガティブプロンプトによっても多大な影響を受けます。ネガティブプロンプトの書き方は色々と悩ましいところですが、簡単に組み込める方法のひとつとして、「Txtual Inversion」があります。その効果の確認を行ってみました。テスト環境は「Stable Diffusion web UI(AUTOMATIC1111版)」です。

2.5次元系マージモデル「BlueberryMix」

2.5次元系マージモデルの「BlueberryMix」を使って、「Txtual Inversion」の効果を確認してみます。

リンク先:https://civitai.com/models/14323/blueberrymix

ネガティブプロンプトの「Txtual Inversion」

確認に使用するのは次の4種類になります。「《インストール先》\webui\embeddings」のフォルダにダウンロードして使用します。

  • Nerfgun3/bad_prompt
  • Nerfgun3/bad_prompt_version2
  • embed/EasyNegative
  • FapMagi/ng_deepnegative_v1_75t

テスト用のプロンプト初期設定値

「BlueberryMix」サイトの説明文にある推奨値を参考に初期設定します。プロンプトをポジティブプロンプト欄に貼り付け、「青いタンクトップを着た10代の少女」が生成されるようにプロンプトを書き足します。

「BlueberryMix」サイトの説明文

ポジティブプロンプト

best quality, masterpiece, ultra high res, photorealistic, portrait of teenage 1girl, blue tank top

ネガティブプロンプト

(low quality, worst quality:1.4)

ネガティブプロンプトなし

まず最初は、デフォルトとなるポジティブプロンプトのみ。「X/Y/Z plot」で「X」にステップ数は4刻みで24~48、「Y」にシード値を、1297668241~1297668244にセットしました。

デフォルトプロンプト

ネガティブプロンプトに「(low quality, worst quality:1.4)」を入れて生成します。これだけでグッと日本人らしくなりました。

bad_prompt

「(low quality, worst quality:1.4)」に「Txtual Inversion」として「bad_prompt」を加えてみます。だいぶ雰囲気が変わりました。

bad_prompt_version2

「bad_prompt_version2」に差し替えてみます。色々なところが増強しています。

EasyNegative

「EasyNegative」に差し替えてみます。また別の雰囲気になります。

ng_deepnegative_v1_75t

「ng_deepnegative_v1_75t」に差し替えてみます。日本人らしさが少し薄れました。

全部入り

試しに全部入りでもテストしてみました。多く適用したからといって、とびきり良くなるわけではなさそうです。

サンプラーによる違い

おまけとして、サンプラーによる違いも試してみました。個人的にはやはり推奨の「DPM++ 2M Karras」が相性良さそうです。

本日の成果

プロンプト少し調整して、ランダムシードで生成。

コメント

タイトルとURLをコピーしました