ネガティブプロンプトの効果
「Stable Diffusion」のtxt2imgで生成される画像は、ポジティブプロンプトだけでなく、ネガティブプロンプトによっても多大な影響を受けます。ネガティブプロンプトの書き方は色々と悩ましいところですが、簡単に組み込める方法のひとつとして、「Txtual Inversion」があります。その効果の確認を行ってみました。テスト環境は「Stable Diffusion web UI(AUTOMATIC1111版)」です。
2.5次元系マージモデル「BlueberryMix」
2.5次元系マージモデルの「BlueberryMix」を使って、「Txtual Inversion」の効果を確認してみます。
リンク先:https://civitai.com/models/14323/blueberrymix
ネガティブプロンプトの「Txtual Inversion」
確認に使用するのは次の4種類になります。「《インストール先》\webui\embeddings」のフォルダにダウンロードして使用します。
- Nerfgun3/bad_prompt
- Nerfgun3/bad_prompt_version2
- embed/EasyNegative
- FapMagi/ng_deepnegative_v1_75t
テスト用のプロンプト初期設定値
「BlueberryMix」サイトの説明文にある推奨値を参考に初期設定します。プロンプトをポジティブプロンプト欄に貼り付け、「青いタンクトップを着た10代の少女」が生成されるようにプロンプトを書き足します。
ポジティブプロンプト
best quality, masterpiece, ultra high res, photorealistic, portrait of teenage 1girl, blue tank top |
ネガティブプロンプト
(low quality, worst quality:1.4) |
ネガティブプロンプトなし
まず最初は、デフォルトとなるポジティブプロンプトのみ。「X/Y/Z plot」で「X」にステップ数は4刻みで24~48、「Y」にシード値を、1297668241~1297668244にセットしました。
デフォルトプロンプト
ネガティブプロンプトに「(low quality, worst quality:1.4)」を入れて生成します。これだけでグッと日本人らしくなりました。
bad_prompt
「(low quality, worst quality:1.4)」に「Txtual Inversion」として「bad_prompt」を加えてみます。だいぶ雰囲気が変わりました。
bad_prompt_version2
「bad_prompt_version2」に差し替えてみます。色々なところが増強しています。
EasyNegative
「EasyNegative」に差し替えてみます。また別の雰囲気になります。
ng_deepnegative_v1_75t
「ng_deepnegative_v1_75t」に差し替えてみます。日本人らしさが少し薄れました。
全部入り
試しに全部入りでもテストしてみました。多く適用したからといって、とびきり良くなるわけではなさそうです。
サンプラーによる違い
おまけとして、サンプラーによる違いも試してみました。個人的にはやはり推奨の「DPM++ 2M Karras」が相性良さそうです。
本日の成果
プロンプト少し調整して、ランダムシードで生成。
コメント