Stable Diffusion web UIの機能拡張がいろいろと出ています。
Stable Diffusion web UIの機能拡張の使い方
Stable Diffusion web UIを自機にインストールすれば、Stable Diffusionを簡単に扱えるようなりました。
さらにそれ用のいろんな機能拡張がリリースされています。まさに日進月歩でどんどん使い勝手がアップしています。
機能拡張はこちらからチェックできます。
Extensions · AUTOMATIC1111/stable-diffusion-webui Wiki (github.com)
インストールその1
一番簡単なインストール方法です。
まず「Extensions」タブ、「Available」タブへ移動。
パラメータの変更とかはせずにそのまま「Load from」ボタンを押します。
これだけでインストール可能な機能拡張の一覧が出てきます。
あとはお目当ての機能拡張の「Install」を押してしばし待ちます。
インストールその2
リストにない場合は「Extensions」タブ>「Install form URL」タブへ移動。GitなどのURLを入れてから「Install」を実行します。
Installing...が終わってリストから消えれば完了です。
インストールその3
Githubから手動でダウンロード。
WebUI>Stable-diffusion-webui>extensionsタブ内へコピーします。
インストール後は「Installed」タブを押してインストールされた機能拡張の一覧をチェックできます。
機能拡張が使えない?
インストール後は「Apply and restart UI」でリスタートさせます。
手動でWebUIをリスタートさせても大丈夫です。
スクリプトを使う
一般的にはWebUIのtxt2img、img2imgの下の方にScript欄があります。
インストール済の機能拡張を選択します。
生成すると、通常版に加え、スクリプトを経由した出力も出てきます。
Stable Diffusion web UIのおすすめ機能拡張は?
入力
ポーズを指定
posex
https://github.com/hnmr293/posex
3次元空間でopenposeの図形を動かすことができる拡張機能です。
OpenPose Editor
https://github.com/fkunn1326/openpose-editor
複数のポーズキャラクターを追加したり、画像からポーズを検出し、PNGに保存したり、コントロールネットの拡張機能に送信することができます。
画像でポーズを指定
ControlNet
GitHub - Mikubill/sd-webui-controlnet: WebUI extension for ControlNet
ポーズ画像を渡すことで、同じようなポーズの画像を生成してくれます。
モデルファイルは以下から入手できます。
webui/ControlNet-modules-safetensors at main (huggingface.co)
入手後は「webUI\stable-diffusion-webui\extensions\sd-webui-controlnet\models\」フォルダに。
アニメーションGIFの入力
gif2gif
LonicaMewinsky/gif2gif: Automatic1111 gif extension (github.com)
アニメーションGIFファイルを入力に使い、生成されたアニメーションGIFとして出力しなおします。
プロンプト
プロンプト翻訳
Prompt Translator
https://github.com/butaixianran/Stable-Diffusion-Webui-Prompt-Translator
DeeplやBaiduを使ってプロンプトを英語に翻訳。
プロンプト作成支援
Prompt Generator
https://github.com/imrayya/stable-diffusion-webui-Prompt_Generator
特定範囲の加工
指定範囲のディテール
LLuL
GitHub - hnmr293/sd-webui-llul: LLuL - Local Latent upscaLer
領域を指定して、ディテールを強調することができます。
プロンプト適用範囲を変更
Latent Couple extension
https://github.com/opparco/stable-diffusion-webui-two-shot
指定領域ごとにプロンプトを指定できる機能拡張。
これによって絵柄をかえたり、キャラクターの感じを変更することができます。
ブロック別プロンプト
Dump U-Net
hnmr293/stable-diffusion-webui-dumpunet (github.com)
使い方が日本語であるのは便利
Stable DiffusionのU-Netでブロックごとに異なるプロンプトを与えて画像生成する(ブロック別プロンプト)|Kohya S.|note
出力
背景削除
ABG_extension
GitHub - KutsuyaYuki/ABG_extension
背景除去ツール。
色範囲制限
Cutting Off Prompt Effect
hnmr293/sd-webui-cutoff: Cutoff - Cutting Off Prompt Effect (github.com)
色映りを防ぐ機能拡張。
線画
LoRA
https://civitai.com/models/16014/anime-lineart-style
線画で出力可能。
ドット絵
Pixelization
https://github.com/AUTOMATIC1111/stable-diffusion-webui-pixelization
ドット絵のように粗いピクセルを生成。
モザイクをかけたようなジャギーのある絵柄に変換。
ビデオ生成 ebsynth_utility
ebsynth_utility
https://github.com/s9roll7/ebsynth_utility
img2imgとebsynthを使って動画を作成するための拡張機能です。ControlNetエクステンションと連動。
動画右側がebsynth_utilityを使用。
ビデオ生成 ModelScope
ModelScope
deforum-art/sd-webui-modelscope-text2video: Auto1111 extension consisting of implementation of ModelScope text2video using only Auto1111 webui dependencies (github.com)
利用方法は以下。
パノラマ作成
txt2imgでパノラマを生成。
MultiDiffusion with Tiled VAE
作成中の画面も保存
Save Intermediate Images
https://github.com/AlUlkesh/sd_save_intermediate_images
AIが完成品を作るまでの過程も保存してくれます。
DepthMap
depthmap2mask
https://github.com/Extraltodeus/depthmap2mask
Depth Maps
DepthMapを作成。
Web UIのカスタマイズ
バイリンガル化
Bilingual Localization
https://github.com/journey-ad/sd-webui-bilingual-localization
バイリンガル翻訳で、ボタン探しも簡単に。
プリセットを作成
Preset Utilities
https://github.com/Gerschel/sd_web_ui_preset_utils
WebUIのプリセットを作成、カスタマイズ。
出力設定のプリセットを作成
Config-Presets
GitHub - Zyin055/Config-Presets: Extension for Automatic1111
どういうサイズで出力するか、など自分好みの初期設定を作りプルダウンから選択可能に。
システム情報タブを追加
System Info
https://github.com/vladmandic/sd-extension-system-info
システム情報というタブを追加し、メモリなどをチェックできるようになります。
Web UIのスキン
キッチンテーマ
Kitchen Theme
https://github.com/canisminor1990/sd-web-ui-kitchen-theme
WebUI用スキン。
カプチーノテーマ
https://github.com/catppuccin/stable-diffusion-webui
パステル調のWebUIスキン。