catch-img

【Stable Diffusion Web UI】VAEの使い方

この記事では、Stable Diffusion WebUIのVAEの使い方について紹介しています。


目次[非表示]

  1. 1.Stable Diffusionとは
  2. 2.Stable Diffusion Web UI(AUTOMATIC1111版・Forge版)とは
  3. 3.VAEとは
  4. 4.VAEの種類
  5. 5.VAEの設定方法
  6. 6.VAEファイルのダウンロード
    1. 6.1.Hugging FaceからVAEをダウンロード
  7. 7.VAEファイルを格納する
    1. 7.1.Windows・Mac・GPUSOROBANの場合
    2. 7.2.Google Colabの場合
  8. 8.Stable Diffusion Web UIでVAEの設定をする
  9. 9.VAEを使って画像生成
  10. 10.モデル指定のVAEを確認する方法
  11. 11.VAEを切り替える方法
  12. 12.もっと自由な画像生成を
  13. 13.まとめ


Stable Diffusionとは

Stable Diffusionは、無料で使える画像生成AIです。テキストを打ち込むと、それに応じた画像が生成されるしくみです。人物や動物、風景など、さまざまな画像を生成できます。

例えば、「サングラスをかけた猫」と入力するとそのような画像が生成されます。生成する画像のスタイルも多様でイラストや写真、水彩画やアニメ調など、自分の好きなテーマでAIに生成してもらうことができます。

sd-vae


Stable Diffusion Web UI(AUTOMATIC1111版・Forge版)とは

Stable Diffusion Web UI(AUTOMATIC1111)は、ブラウザを通じて手軽に画像生成を行える無料のWEBアプリケーションで、Google Chromeなどの主要なブラウザで利用できます。


プログラミングを一切必要とせず、WEB UIによる簡単なグラフィカルな操作が可能です。Stable Diffusion Web UIをローカルPCにインストールして使用する、もしくはクラウドサーバーにインストールして使用します。


sd-vae


Stable Diffusion Web UI(AUTOMATIC1111版・Forge版)に関する全般的な使い方については、以下の記事でまとめていますので、あわせてご覧ください。


  Stable Diffusion Web UIとは?ダウンロード・インストール・使い方 | 画像生成AI この記事では、画像生成AI Stable Diffusion WebUI(AUTOMATIC1111版・Forge版)のインストール・ダウンロード・使用する方法をまとめて紹介しています。 業界最安級GPUクラウド | GPUSOROBAN


VAEとは

VAE(Variational Auto Encoder)はオートエンコーダーと呼ばれ、入力データの圧縮と復元をするニューラルネットワークです。

VAEは、高次元の画像を低次元の潜在表現(ベクトル)という形に変換して、その後再び高次元の画像に変換するしくみです。画像生成AIでは非常に多くの計算をします。


高次元の画像をそのまま計算すると処理の量が多すぎて時間がかかるので、低次元の潜在空間(ベクトル)という形に変換をして、データサイズを圧縮し計算量を減らして処理をします。その後、潜在表現(ベクトル)から高次元の画像に戻して出力します。


Stable Diffusion Web UIで使われるVAEは、画像を鮮明にする効果があります。VAEを導入すると同じプロンプトでも画質が良くなり、色がくすんでいたり、暗かったり、ボヤけていたりする画像を鮮やかにしてくれます。

vae


VAEの種類

VAEはモデルと組み合わせて使用します。VAEの種類は2つあり、汎用VAEとモデル専用のVAEに分かれます。


汎用VAEは、Stability AI 社が公開している stabilityai/sd-vae-ft-mse はどのモデルでも使えるVAEです。一方の専用VAEは、特定のモデルと組み合わせて使用する専用のVAEで、他のモデルと組み合わせ仕様しても効果がありません。


VAEの設定方法

Stable Diffusion Web UIにVAEを設定する方法を説明します。

ここではStability AI社が公開している汎用VAEファイル「stabilityai/sd-vae-ft-mse-original」を設定していきます。


VAEファイルのダウンロード

VAEファイルは、Hugging Faceもしくは、Civitaiからダウンロードできます。


Hugging FaceからVAEをダウンロード

Huggigng Faceにアクセスし、メニューバーから[Models]をクリックします。

sd-vae


Modelsの[検索窓]に、“VAEファイル名”を入力し、抽出して表示したものをクリックして詳細ページに遷移します。この記事では”stabilityai/sd-vae-ft-mse-original”のVAEファイルを検索しています。

sd-vae


詳細ページに遷移したら[Files and versions]をクリックし、[vae-ft-mse-840000-ema-pruned.safetensors]の[ダウンロード]ボタンをクリックするとダウンロードが開始します。


VAEファイルの拡張子は、.ckptと.safetensorsの2つがありますが、より安全なsafetensorsを選択します。

sd-vae


VAEファイルを格納する

ダウンロードしたVAEファイルは次のフォルダに格納します。


Windows・Mac・GPUSOROBANの場合

[stable-diffusion-webui] > [models] > [VAE]のフォルダにVAEファイルを格納します。

※Forge版の場合は、
[stable-diffusion-webui-forge] > [models] > [VAE]のフォルダにVAEファイルを格納します。

sd-vae


短時間でアップロードしたい場合は、WinSCPやFileZillaを使ったファイル転送をおすすめします。


Windows PCをお使いの場合(WinSCP)

  WinSCPでWinodws PCからファイル転送 | GPUSOROBAN WinSCPを使ってローカル環境からGPUSOROBANのインスタンスへのファイル転送手順を解説しています。GPUSOROBANは低コストで高性能なGPUインスタンスを提供するクラウドサービスであり、詳細は公式サイトで確認できます 業界最安級GPUクラウド | GPUSOROBAN



Macをお使いの場合(FileZilla)

  FileZillaでMacからファイル転送する方法 | GPUSOROBAN この記事ではFileZillaを用いてローカル環境(Mac)からインスタンスへファイル転送する方法を解説しています。 業界最安級GPUクラウド | GPUSOROBAN


Google Colabの場合

コードセルでを次のコマンド実行します。

!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
※Forge版の場合は、以下のコマンドを実行します。

!git clone https://github.com/lllyasviel/stable-diffusion-webui-forge.git


VAEのディレクトリへ移動し、VAEをダウンロードします。

%cd /content/stable-diffusion-webui/models/VAE
!wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors
※Forge版の場合、以下のコマンドを実行します。

%cd /content/stable-diffusion-webui-forge/models/VAE
!wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors


※!wget横のhttps://xxxxは、VAEのダウンロードURLです。VAEによってダウンロードURLが異なりますので、ご注意ください。


ダウンロードURLの取得方法は以下のとおりです。


Hugging FaceのVAEダウンロードページにおいて、[Files and versions]タブを開きます。

[ダウンロード]ボタンにカーソルをあわせて、[右クリック]を押して、[リンクのアドレスをコピー]をクリックすると、ダウンロードURLを取得できます。

sd-vae


Stable Diffusion Web UIでVAEの設定をする

Stable Diffusion WebUIを起動し、[Setting]タブ から [VAE]をクリックします。

sd-vae


[SD VAE]の[更新]アイコンをクリックし、[プルダウンメニュー]から格納したVAEファイルが表示されていることを確認します。

この記事では、「vae-ft-mse-840000-ema-pruned.safetensors」が表示されているかを確認します。

sd-vae


同じページのサイドバーから[User interface]を開きます。

sd-vae


[Quicksetting list]に”sd_vae”と入力すると、候補に表示される[sd_vae]をクリックします。

sd-vae


[Apply Settings]をクリックして設定内容を保存し、続いて[Reload UI]をクリックしてWeb UIをリロードします。

sd-vae


リロード後、Web UIに[SD VAE]の項目が追加されていることがわかります。

[SD VAE]のプルダウンメニューを開き、設定したVAEファイルを選択します。

この記事では、「vae-ft-mse-840000-ema-pruned.safetensors」を選択します。

sd-vae


VAEを使って画像生成

上記の設定の状態で[txt2img]タブへ移行し、[Prompt]にテキストを入力し、[Generate]をクリックすると、VAEを反映した画像が生成されます。

sd-vae


モデル指定のVAEを確認する方法

Hugging Faceの場合、モデルをダウンロードするページの[Model card]に組み合わせて使うVAEが推奨されていることがあります。

sd-vae


Civitaiも同様にモデルをダウンロードするページにVAEの推奨が表示されていることがありますので、参考にしてみてください。

sd-vae


モデルの詳しい設定方法は以下の記事で解説しています。


  【Stable Diffusion Web UI】モデルの入れ方・使い方(Checkpoint) この記事では、Stable Diffusion WebUI(AUTOMATIC1111版・Forge版)のモデルの使い方について紹介します。 業界最安級GPUクラウド | GPUSOROBAN


VAEを切り替える方法

モデル変更に伴い、VAEを変更する際は以下の手順で切り替えることができます。

Stable Diffusion WebUIを起動し[SD VAE]の[更新]アイコンをクリックし、[プルダウンメニュー]から格納したVAEファイルの名前を選択します。

sd-vae


もっと自由な画像生成を

Stable Diffusionを実行する環境で、次のような悩みをお持ちではないでしょうか?

  • 画像生成が遅い
  • 使いたいGPUが使えない
  • GPUメモリ(VRAM)が足りない
  • ランタイムがリセットされる度にデータが消えるため、設定のやり直しが大変
  • 画像データのバックアップが面倒
  • Web UIの起動に時間がかかる
  • コンピューティングユニットの制限がストレス
  • 動作が不安定

制限を気にせず、高速かつ格安に画像生成がしたいなら、GPUクラウドサービス「GPUSOROBAN」がおすすめです。


  生成AIに最適なGPUクラウド「高速コンピューティング」|GPUSOROBAN GPUSOROBANの高速コンピューティングは、NVIDIAの高速GPUが業界最安級で使えるクラウドサービスです。NVIDIA A100を始めする高速GPUにより、画像生成AI、画像認識、機械学習を高速化します。 業界最安級GPUクラウド | GPUSOROBAN


まとめ

この記事では、Stable Diffusion Web UIにおけるVAEの使い方を紹介しました。VAEを使うことで、色のくすみやボヤけの解消ができ、鮮やかな画像を生成できます。

Stable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。


  Stable Diffusion Web UIとは?ダウンロード・インストール・使い方 | 画像生成AI この記事では、画像生成AI Stable Diffusion WebUI(AUTOMATIC1111版・Forge版)のインストール・ダウンロード・使用する方法をまとめて紹介しています。 業界最安級GPUクラウド | GPUSOROBAN


MORE INFORMATION

GPUでお困りの方はGPUSOROBANで解決!
お気軽にご相談ください

10日間無料トライアル
詳しい資料はこちら
質問・相談はこちら