金子邦彦研究室人工知能Windows でのインストールと動作確認(人工知能関係)AUTOMATIC1111 の stable-diffusion-webui のインストールと動作確認(Text to Image,イメージ・インペインティングその他)(Python,PyTorch を使用)(Windows 上)

AUTOMATIC1111 の stable-diffusion-webui のインストールと動作確認(Text to Image,イメージ・インペインティングその他)(Python,PyTorch を使用)(Windows 上)

Stable Diffusion のインストールと動作確認.

動作には,Python,PyTorch,NVIDIA CUDA ツールキットが必要.

目次

  1. 前準備
  2. AUTOMATIC1111 の stable-diffusion-webui のインストールと動作確認(Windows 上)
  3. 動作確認(バージョン 1.4 の学習済みモデルを使用)

関連する外部ページ

AUTOMATIC1111 の stable-diffusion-webui の GitHUb のページ: https://github.com/AUTOMATIC1111/stable-diffusion-webui

前準備

Git のインストール(Windows 上)

Windows での Git のインストール: 別ページ »で説明

関連する外部ページ

Git の公式ページ: https://git-scm.com/

Python のインストール(Windows 上)

Windows での Python 3.10,関連パッケージ,Python 開発環境のインストール: 別ページ »で説明

サイト内の関連ページ

Python のまとめ: 別ページ »にまとめ

関連する外部ページ

Python の公式ページ: https://www.python.org/

Build Tools for Visual Studio 2022,NVIDIA ドライバ,NVIDIA CUDA ツールキット,NVIDIA cuDNN のインストール(Windows 上)

Windows での Build Tools for Visual Studio 2022NVIDIA ドライバNVIDIA CUDA ツールキット 11.8,NVIDIA cuDNN v8.6 のインストールと動作確認: 別ページ »で説明

関連する外部ページ

PyTorch のインストール(Windows 上)

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. PyTorch のページを確認

    PyTorch のページ: https://pytorch.org/index.html

  3. 次のようなコマンドを実行(実行するコマンドは,PyTorch のページの表示されるコマンドを使う).

    次のコマンドは, PyTorch 2.0 (NVIDIA CUDA 11.8 用) をインストールする. 事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).

    PyTorch で,GPU が動作している場合には,「torch.cuda.is_available()」により,True が表示される.

    python -m pip install -U pip
    python -m pip install -U torch torchvision torchaudio numpy --index-url https://download.pytorch.org/whl/cu118
    python -c "import torch; print(torch.__version__, torch.cuda.is_available())" 
    

    [image]

AUTOMATIC1111 の stable-diffusion-webui のインストールと動作確認(Windows 上)

AUTOMATIC1111 の stable-diffusion-webui の GitHUb のページ: https://github.com/AUTOMATIC1111/stable-diffusion-webui

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. Stable Diffusion web UI(AUTOMATIC1111版) のダウンロード
    cd %HOMEPATH%
    rmdir /s /q stable-diffusion-webui
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
    

    [image]
  3. コマンドプロンプトで,webui-user.bat を実行
    cd %HOMEPATH%
    cd stable-diffusion-webui
    webui-user.bat
    

    エラーメッセージが出ていないこと.

    [image]

動作確認(バージョン 1.4 の学習済みモデルを使用)

  1. CompVis/stable-diffusion-v-1-4-original で公開されている重み(weight) のファイルをダウンロード

    Web ブラウザで次のページを開き,「sd-v1-4.ckpt」をダウンロード

    https://huggingface.co/CompVis/stable-diffusion-v-1-4-original

    [image]
  2. 先ほどダウンロードした sd-v1-4.ckpt を %HOMEPATH%stable-diffusion-webui\models\Stable-diffusion の下にコピー

    [image]
  3. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  4. コマンドプロンプトで,webui-user.bat を実行
    cd %HOMEPATH%
    cd stable-diffusion-webui
    webui-user.bat
    

    [image]
  5. このときの表示に従い,Web ブラウザで,http://127.0.0.1:7860 にアクセス
  6. 英語の文章を入れて,「Generate」をクリック.結果を確認.
    日本語の文章を使いたい場合には,下の「動作確認(AltCLIPを使用)」を参考にしてください.

    [image]

動作確認(AltCLIPを使用)

AltCLIP の説明

AltCLIP の特徴は, CLIP のテキストエンコーダ (text encoder) を 学習済みの多言語のテキストエンコーダ XLM-R で置き換えたこと.

文献

Zhongzhi Chen, Guang Liu, Bo-Wen Zhang, Fulong Ye, Qinghong Yang, Ledell Wu, AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities, arXiv:2211.06679, 2022.

  1. AUTOMATIC1111 の Wiki のページを開く.

    https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features#stable-diffusion-20

  2. Alt-Diffusion の下の「Download」をクリック

    [image]
  3. safetensorsのファイルと, yamlrのファイルをダウンロード

    [image]
  4. 先ほどダウンロードした 2つのファイルを %HOMEPATH%stable-diffusion-webui\models\Stable-diffusion の下にコピー

    [image]
  5. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  6. コマンドプロンプトで,webui-user.bat を実行
    cd %HOMEPATH%
    cd stable-diffusion-webui
    webui-user.bat
    

    [image]
  7. このときの表示に従い,Web ブラウザで,http://127.0.0.1:7860 にアクセス
  8. checkpoint のタブで確認できる.
  9. 文章を入れて,「Generate」をクリック.結果を確認.

    日本語でも動くようです.

    [image]