Stable Diffusion XL 1.0 (SDXL 1.0) のインストール,画像生成(img2txt),画像変換(img2img),APIを利用して複数画像を一括生成(AUTOMATIC1111,Python,PyTorch を使用)(Windows 上)

要約】 AUTOMATIC1111 の Stable Diffusionは,テキストから画像を生成する機能等を有するWebUIを提供する.PythonとPyTorchを使用し,Windows上で動作し,GitHubからダウンロード可能である.インストール後はローカルホスト(http://127.0.0.1:7860)でアクセスし,学習済みモデルを選択して利用できる.また,AltCLIPを用いて多言語(日本語を含む)のテキストエンコーディングが可能である.これは,CLIPのテキストエンコーダを学習済みの多言語エンコーダXLM-Rに置き換えたものである.

目次

  1. 前準備
  2. AUTOMATIC1111 の stable-diffusion-webui のインストールと動作確認(Windows 上)
  3. バージョン 1.4 の学習済みモデルを使用
  4. AltCLIPを使用

関連する外部ページ

AUTOMATIC1111 の stable-diffusion-webui の GitHUb のページ: https://github.com/AUTOMATIC1111/stable-diffusion-webui

前準備

Build Tools for Visual Studio 2022 のインストール(Windows 上)

Build Tools for Visual Studio は,Visual Studio の IDE を含まない C/C++ コンパイラ,ライブラリ,ビルドツール等のコマンドライン向け開発ツールセットである。

以下のコマンドを管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。

REM VC++ ランタイム
winget install --scope machine --accept-source-agreements --accept-package-agreements --silent --id Microsoft.VCRedist.2015+.x64

REM Build Tools + Desktop development with C++(VCTools)+ 追加コンポーネント(一括)
winget install --id Microsoft.VisualStudio.2022.BuildTools ^
  --override "--passive --wait --add Microsoft.VisualStudio.Workload.VCTools --includeRecommended --add Microsoft.VisualStudio.Component.VC.Llvm.Clang --add Microsoft.VisualStudio.ComponentGroup.ClangCL --add Microsoft.VisualStudio.Component.VC.CMake.Project --add Microsoft.VisualStudio.Component.Windows11SDK.26100"

--add で追加されるコンポーネント

上記のコマンドでは,まず Build Tools 本体と Visual C++ 再頒布可能パッケージをインストールし,次に setup.exe を用いて以下のコンポーネントを追加している。

インストール完了の確認

winget list Microsoft.VisualStudio.2022.BuildTools

上記以外の追加のコンポーネントが必要になった場合は Visual Studio Installer で個別にインストールできる。

Visual Studio の機能を必要とする場合は、追加インストールできる。

Python 3.12 のインストール

以下のいずれかの方法で Python 3.12 をインストールする。

方法1:winget によるインストール

Python がインストール済みの場合、この手順は不要である。管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install -e --id Python.Python.3.12 --scope machine --silent --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 AssociateFiles=1 InstallLauncherAllUsers=1"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

方法2:インストーラーによるインストール

  1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
  2. ダウンロードしたインストーラーを実行する。
  3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
  4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

インストールの確認

コマンドプロンプトで以下を実行する。

python --version

バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

Git のインストール

以下のコマンドを管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。管理者権限は、wingetの--scope machineオプションでシステム全体にソフトウェアをインストールするために必要となる。

REM Git をシステム領域にインストール
winget install --scope machine --id Git.Git -e --silent --accept-source-agreements --accept-package-agreements
REM Git のパス設定
set "GIT_PATH=C:\Program Files\Git\cmd"
for /f "skip=2 tokens=2*" %a in ('reg query "HKLM\SYSTEM\CurrentControlSet\Control\Session Manager\Environment" /v Path') do set "SYSTEM_PATH=%b"
if exist "%GIT_PATH%" (
    echo "%SYSTEM_PATH%" | find /i "%GIT_PATH%" >nul
    if errorlevel 1 setx PATH "%GIT_PATH%;%SYSTEM_PATH%" /M >nul
)

関連する外部ページ

Build Tools for Visual Studio 2022,NVIDIA ドライバ,NVIDIA CUDA ツールキット 11.8,NVIDIA cuDNN 8.9.7 のインストール(Windows 上)

サイト内の関連ページNVIDIA グラフィックスボードを搭載しているパソコンの場合には, NVIDIA ドライバNVIDIA CUDA ツールキットNVIDIA cuDNN のインストールを行う.

関連する外部ページ

AUTOMATIC1111 の stable-diffusion-webui のインストールと動作確認(Windows 上)

AUTOMATIC1111 の stable-diffusion-webui の GitHUb のページ: https://github.com/AUTOMATIC1111/stable-diffusion-webui

  1. 以下の手順を管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。
  2. Stable Diffusion web UI(AUTOMATIC1111版) のダウンロード
    cd /d c:%HOMEPATH%
    rmdir /s /q stable-diffusion-webui
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
    
  3. 動作確認のため,コマンドプロンプトで,webui-user.bat を実行
    cd /d c:%HOMEPATH%
    cd stable-diffusion-webui
    webui-user.bat
    

    エラーメッセージが出ていないことを確認.

  4. このときの表示に従い,Web ブラウザで,http://127.0.0.1:7860 にアクセス
  5. 画面が開く.

    右上のメニューでは,学習済みモデルを選ぶことができる. 2023年6月時点では,インストール直後に,V1-5-pruned-emaonly,safetensorsを選ぶことができる.

  6. 英語の文章を入れて,「Generate」をクリック.結果を確認.
    日本語の文章を使いたい場合には,下の「動作確認(AltCLIPを使用)」を参考にしてください.

バージョン 1.4 の学習済みモデルを使用

  1. CompVis/stable-diffusion-v-1-4-original で公開されている重み(weight) のファイルをダウンロード

    Web ブラウザで次のページを開き,「sd-v1-4.ckpt」をダウンロード

    https://huggingface.co/CompVis/stable-diffusion-v-1-4-original

  2. 先ほどダウンロードした sd-v1-4.ckpt を %HOMEPATH%stable-diffusion-webui\models\Stable-diffusion の下にコピー
  3. Windows で,管理者権限コマンドプロンプトを起動(手順:Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」)。
  4. コマンドプロンプトで,webui-user.bat を実行
    cd /d c:%HOMEPATH%
    cd stable-diffusion-webui
    webui-user.bat
    
  5. このときの表示に従い,Web ブラウザで,http://127.0.0.1:7860 にアクセス
  6. 英語の文章を入れて,「Generate」をクリック.結果を確認.
    日本語の文章を使いたい場合には,下の「動作確認(AltCLIPを使用)」を参考にしてください.

AltCLIPを使用

AltCLIP の説明

AltCLIP の特徴は, CLIP のテキストエンコーダ (text encoder) を 学習済みの多言語のテキストエンコーダ XLM-R で置き換えたこと.

文献

Zhongzhi Chen, Guang Liu, Bo-Wen Zhang, Fulong Ye, Qinghong Yang, Ledell Wu, AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities, arXiv:2211.06679, 2022.

  1. AUTOMATIC1111 の Wiki のページを開く.

    https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features#stable-diffusion-20

  2. Alt-Diffusion の下の「Download」をクリック
  3. safetensorsのファイルと, yamlrのファイルをダウンロード
  4. 先ほどダウンロードした 2つのファイルを %HOMEPATH%stable-diffusion-webui\models\Stable-diffusion の下にコピー
  5. Windows で,管理者権限コマンドプロンプトを起動(手順:Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」)。
  6. コマンドプロンプトで,webui-user.bat を実行
    cd /d c:%HOMEPATH%
    cd stable-diffusion-webui
    webui-user.bat
    
  7. このときの表示に従い,Web ブラウザで,http://127.0.0.1:7860 にアクセス
  8. checkpoint のタブで確認できる.
  9. 文章を入れて,「Generate」をクリック.結果を確認.

    日本語でも動くようです.