ComfyUI ユーザーガイド (Windows)
このガイドで学べること: ComfyUI Desktopのインストール、基本的な画像生成操作、ワークフローの読み込みと保存
前提知識: Windowsの基本操作ができること。プログラミングの知識は不要である。
【目次】
基礎知識
ComfyUIとは
ComfyUIは、AI画像生成のためのノードベースワークフローエディタである。ノード(処理単位)を接続することで、画像生成プロセスを構築する。従来のテキスト入力のみの生成ツールと異なり、各処理段階を個別に制御できるため、精密で再現性の高い結果を得られる。
ComfyUIでは、各機能を独立したブロック(ノード)として表現し、それらを線で接続して処理の流れを作る。例えば、「テキスト入力ノード」→「画像生成ノード」→「保存ノード」のように視覚的に処理手順を組み立てる。
AI画像生成の基本概念
- プロンプト: AIに与える文章指示。具体的な描写により意図した結果に近づく
- モデル(Checkpoint): 学習済みのAI。画風や品質を決定する
- ワークフロー: プロンプトから最終画像までの処理手順。ノードの組み合わせで構成される
- VAE(Variational Auto-Encoder): 画像の色彩や品質を決定する
前提条件
本ガイドを実行する前に、以下の要件を確認する。
- Windows 11
- NVIDIA GPU推奨(CPUのみでも動作するが、生成速度が低下する)
- 約15GB以上の空き容量(モデル追加時はさらに必要)
インストール手順
Step 1: ComfyUI Desktopのダウンロード
公式サイトからComfyUI Desktop for Windowsをダウンロードする。
https://docs.comfy.org/installation/desktop/windows
前準備: Pythonのインストール(任意)
ComfyUI Desktopは独自のPython環境を自動構築するため、この手順は通常不要である。システム全体でPythonを使用する場合や、他のPythonツールとの連携が必要な場合のみ実行する。
以下のコマンドを管理者権限のコマンドプロンプトで実行する
(手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。管理者権限は、wingetの--scope machineオプションでシステム全体にソフトウェアをインストールするために必要である。
Python 3.12 のインストール(Windows 上) [クリックして展開]
以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。
方法1:winget によるインストール
管理者権限のコマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。
winget install -e --id Python.Python.3.12 --scope machine --silent --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 AssociateFiles=1 InstallLauncherAllUsers=1"
--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。
方法2:インストーラーによるインストール
- Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
- ダウンロードしたインストーラーを実行する。
- 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから
pythonコマンドを実行できない。 - 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。
インストールの確認
コマンドプロンプトで以下を実行する。
python --version
バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。
ComfyUI のインストール
- インストール先に最低15GB程度の空き容量があることを確認する
- ダウンロードしたインストールパッケージファイルをダブルクリックする
- セットアップウィザードの終了画面が表示されたら「完了」をクリックする
- 「Get Started」と表示されたら「Get Started」をクリックする
- GPU選択画面が表示される。NVIDIAのグラフィックスボードがある場合は「NVIDIA CUDA」を、ない場合は「CPU」を選択し、「Next」をクリックする。NVIDIA CUDAを選択すると、GPUによる高速な画像生成が可能になる。
- インストール先はデフォルトのままで「Next」をクリックする
- 設定はデフォルトのままで「Install」をクリックする
- インストール中にPython環境の設定が自動で行われる
- インストール完了後、ComfyUI Desktopのサーバーが自動起動する
注意: 起動が途中で停止する場合は、ウイルス対策ソフトが干渉している可能性がある。ComfyUIフォルダを除外設定に追加する。
モデルの配置
モデルは画像生成の品質と画風を決定する。初回は必ずダウンロードが必要である。
- ComfyUI Desktopのワークフローテンプレート画面を確認する。インストール完了後、自動的にこの画面が表示される。
この画面が表示されていない場合は、左側のメニューから表示する。
- モデルを選択する
- 初回利用時はモデルがダウンロードされていないため、「ダウンロード」をクリックする。ダウンロード完了まで待機する
注意: モデルは容量が大きい(数GB〜十数GB)ため、ディスクの空き容量を確認する。モデルが複数表示された場合は、すべてダウンロードする。
モデルサイズの見方: 「8B」「14B」などの表記はパラメータ数(Bはbillion=10億)を示す。数値が大きいほど高品質だが、必要なGPUメモリも増加する。8Bを超えるモデルは、GPUメモリ8GB未満の環境では動作しない可能性がある。
モデルはComfyUI/models/checkpointsフォルダに配置される。
- 動作確認のため「実行する」を1回クリックし、結果を待つ
- 実行状況はマウスカーソルを合わせて確認できる
- 生成結果を確認する
- プロンプトを書き換えて再実行できる
注意: テンプレートによっては入力画像が必要なものがある。その場合は画像を設定してから実行する。
ComfyUI Manager
ComfyUI Managerは、カスタムノードやモデルの管理を行うツールである。新しい機能を追加する際に使用する。
基本操作
最初に試すべき操作: インストール完了後、デフォルトワークフローでプロンプトを変更し「実行する」をクリックする。これにより基本的な画像生成の流れを確認できる。
基本ワークフロー構造
ワークフローは、プロンプトから画像生成までの処理の流れを定義する。以下に標準的な構造を示す。
[テキスト入力] → [CLIP] → [プロンプト処理]
↓
[チェックポイント読み込み] → [モデル] → [ノイズ除去処理]
↓ ↓
[Empty Latent] → [潜在空間] → [KSampler] → [生成処理]
↓
[VAE] → [デコード] → [最終画像] → [保存]
各処理の役割:
- テキスト入力→CLIP: 文章を数値ベクトルに変換する
- Empty Latent: 生成する画像サイズの空白領域を準備する
- KSampler: ノイズから段階的に画像を生成する(通常20〜50ステップ)
- VAE: 数値データを実際の画像に変換する
UI要素
ComfyUI インターフェース:
1. [キュー(Queue)] ボタン(右上) - 生成実行
2. [ワークフロー(Workflows)] - ワークフロー管理
3. [Manager] ボタン - ノード管理
4. ワークフロー表示エリア - ノード配置場所
生成実行
「実行する」ボタンで画像生成を開始する。
操作手順:
- テキストプロンプトノードに生成したい内容を入力する
- 「実行する」ボタンをクリックする
- 進行状況が表示される。完了まで待機する(通常1〜5分)
プロンプト入力
ワークフロー内のテキストノードにプロンプトを入力する。英語で入力すると、より意図に近い結果が得られやすい。
パラメータ設定
生成結果を調整するための主要パラメータを以下に示す。
- Steps(ステップ数): 20〜30が標準。多いほど詳細になるが、過度に増やすと画像が不自然になる
- CFG Scale: プロンプトへの忠実度を制御する。値はモデルにより異なる
- Seed値: 同じ値で同じ結果を再現できる。-1でランダム生成
ワークフロー読み込み
「Workflows」ボタン→「Open」で読み込むか、画像やJSONファイルを直接ドラッグ&ドロップする。
注意: ワークフローが読み込めない場合は、必要なカスタムノードが不足している可能性がある。エラーメッセージで不足ノードを確認し、Managerからインストールする。
ワークフロー保存
メニューから保存またはエクスポートを行う。保存したワークフローは、同じ設定で再度画像を生成する際に使用できる。
実践応用
ワークフローテンプレートのアクセス方法
「Workflows」メニューから「テンプレートを参照」を選択する。テンプレートを使用すると、複雑なワークフローを一から作成する必要がなくなる。
標準搭載のワークフローテンプレート
基本的な画像生成:
- Text-to-Image: テキストから画像を生成する
- Image-to-Image: 既存画像を基に新しい画像を生成する
- Upscaling: 画像解像度を向上させる
画像編集:
- Inpainting: 画像の一部分を修正・再生成する
- Outpainting: 画像の外側を拡張する
- ControlNet: 構図やポーズを制御して画像を生成する
動画生成:
- Text-to-Video: テキストから動画を生成する
- Image-to-Video: 静止画から動画を生成する
3D生成:
- 3D Generation: 画像から3Dモデルを生成する
各テンプレートに必要なモデルは、Managerの「Install Models」から確認およびインストールできる。
高度な活用
技術的基盤
システム構成: ComfyUIはローカルWebサーバーとして動作する。Desktop版は8000番ポート、Portable版は8188番ポートでWebインターフェースを提供し、実際の処理はバックグラウンドのPythonプロセスで実行される。
依存環境: ComfyUIはPython環境とPyTorch(AI計算ライブラリ)に依存する。初回インストール時にこれらは自動構築される。AIライブラリとモデルファイルのため、大容量のディスク空間が必要となる。
モデルファイル: モデルファイルは数十億のパラメータを含む。safetensors形式はAIモデルの重みデータを格納する。「pruned-emaonly」は画像生成専用に最適化された軽量版である。
拡張機能: カスタムノードは既存機能を拡張する追加モジュールである。コミュニティが開発した特殊な処理(顔交換、3D生成など)を追加できる。ComfyUI Managerは依存関係を自動解決し、インストールを行う。
メモリ管理: AI画像生成は大量のGPUメモリを消費する。8GB未満のGPUでは、モデルを部分的にRAMに退避させる低VRAMモードが必要となる。処理速度は低下するが、限られたハードウェアでも動作可能となる。
ディレクトリ構造
ComfyUIのファイル構成を理解すると、モデルの手動追加やトラブルシューティングに役立つ。Desktop版では、インストール時に選択したフォルダ(basePath)の下に以下の構造が作成される。
<インストール先フォルダ>\
└── ComfyUI\ # ComfyUI本体
├── main.py
├── custom_nodes\ # カスタムノード
│ ├── ComfyUI-3D-Pack\
│ └── ...
├── models\ # AIモデル
│ ├── checkpoints\ # Stable Diffusionモデル
│ ├── loras\
│ └── embeddings\
└── output\ # 生成結果
インストール先フォルダの設定は %APPDATA%\ComfyUI\config.json の basePath で確認・変更できる。
ComfyUI 3D Packのインストール
3D生成機能を利用するには、ComfyUI 3D Packをインストールする。このパックにより、画像から3Dモデルを生成する機能が追加される。
- ComfyUI Desktopの「Manager」ボタンをクリックする
- 「Custom Node Manager」ボタンをクリックする
- 「3D」で検索し、「ComfyUI-3D-Pack」を選択する
- 内容を確認し、「install」をクリックする
- 画面の指示に従い、「restart」をクリックする
ComfyUI 3D Packの主なノード
- ComfyUI-3D-Pack(MrForExample製): 3D生成の総合パッケージ
- ComfyUI_3d_pose_editor: 3Dポーズ編集
- ComfyUI-Flowty-TripoSR: 単一画像からの3D再構築(ローカル実行、無料)
注意: Tripo AI社のクラウドAPI(Tripo 3D)を利用する場合はAPIキーの取得が必要であり、有償となる。ComfyUI-Flowty-TripoSRはオープンソースモデルをローカルで実行するため、無料で使用できる。
コミュニティワークフローの入手方法
コミュニティが作成したワークフローを利用すると、高度な画像生成を手軽に試すことができる。
主要プラットフォーム:
- ComfyWorkflows - https://comfyworkflows.com
- GitHub公式例 - https://github.com/comfyanonymous/ComfyUI_examples
トラブルシューティング
メモリ不足エラー
GPUメモリが不足すると、生成が失敗またはエラーで停止する。以下の対処法を試す。
- ComfyUI起動時に「--lowvram」オプションを追加する
- 生成解像度を512x512に下げる
- バッチサイズを1に設定する
ノードが表示されない場合
ComfyUI Desktopを再起動し、custom_nodes内のフォルダ構造および__init__.pyファイルの存在を確認する。
- カスタムノードのインストール失敗: Managerで「Install Missing Custom Nodes」を実行する
- Python依存関係エラー: 該当ノードをアンインストールし、再インストールする
用語集
本ガイドで使用する専門用語を以下にまとめる。
- safetensors: AIモデルの安全な保存形式。従来のpickle形式と異なり、任意コード実行のリスクがない
- LoRA(Low-Rank Adaptation): 既存モデルに追加する軽量な調整ファイル。特定のスタイルや対象を強化する
- ControlNet: 画像の構造や構図を制御する追加ネットワーク。エッジ検出や深度情報を入力として使用する
- Inpainting: 画像の一部分のみを修正・再生成する技術
- Upscaling: 画像解像度を向上させる処理
- CLIP(Contrastive Language-Image Pre-training): テキストと画像の関係を学習したモデル。プロンプトを数値ベクトルに変換する
- KSampler: 拡散モデルにおけるサンプリングアルゴリズム。ノイズから段階的に画像を生成する
- 潜在空間(Latent Space): AIが画像を圧縮された数値表現として処理する空間
- 低VRAMモード: GPUメモリ不足時にシステムメモリを代用する動作モード
- パラメータ数(B): モデルの規模を示す数値。Bはbillion(10億)の略