stable diffusionの使い方インストール方法やモデルの配置

stable diffusionの使い方

Stable Diffusionの使い方は大きく分けて以下の2通りあります。

使い勝手の面から、利用者のほとんどはWebUI経由でStable Diffusionを利用します。

さらに、Stable Diffusionのインストール先も2つの選択肢があります。

クラウドでも、自分のPCでも、WebUIを使えば、同じ操作で利用できるんですね。

基本的な使い方は以下の通りです。

▲Fooocusで画像生成した例

プロンプトは英語で入力し、重要なキーワードは前半に持ってくるほうが、画像に反映されやすいです。括弧と数字でプロンプトを強調することもできます。

本来、パソコン上にStableDiffusion環境を構築するのはとても面倒でしたが、今はWebUIのインストールスクリプトを実行するだけで、ただ待っていれば環境ができあがります。

ただし、ある程度ハイスペックなGPUを搭載したPCが必要になります。メモリ16GB以上、できればNVIDIAのRTX 3070以上のGPUが推奨されています。

インストールが簡単なWebUIは以下の通り。

特に簡単なのがFooocus。「とりあえず流行ってるし、どんなもんか使いたい」という人はおすすめです。

Fooocusの場合、公式サイトを開いて、少し下にスクロールし、「Click here to download」からファイルをダウンロードして、解凍後にできたファイルのrun.batを実行すれば環境ができあがります。（Windowsの場合）

＞Fooocus（公式サイト）

モデルも自動的にダウンロードされるので、本当にただ待っているだけ。

なお、解凍ファイル形式は.7zという特殊なもので、7-zipというソフトが必要になります。

Google Colabを使って、Automatic1111をインストールします。

Google Colabにアクセスし、新しいノートブックを作成します。
以下のコマンドを実行して、必要なライブラリをインストール。

!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd stable-diffusion-webui
!pip install -r requirements.txt

Stable Diffusionのモデルをダウンロードし、modelsフォルダに配置。
以下のコマンドでwebUIを起動。

!python launch.py --share

表示されたURLにアクセスし、Stable Diffusionを使用します。

AWSやGCPなどのクラウドサーバーを使うこともできます。

GPUを搭載したクラウドサーバーを用意します。
サーバーにSSH接続し、Pythonとgitをインストールします。
以下のコマンドでStable Diffusion Web UIをクローン。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Stable Diffusionのモデルをダウンロードし、modelsフォルダに配置する。
以下のコマンドでwebUIを起動する。

 cd stable-diffusion-webui
./webui.sh

サーバーのパブリックIPアドレスとポート7860にアクセスし、Stable Diffusionを使用する。（ポート番号は、別の番号の可能性もある）

クラウドを使うメリットは、高性能なGPUをすぐに利用できることです。デメリットは環境構築に手間がかかることと、クラウドの利用料金がかかることです。

ローカルPCにインストールする方法に比べると手順はやや複雑ですが、一度設定してしまえば、あとはブラウザからアクセスするだけでStable Diffusionを使えるようになります。

Stable Diffusionのモデルとは、画像を生成するための学習済みファイルを指します。モデルは、まんべんなく学習したものよりも、実写系またはアニメ・イラスト系に特化しているものを選んだほうが、結果の画像の質が良くなります。

Stable Diffusionには、従来のSD1.5系モデルと、新しく登場した高品質なSDXL系モデルがあります。SDXLモデルは高解像度の画像生成に適していますが、より高いPCスペックと時間が必要になります。