[自分用メモ]Stable Diffusion web UIを試す

[自分用メモ]Stable Diffusion web UIを試す

2023年3月14日
知恵
Pocket

Colaboratoryにノートブックを新規作成する

編集 – ノートブックの設定 – ハードウェア アクセラレータで、GPUを選択する

以下を貼り付ける

!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd /content/stable-diffusion-webui

!wget https://huggingface.co/nuigurumi/basil_mix/resolve/main/Basil_mix_fixed.safetensors -O /content/stable-diffusion-webui/models/Stable-diffusion/Basil_mix_fixed.safetensors
!wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors -O /content/stable-diffusion-webui/models/VAE/vae-ft-mse-840000-ema-pruned.safetensors

!python launch.py --share --xformers --enable-insecure-extension-access

実行すると、URLが出力されるので、そちらにアクセスする

Running on public URL: https://0xxxxxxx-xxxx-xxxx.gradio.live

promptに描画したい内容を記入する

Negative promptにキーワードを入力する

以下を参考にしてみる

[自分用メモ]Stable Diffusion web UIを試す

stabilityai/stable-diffusion · Negative Prompts

Im adding some negative prompts, please …
huggingface.co

ちなみに、上記のコードの意味は、ChatGPTに解説してもらいます。

このコードは、GitHub上にある「stable-diffusion-webui」というリポジトリをクローン(複製)し、そのディレクトリに移動します。
その後、2つのファイルをwgetを使ってダウンロードしています。これらのファイルは、モデルの重みを含んでいます。
最後に、「launch.py」というPythonスクリプトを実行しています。このスクリプトは、WebUIを起動するために必要なコードを実行します。--shareと--xformersオプションを渡すことで、このWebUIはGPUを使用し、最適なパフォーマンスを発揮するようになっています。--enable-insecure-extension-accessは、拡張機能アクセスを許可するオプションで、これにより、WebUIはより高度な機能を使用できるようになります。

Basil_mix_fixed.safetensorsはなにか?も確認しておきます。

Basil_mix_fixed.safetensorsは、機械学習モデルの重みを含むファイルの1つです。このファイルには、ニューラルネットワークのパラメータが格納されています。具体的には、モデルが学習した特徴の表現をエンコードするために使用される重みが含まれています。

このファイルの名前にある「Basil_mix_fixed」という名前は、このモデルが何らかのタスクを実行するために学習されたことを示唆していますが、具体的にどのようなタスクで使用されるモデルかは、このコードだけからは判断できません。

この記事のアイキャッチは、「Stable Diffusion web UI」と入れて生成されたものになります。

Bing AIにも解説してもらいました。

このコードは、Google Colabというオンラインのプログラミング環境で実行するものです。以下に、各行の意味を説明します。

!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

git clone1というコマンドは、指定されたURLからリポジトリというプログラムの集まりを複製するものです。この場合は、stable-diffusion-webuiという名前のリポジトリをGitHubというサイトからダウンロードしています。

%cd /content/stable-diffusion-webui

%cdというコマンドは、ディレクトリというフォルダの場所を変更するものです。この場合は、/content/stable-diffusion-webuiという名前のディレクトリに移動しています2。

!wget https://huggingface.co/nuigurumi/basil_mix/resolve/main/Basil_mix_fixed.safetensors -O /content/stable-diffusion-webui/models/Stable-diffusion/Basil_mix_fixed.safetensors

wgetというコマンドは、指定されたURLからファイルをダウンロードするものです。この場合は、Basil_mix_fixed.safetensorsという名前のファイルをhuggingface.coというサイトからダウンロードしています。-Oオプションは、ダウンロードしたファイルの保存先を指定するもので、ここでは/content/stable-diffusion-webui/models/Stable-diffusion/Basil_mix_fixed.safetensorsというパスに保存しています。

!wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors -O /content/stable-diffusion-webui/models/VAE/vae-ft-mse-840000-ema-pruned.safetensors

wgetコマンドの説明は上記と同じです。ここでは、vae-ft-mse-840000-ema-pruned.safetensorsという名前のファイルをhuggingface.coからダウンロードして/content/stable-diffusion-webui/models/VAE/vae-ft-mse-840000-ema-pruned.safetensorsに保存しています。

!python launch.py --share --xformers --enable-insecure-extension-access
pythonというコマンドは、Python言語で書かれたプログラムを実行するものです。この場合は、launch.pyという名前のプログラムを実行しています。–shareや–xformersなどはオプションであり、プログラムに追加的な情報や設定を渡すために使われます。

以上が次のコードの意味です。ご参考になれば幸いです。
このコードで、Stable Diffusionという画像生成AIを使って文章から画像を作成することができるようになります1。Stable Diffusionは、自然な画像やアニメ風の画像など様々なスタイルの画像を生成できるAIです2。stable-diffusion-webuiは、Stable Diffusionを簡単に操作できるWebインターフェースを提供するプログラムです3。このコードでは、stable-diffusion-webuiをダウンロードして実行し、Colab上でWebサーバーを立ち上げています。その後、表示されるURLにアクセスすると、WebブラウザからStable Diffusionを使って文章から画像を生成することができます。