あらすじ
www.techno-edge.net
github.com
こちらの記事を参考にsd-scriptsを使用して、LoRAの学習モデルを作成していました。*1
(venv) PS D:\sd-scripts> accelerate launch --num_cpu_threads_per_process 1 sdxl_train_network.py --pretrained_model_name_or_path='D:\checkpoints\SDXL\sd_xl_base_1.0.safetensors' --dataset_config='D:\LoRA\config.toml' --output_dir='D:\LoRA\output' --output_name='kaede01aXL' --save_model_as=safetensors --prior_loss_weight=1.0 --resolution=1024,1024 --train_batch_size=1 --max_train_epochs=20 --learning_rate=1e-4 --xformers --mixed_precision="fp16" --cache_latents --gradient_checkpointing --network_module=networks.lora --no_half_vae
※太字にしている部分が変更可能箇所
上記のコマンドを実行するとエラー発生しながら動作しました。
A matching Triton is not available, some optimizations will not be enabled.
Error caught was: No module named 'triton'
このままでも作成できるのですが、続けて作成すると速度が遅くなったりしました。
私の環境だと、動作が不安定な気がしたのでUbuntu (WSL)で使用することにしました。
github.com
仮想環境の作成
sudo apt install update
sudo apt install upgrade
curl https://pyenv.run | bash
sudo apt install build-essential
sudo apt install libssl-dev libffi-dev libncurses5-dev zlib1g \
zlib1g-dev libreadline-dev libbz2-dev libsqlite3-dev make gcc
sudo apt install liblzma-dev
sudo apt-get install python3-tk
pyenv install 3.10.6
pyenv global 3.10.6
python -m venv venv
source venv/bin/activate
パッケージのインストール
pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 \
--index-url https://download.pytorch.org/whl/cu118
pip install --upgrade -r requirements.txt
pip install xformers==0.0.20
sd-scriptsの設定
[general]
[[datasets]]
[[datasets.subsets]]
image_dir = '/home/Username/LoRA/data'
class_tokens = 'xxxx01a woman'
num_repeats = 10
モデルの作成
sudo apt-get install libgl1-mesa-dev
accelerate launch --num_cpu_threads_per_process 1 sdxl_train_network.py \
--pretrained_model_name_or_path='/home/Username/checkpoints/SDXL/sd_xl_base_1.0.safetensors' \
--dataset_config='/home/Username/LoRA/config.toml' --output_dir='/home/Username/LoRA/output' \
--output_name='xxxx01aXL' --save_model_as=safetensors --prior_loss_weight=1.0 \
--resolution=1024,1024 --train_batch_size=1 --max_train_epochs=20 --learning_rate=1e-4 \
--xformers --mixed_precision="fp16" --cache_latents --gradient_checkpointing \
--network_module=networks.lora --no_half_vae
結果
エラーもなくなり、安定した速度で学習できました。
精度の高い写真が生成できて満足です👍
カバー写真のプロンプト
Photo of a japanese woman, (xxxxx:1.5), … <lora:xxxxx_01aXL:0.8>
BREAK
(HDR, 8k,best quality, masterpiece:1.2), photorealistic
(ultra-detailed background:1.2, detailed background:1.2),
(1 girl:1.5), her room, sitting in desk, dress, preppy style, collared shirts,
khaki pants, (face:1.3), cable knit sweaters, loafers, blazers,
plaid skirts, smile, beautiful face, (raw skin, detailed skin:1.4), (slender eyes:1.3),
EasyNegative, paintings, sketches, bad_prompt_version2,
badhandv4, bad-hands-5,NG_DeepNegative_V1_75T, negative_hand-neg,
cloned face, (strabismus, gynophore:1.3), bad anatomy, jpeg_artifacts, signature,
watermark, username, blurry, ugly, (worst quality:2), (low quality:2)
www.chichi-pui.com
追記
再度モデルを作成していたら、別のエラーが発生しました。
Killed "${python_cmd}" -u "${LAUNCH_SCRIPT}" "$@"
debugの部分をコメントアウトしたら、直りました。
compute_environment: LOCAL_MACHINE
distributed_type: "NO"
downcast_bf16: "no"
gpu_ids: all
machine_rank: 0
main_training_function: main
mixed_precision: fp16
num_machines: 1
num_processes: 1
rdzv_backend: static
same_network: true
tpu_env: []
tpu_use_cluster: false
tpu_use_sudo: false
use_cpu: false