Merge branch 'main' of github.com:dvlab-research/ControlAny

dvlab-research · Aug 20, 2024 · 2a24969 · 2a24969
2 parents 2e46190 + 2617d87
commit 2a24969
Show file tree

Hide file tree

Showing 22 changed files with 5,343 additions and 67 deletions.
diff --git a/ControlNeXt-SDXL-Training/README.md b/ControlNeXt-SDXL-Training/README.md
@@ -0,0 +1,55 @@
+# 🌀 ControlNeXt-SDXL
+
+This is our **training** demo of ControlNeXt based on [Stable Diffusion XL](stabilityai/stable-diffusion-xl-base-1.0).
+
+Hardware requirement: A single GPU with at least 20GB memory.
+
+## Quick Start
+
+Clone the repository:
+
+```bash
+git clone https://github.com/dvlab-research/ControlNeXt
+cd ControlNeXt/ControlNeXt-SDXL-Training
+```
+
+Install the required packages:
+
+```bash
+pip install -r requirements.txt
+```
+
+Run the training script:
+
+```bash
+bash examples/vidit_depth/train.sh
+```
+
+The output will be saved in `train/example`.
+
+## Usage
+
+```python
+accelerate launch train_controlnext.py --pretrained_model_name_or_path "stabilityai/stable-diffusion-xl-base-1.0" \
+--pretrained_vae_model_name_or_path "madebyollin/sdxl-vae-fp16-fix" \
+--variant fp16 \
+--use_safetensors \
+--output_dir "train/example" \
+--logging_dir "logs" \
+--resolution 1024 \
+--gradient_checkpointing \
+--set_grads_to_none \
+--proportion_empty_prompts 0.2 \
+--controlnet_scale_factor 1.0 \
+--mixed_precision fp16 \
+--enable_xformers_memory_efficient_attention \
+--dataset_name "Nahrawy/VIDIT-Depth-ControlNet" \
+--image_column "image" \
+--conditioning_image_column "depth_map" \
+--caption_column "caption" \
+--validation_prompt "a stone tower on a rocky island" \
+--validation_image "examples/vidit_depth/condition_0.png"
+```
+
+> --pretrained_model_name_or_path : pretrained base model \
+> --controlnet_scale_factor : the strength of the controlnet output. For depth, we recommend 1.0, and for canny, we recommend 0.35 \
diff --git a/ControlNeXt-SDXL-Training/examples/vidit_depth/condition_0.png b/ControlNeXt-SDXL-Training/examples/vidit_depth/condition_0.png
diff --git a/ControlNeXt-SDXL-Training/examples/vidit_depth/train.sh b/ControlNeXt-SDXL-Training/examples/vidit_depth/train.sh
@@ -0,0 +1,19 @@
+accelerate launch train_controlnext.py --pretrained_model_name_or_path "stabilityai/stable-diffusion-xl-base-1.0" \
+--pretrained_vae_model_name_or_path "madebyollin/sdxl-vae-fp16-fix" \
+--variant fp16 \
+--use_safetensors \
+--output_dir "train/example" \
+--logging_dir "logs" \
+--resolution 1024 \
+--gradient_checkpointing \
+--set_grads_to_none \
+--proportion_empty_prompts 0.2 \
+--controlnet_scale_factor 1.0 \
+--mixed_precision fp16 \
+--enable_xformers_memory_efficient_attention \
+--dataset_name "Nahrawy/VIDIT-Depth-ControlNet" \
+--image_column "image" \
+--conditioning_image_column "depth_map" \
+--caption_column "caption" \
+--validation_prompt "a stone tower on a rocky island" \
+--validation_image "examples/vidit_depth/condition_0.png"