HCP-Diffusion

简介

HCP-Diffusion是一个基于🤗 Diffusers的Stable Diffusion模型训练工具箱。相比于webui和sd-scripts有更加清晰的代码结构，更方便的实验配置和管理方法，更多的训练组件支持。

框架支持Colossal-AI，可以大幅减少显存消耗。

HCP-Diffusion可以通过一个.yaml配置文件统一现有大多数训练方法和模型结构，包括Prompt-tuning (Textual Inversion), DreamArtist, Fine-tuning, DreamBooth, LoRA, ControlNet等绝大多数方法。也可以实现各个方法直接的组合使用。

框架实现了基于LoRA的升级版DreamArtist，即DreamArtist++，只用一张图像就可以训练得到高泛化性，高可控性的LoRA。相比DreamArtist更加稳定，图像质量和可控性更高，训练速度更快。

特性支持

分层添加LoRA (包含Conv2d层)
分层fine-tuning
分层模型融合
多个单词联合prompt-tuning
DreamArtist、DreamArtist++
带自动聚类的Aspect Ratio Bucket (ARB)
支持多个数据源的多个数据集
图像局部注意力强化
单词注意力调整
占多个词位置的自定义单词
最大句子长度拓展
🤗 Accelerate
Colossal-AI
xFormers （用于UNet和文本编码器）
CLIP skip
标签打乱和 dropout
Safetensors支持
Controlnet (支持训练)
Min-SNR loss
自定义优化器 (Lion, DAdaptation, pytorch-optimizer, ...)
自定义学习率调整器
SDXL 支持

安装

通过pip安装:

pip install hcpdiff
# 新建一个项目并进行初始化
hcpinit

从源码安装:

git clone https://github.com/7eu7d7/HCP-Diffusion.git
cd HCP-Diffusion
pip install -e .
# 基于此项目直接修改，或新建一个项目并进行初始化
## hcpinit

使用xFormers减少显存使用并加速训练:

# use conda
conda install xformers -c xformers

# use pip
pip install xformers>=0.0.17

使用教程

训练

HCP-Diffusion提供了基于🤗 Accelerate或Colossal-AI的训练脚本。

若使用🤗 Accelerate，可能需要在启动脚本前先配置环境。
若使用Colossal-AI，可使用torchrun来启动脚本。

# 使用Accelerate
accelerate launch -m hcpdiff.train_ac --cfg cfgs/train/配置文件.yaml
# 使用Accelerate（单卡）
accelerate launch -m hcpdiff.train_ac_single --cfg cfgs/train/配置文件.yaml
# 使用Colossal-AI
# pip install colossalai
torchrun --nproc_per_node 1 -m hcpdiff.train_colo --cfg cfgs/train/配置文件.yaml

推断（生成图像）:

python -m hcpdiff.visualizer --cfg cfgs/infer/cfg.yaml pretrained_model=pretrained_model_path \
        prompt='positive_prompt' \
        neg_prompt='negative_prompt' \
        seed=42

Stable Diffusion模型的转换

该框架基于🤗 Diffusers，故需要使用🤗 Diffusers提供的脚本把原版Stable Diffusion模型转换成支持的格式：

首先下载配置文件
根据配置文件转换模型

python -m hcpdiff.tools.sd2diffusers \
    --checkpoint_path "stable diffusion模型路径" \
    --original_config_file "下载的配置文件路径" \
    --dump_path "储存路径(文件夹)" \
    [--extract_ema] # 是否提取EMA模型
    [--from_safetensors] # 原模型是不是safetensors格式
    [--to_safetensors] # 是否存成safetensors格式

转换VAE:

python -m hcpdiff.tools.sd2diffusers \
    --vae_pt_path "VAE模型路径" \
    --original_config_file "下载的配置文件路径" \
    --dump_path "储存路径(文件夹)"
    [--from_safetensors]

教程

模型训练教程
DreamArtist++使用教程
图像生成教程
配置文件说明
webui模型转换教程

做出贡献

欢迎为工具箱贡献更多的模型与特性。

团队

该工具箱由中山大学HCP-Lab 维护。

引用

@article{DBLP:journals/corr/abs-2211-11337,
  author    = {Ziyi Dong and
               Pengxu Wei and
               Liang Lin},
  title     = {DreamArtist: Towards Controllable One-Shot Text-to-Image Generation
               via Positive-Negative Prompt-Tuning},
  journal   = {CoRR},
  volume    = {abs/2211.11337},
  year      = {2022},
  doi       = {10.48550/arXiv.2211.11337},
  eprinttype = {arXiv},
  eprint    = {2211.11337},
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_cn.md

README_cn.md

HCP-Diffusion

简介

特性支持

安装

使用教程

训练

推断（生成图像）:

Stable Diffusion模型的转换

教程

做出贡献

团队

引用

Files

README_cn.md

Latest commit

History

README_cn.md

File metadata and controls

HCP-Diffusion

简介

特性支持

安装

使用教程

训练

推断（生成图像）:

Stable Diffusion模型的转换

教程

做出贡献

团队

引用