LCM-LoRAの学習で既存モデルからの再開 #50

pap0170 · 2024-07-22T04:01:49Z

LCM-LoRAの学習で既存モデルからの再開（resume）が機能しない問題

こんにちは。sd-trainerを使用してLCM-LoRAの学習を行っています。既存のLCM-LoRAモデルから学習を再開したいのですが、resumeを指定しても新規学習が始まってしまう問題に直面しています。既存のLCM-LoRAモデルの読み込みは正常に機能しているようなのですが、学習結果や途中サンプルを見るとゼロからの学習が行われてしまっているようです。
現状このようなconfigファイルを用いて学習を実行しています。configファイルの設定で問題となる箇所はありますでしょうか？

main:
  model_path: "/checkpoint_path/"
  output_path: "output"
  seed: 4545
  sdxl: true
  clip_skip: null
  steps: 3
  epochs: 1
  save_steps: null
  save_epochs: 1
  sample_steps: null
  sample_epochs: 1
  log_level: "logging.INFO"
  wandb: sd-trainer

trainer:
  module: modules.lcm.lcm_trainer.LCMTrainer
  train_unet: false
  train_text_encoder: false
  te_device: "cuda"
  vae_device: "cuda"
  train_dtype: torch.float32
  weight_dtype: torch.bfloat16
  autocast_dtype: null
  vae_dtype: null
  lr: "1e-5"
  lr_scheduler: "constant"
  gradient_checkpointing: true
  validation_args:
    prompt: "1girl, solo"
    negative_prompt: "lowres, bad anatomy, bad hands, worst quality"
    width: 832
    height: 1216
    guidance_scale: 1.5
    num_inference_steps: 8
  additional_conf:
    lcm:
      guidance_scale: 7.0
      num_inference_steps: 30
      negative_prompt: "low quality"


dataset:
  module: modules.dummy.dummy_dataset.DummyDataset
  args:
    batch_size: 1

dataloader:
  module: torch.utils.data.DataLoader
  args:
      num_workers: 4
      shuffle: true

network:
  train: true
  resume: "/LCM-LoRA_path/"
  args:
    module: networks.lora.LoRAModule
    unet_key_filters: ["to_q", "to_k", "to_v", "to_out.0"]
    module_args:
      rank: 1

The text was updated successfully, but these errors were encountered:

laksjdjf · 2024-07-22T05:25:26Z

resumeではなくargs.file_nameを試してみてください。

network:
  train: true
  args:
    module: networks.lora.LoRAModule
    file_name: "/LCM-LoRA_path/"

もしくはto_out.0はto_out_0が正しいかも？

pap0170 · 2024-07-24T12:32:07Z

args.file_nameを用いたところ正しく読み込めました。
to_out.0に関してもご指摘通りto_out_0が正しそうです。ありがとうございます。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LCM-LoRAの学習で既存モデルからの再開 #50

LCM-LoRAの学習で既存モデルからの再開 #50

pap0170 commented Jul 22, 2024

laksjdjf commented Jul 22, 2024

pap0170 commented Jul 24, 2024

LCM-LoRAの学習で既存モデルからの再開 #50

LCM-LoRAの学習で既存モデルからの再開 #50

Comments

pap0170 commented Jul 22, 2024

LCM-LoRAの学習で既存モデルからの再開（resume）が機能しない問題

laksjdjf commented Jul 22, 2024

pap0170 commented Jul 24, 2024