生成モデル　Fine Tuning に関して #3

Unagi2 · 2022-08-14T07:46:41Z

当初予定していたgpt2-mediumは、モデルの層のサイズが非常に大きく、計算機サーバ（susanoo:rtx3080 12GB）ではメモリのオーバーフローでFine Tuning が不可能であることが判明

Unagi2 · 2022-08-14T07:55:00Z

Distlgpt2という軽量化・高速化されたモデルに変更

TrainとTest両方のデータセットをフルデータで、メモリオーバーフローを引き起こさずにFine Tuning が行えることを確認

10000epoch学習し、モデルを保存済み

Unagi2 · 2022-08-15T05:51:13Z

Fine Tuningに用いるデータの違いによる評価の変化

Unagi2 mentioned this issue Aug 14, 2022

ToDoリスト（メモとか自由に書き換えok） #1

Open

9 tasks

Unagi2 mentioned this issue Aug 15, 2022

Fine Tuningに用いるデータの違いによる評価の変化 #5

Closed

2 tasks

Provide feedback