GPT Week (23-НОЯ - 01-ДЕК 2023)

https://shad.yandex.ru/gptweek

Интенсив GPT Week: 01 Введение в большие языковые модели

Спикер: Миша Хрущёв, руководитель группы претрейна YandexGPT

Лекция
Семинар
Ноутбук

Интенсив GPT Week: 02 Про претрейн LLM

Спикер: Миша Хрущёв, руководитель группы претрейна YandexGPT

Лекция - часть 1
Лекция - часть 2

Ссылки:

Трансформеры и Attention
GPT-3
Поиск оптимального времени обучения для моделей
Llama: https://arxiv.org/abs/2302.13971 и https://arxiv.org/abs/2307.09288
Adan
FSDP
DeepSpeed - фреймворк для распределенного обучения. Мы от него отошли, но там куча полезных статей: https://www.deepspeed.ai/
RoPE

Интенсив GPT Week: 03 Подготовка данных для обучения претрейна и замер качества больших языковых моделей

Спикер: Лёша Зотов, руководитель группы качества данных YandexGPT

Лекция
Семинар
Ноутбук

Ссылки:

Training Compute-Optimal Large Language Models (Hoffman et al., 2022)
Scaling Data-Constrained Language Models (Muennighoff et al., 2023)
The RefinedWeb Dataset for Falcon LLM
Nougat: Neural Optical Understanding for Academic Documents
Scaling Language Models: Methods, Analysis & Insights from Training Gopher
OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text
Объяснение Minhash + LSH алгоритма
D4: Improving LLM Pretraining via Document De-Duplication and Diversification
Textbooks Are All You Need
In-Context Pretraining: Language Modeling Beyond Document Boundaries
DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining

Интенсив GPT Week : 04 Alignment

Спикер: Паша Темирчев, разработчик группы поиска смысла

Лекция
Семинар

Ссыллки:

A General Language Assistant as a Laboratory for Alignment

Статья от Anthropic, в которой вводится терминология Harmless, Helpful, Honest агента, и в целом описан процесс обучения модели предпочтений.

Reinforcement Learning Textbook, Ivanov S.

Конспект лекций по обучению с подкреплением от Сергея Иванова на русском языке (рекомендуем).

Proximal Policy Optimization

РРО - алгоритм, который обычно используется в дообучении LMок на задачу Alignment. В лекции мы его проскочили вскользь, разобрав его базу - градиент по политике.

Direct Preference Optimization
Метод alignment'а, с которым мы познакомимся на семинаре

Интенсив GPT Week : 05 Ускорение инференса LLM

Рома Горб, разработчик группы претрейна YandexGPT

Лекция
Семинар
Ноутбук

Ссылки:

Канал в телеге
Про GPU и ускорение pretrain-a
Курс Practical RL в ШАД-е
Статья MiniLLM
Статья LLM.int8()
Статья SmoothQuant
Статья GPT-Q (OPT-Q)
Сравнение фреймворков
Continuous Batching
PEFT и API sharing
Speculative Decoding

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

yandex-gpt-week.md

yandex-gpt-week.md

GPT Week (23-НОЯ - 01-ДЕК 2023)

Интенсив GPT Week: 01 Введение в большие языковые модели

Интенсив GPT Week: 02 Про претрейн LLM

Интенсив GPT Week: 03 Подготовка данных для обучения претрейна и замер качества больших языковых моделей

Интенсив GPT Week : 04 Alignment

Интенсив GPT Week : 05 Ускорение инференса LLM

Files

yandex-gpt-week.md

Latest commit

History

yandex-gpt-week.md

File metadata and controls

GPT Week (23-НОЯ - 01-ДЕК 2023)

Интенсив GPT Week: 01 Введение в большие языковые модели

Интенсив GPT Week: 02 Про претрейн LLM

Интенсив GPT Week: 03 Подготовка данных для обучения претрейна и замер качества больших языковых моделей

Интенсив GPT Week : 04 Alignment

Интенсив GPT Week : 05 Ускорение инференса LLM