A work in progress towards stacking all the data science, data management and machine learning training materials [in russian].
Мини-курс по вводной в машинку.
[тут надо рассказать про науку о данных, нафига она нужна и примеры крутых кейсов, которые решает машобучение]
- Работа с данными. Титаник. Чисто инженерный семинар, который знакомит с данными и инструментами для работы с ними.
[тут надо рассказать про то, что такое машинка, классификация и регрессия, как работает KNN, линейные модели на пальцах, намёк на валидацию] 2. Моя первая машинка в sklearn. Скорее памятка, чем семинар. Давать вместе с (4) если группа обычная, (3) если все Ъ-математики. 3. Пишем линейную регрессию сами & Diabetes 4. Оверфиттинг и регуляризация 5. Работа с текстом и feature engineering
[тут нужно рассказать про принцип работы деревьев и затравку про ансамбли] 6. решающие деревья 7. Higgs - пример рыбы для проекта. Сюда можно запихнуть любой проект с каггла, в идеале - сообразно предпочтениям ученика.
- Какой-то скетч идей расширения есть тут #6
- Если у вас есть идеи - милости просим в Issues
- Если хотите законтрибьютить свои материалы - милости просим в Pull Requests