- проведён анализ данных
- построена модель прогноза доходов полученных от налогов физических лиц и организаций
- разработан прототип сайта принимающий данные по СЭР
- разработан телеграм-бот
- flask, docker, python, numpy, pandas, sklearn, catboost, telegram
- EDA_budget.ipynb - первичный анализ данных по расходам и доходам бюджета
- EDA_socio-economic.ipynb - углубленный анализ данных СЭР (расчёт корреляций)
- extract_features.ipynb - очистка и обработка данных по СЭР
- extract_target.ipynb - очистка и обработка данных по фактическим доходам бюджета
- model.ipynb - построение, анализ и сравнение моделей прогноза
- model-class.ipynb - реализация класса с ансамблем моделей (стэкинг) (на первом уровне использованы модели Linear, Ridge, ARIMA, CatBoost, а в качестве мета-модели Ridge)
Установка с помощью Docker
Прототив сервиса доступно по адресу:
@budgethackersbot (прототип)
Сергей Земсков - analytics, DA, ML
Анастасия Казакова - programming
Иван Бушуев - analytics, communication
Кристина Иванова - UX дизайнер
Юлия Леснова - analytics