В этом репозитиории хранятся наиболее актуальные проекты, выполненные в рамках обучения на Практикуме. В течение обучения на Практикуме узнал и применил на проектах, приближенных к реальным кейсам, знания и инструменты анализа данных, классического машинного обучения, компьютерного зрения, обработки естественного языка, визуализации данных. Стек технологий: Python, Pandas, Numpy, scikit-learn, Keras, NLTK, XGBoost, LightGBM, PyTorch, SQL, Optuna, Matplotlib, Seaborn, Plotly.
HR Аналитика: В данном проекте подготовлены данные и обучены модели для предсказания удовлетворенности сотрудника работой и его желания уволиться. Стек: Python, Pandas, Numpy, Scikit-Learn, Optuna, Shap, Matplotlib, Seaborn. Ссылка: https://github.com/avdeyFur/HR-Analytics
Выбор локации для скважины: Для определения наиболее перспективного месторождения в данном проекте были обработаны и подготовлены данные, обучены и проверены три модели линейной регрессии. Последним шагом была оценка прибыли. Составлена функция расчета прибыли, применен бутстреппинг для составления выборок, по средним значениям которых были оценены прибыльность и риски.
Computer Vision проект для определения возраста по фото: Целью данного проекта было построение модели компьютерного зрения для выполнения задачи регрессии - определения возраста клиента по фото. В данном проекте я сам разработал архитектуру сверточной нейронной сети на основе существующих архитектур (VGG, AlexNet, ZFNet). Метрика MAE после обучения на 50 эпохах была равна 7.6 - хороший результат с учетом построения собственной архитектуры. Стек: Python, Keras
Классификация комментариев: Разработана модель для классификации комментариев на "токсичные" и "не токсичные". Данные были токинезированы, ламметизированы, и веторизированы, после чего - обучены модели, финальная метрика - 78.5% (f1 score). В данном проекте я сам проделывал обработку данных и поиск моделей, вместо использования BERT. Стек: Python, NLTK, Scikit-Learn.