Решение кейса от Федерального автономного учреждения «РосКапСтрой» на хакатоне «Цифровой прорыв. Сезон: искусственный интеллект» в УрФО 23-25 июня 2023 года
- Прогон вакансий из изначального набора данных: results.xls
- Предобработка данных: preprocessing
- Аугментация данных: augmentation
- Дообучение модели
seninoseno/rubert-tiny-vacancy-information-extractor
: fine-tuning
Решение представляет собой модуль для разбиения вакансий на должностные обязанности, требования к соискателю, условия труда и примечания. Модуль может с легкостью встраиваться в информационные системы агрегации с целью повышения качества оформления предлагаемых объявлений.
Решение заняло 4 место среди 23 остальных решений этого кейса.
sudo make build
sudo docker compose up -d
- отечественная легковесная модель обработки естественного языка RuBERT tiny
- библиотека для обработки естественного языка razdel
- веб-фреймворк FastAPI
- контейнеризатор приложений Docker
MOAD.dev team
- Данил Криворогов – предобработка данных
- Тимур Низамов – разработка API, развёртывание приложения
- Альберт Фазлыев – разработка API, контейнеризация приложения
- Арсений Ходырев – обучение модели классификации
- Дмитрий Шушарин – предобработка данных