Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Experiments for zero-shot AutoML using GNN ranking #61

Open
1 task done
nicl-nno opened this issue Oct 18, 2023 · 9 comments
Open
1 task done

Experiments for zero-shot AutoML using GNN ranking #61

nicl-nno opened this issue Oct 18, 2023 · 9 comments

Comments

@nicl-nno
Copy link
Contributor

nicl-nno commented Oct 18, 2023

Нужно провести эксперимент zero-shot генерации данных на openml с помощью GNN и сравнить результат с бейзлайнами - статичным пайплайном rf и выбором модели в пространстве мета-признаков с помощью knn.

Pre-req:

@ShikovEgor
Copy link
Collaborator

surrogate_test_set_prediction.csv
Сорри, пропустил этот ишью. Эксперименты уже сделаны, результаты по GNN выкладывал в чатике около месяца назад. На всякий случай еще здесь выложу. Модель была актуальная.
Осталось только посчитать бейзлайны и сравнить.

@nicl-nno
Copy link
Contributor Author

nicl-nno commented Nov 3, 2023

@MorrisNein соотнесешь с бейзлайнами? Ну и нужен способ для пайплайнов получить ещё и значение метрики на отложенных данных, не только фитнесс из истории.

@ShikovEgor
Copy link
Collaborator

Кажется, можно просто инициализировать пайплайны, которые предложил сурогат (без гиперпараметров, только структруа) и обучить их заново.

@MorrisNein
Copy link
Collaborator

@MorrisNein соотнесешь с бейзлайнами? Ну и нужен способ для пайплайнов получить ещё и значение метрики на отложенных данных, не только фитнесс из истории.

Ок, запущу расчёт. А что будем считать отложенными данными?

@MorrisNein
Copy link
Collaborator

MorrisNein commented Nov 3, 2023

@ShikovEgor, а более подробно структуру ML-пайплайнов не сохраняли? В таблице только состав узлов и размер графа

Edit: Впрочем, я ведь их получу, если сделаю предикт суррогатом, верно?

@nicl-nno
Copy link
Contributor Author

nicl-nno commented Nov 3, 2023

Ок, запущу расчёт. А что будем считать отложенными данными?

На каждом фолде же есть есть разбиение train/test, вот test и брать.

@MorrisNein
Copy link
Collaborator

На каждом фолде же есть есть разбиение train/test, вот test и брать.

Для обучения суррогата использовались полные датасеты, т.е. конкатенация train и test

@nicl-nno
Copy link
Contributor Author

nicl-nno commented Nov 4, 2023

Это же те датасеты которые в мета-БД, а метрики нужны на тех датасетах которые в обучении не применялись.

@nicl-nno
Copy link
Contributor Author

nicl-nno commented Nov 14, 2023

@MorrisNein получилось запустить?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants