🎉 Naver Cloud Camp 7기 AI class에서 진행한 Mini project입니다. 강사님이 설정한 3개의 데이터셋 중 하나를 선택하여 진행하는 프로젝트로, 저희 C 팀은 Braizilian Medical No-Show 데이터셋을 맡았습니다.
💬 학습된 모델에 미리 준비된 test 데이터를 넣어 정확도를 산출하는 Supervised Learning 형식의 Deep Learning과 Machine Learning을 이용해 인공지능 모델을 학습시켰습니다.
💬 Dataset을 분석하고 팀에서 고른 모델에 맞추어 최적의 성능을 뽑아낼 수 있도록 dataset 인코딩, 칼럼 수정, 이상치 변경 등 직접 전처리를 수행했습니다.
💬 Deep Learning 기법으로는 MLP(Multi Layer Perceptron)을 이용하여 모델을 학습시켰습니다.
💬 Machine Learning 기법으로는 XGBoost, LGBM, Catboost를 이용한 VotingClassifier를 이용했고, 최적의 하이퍼 파라미터를 사용하는 방법으로는 GridSearchCV, RandomSearchCV, Optuna를 이용했습니다.
💬 Git을 이용하여 각 팀원들이 어떤 작업을 수행하는지, 모델의 어떤 부분을 고쳐가며 정확도를 개선하는지, 어떤 하이퍼 파라미터를 사용하고 뽑아내었는지 등을 보며 코드작업을 하였고, 팀원들 서로의 코드를 리뷰하며 비슷한 형식으로 코드를 짤 수 있게 하였습니다.
발표자료는 Figma를 참고해주세요.