- 개요 : 광주광역시 태양광 발전량 예측 모델 개발
- 데이터 수집 및 전처리
① 공공데이터 포털, 기상청, 에어코리아 등에서 광주광역시 데이터 모으기
② 결측값 제거를 위한 데이터 전처리 (해가 진 시간 제외, KNNImputer 라이브러리 활용)
③ 상관관계 분석 후 비례관계를 보이지 않는 데이터 제거
④ 표준화 과정 진행 후, SUN 컬럼 생성
⑤ data -> train, test data 8:2 의 비율로 나눠주었음
- 모델링
랜덤 포레스트 활용 이유 : 결측값, 이상치 유무 때문
이후 GridSearchCV 를 활용하여 최적 하이퍼 파라미터 설정