기간 : 2022-06-27 : 2022-09-08
주최 : KRX
주제 : AI 댓글 감성분석 점수를 활용한 국내 주식시장 심리지수
- 시장의 비이성적인 행동 흐름 포착
- 투자자들의 심리 파악
- 불완전한 투자자들에게 위험 신호 제공
- 2020년 6월 이후 데이터 사용
- 유튜브 댓글데이터
- KTOP30 기업의 네이버 종목토론실 댓글 데이터
- neg_pol_word / pos_pol_word 를 이용한 레이블링
- 거래 회전율
- 환율
- 기존에 익숙한 정형 데이터 위주의 분석에서 벗어나 텍스트 데이터를 활용한 감성분석을 통한 국내 주식 시장 흐름을 분석
- 주식시장에 내재된 개인투자자들의 감정 집합(공포-탐욕 지수)을 점수로 변환하여 서비스로 제공
- 기존의 투자자의 기대 심리에 영향을 미칠 수 있는 긍정적/부정적 뉴스를 분석하는 것보다 댓글 및 SNS를 분석함으로써 비합리적인 의사결정을 하는 투자자들의 심리를 더 잘 반영할 수 있음
- soynlp 를 이용하여 토크나이저를 학습시켜 신조어에 대응
- kobert 모델 사용
- 인덱스 생성시 정형데이터와 결합
*디테일은 제안서.docx 를 확인해 주세요.
Dacon 작성글 : https://dacon.io/codeshare/5662
Web service : https://jjh0987-streamlit-krx-krx-streamlit-mw1uan.streamlitapp.com/ (닫혀 있을 수 있습니다.)