검색 상세

AI 하이브리드 모델을 활용한 한국 주식시장의 투자심리 역설(Paradox) 분석 : 뉴스 및 검색량의 역발상(Contrarian) 지표 가능성을 중심으로

Sentiment Paradox in the Korean Stock Market : An AI Hybrid model Approach Focusing on Contrarian Indicators

초록(요약문)

본 연구는 개인투자자의 비중이 높고, 정보 자체보다 투자자의 감정과 분위기가 보다 빠르게 가격에 반영되는 한국 주식시장의 특성에 주목한다. 특히 2020년 이후 '동학개미운동'으로 대변되는 개인투자자의 급증은 시장의 미시적 구조를 변화시켰으며, 뉴스, 소셜 미디어, 검색량 등 비정형 데이터가 주가 형성에 미치는 영향력을 비약적으로 확대시켰다. 이에 본 연구는 ARIMA-LSTM-LightGBM으로 구성된 하이브리드 스태킹(stacking) 모형을 구축하고, 뉴스 감성지수와 검색량 지표를 중심으로 한 투자심리가 주가와 어떤 구조적 관계를 가지는지 심층 분석하였다. 분석 대상은 삼성전자, 현대자동차, LG화학, 네이버, 카카오 등 시가총액 상위 5개 대형주이며, 2022년 1월부터 2025년 6월까지의 정형(가격·거래량 등) 및 비정형(뉴스·검색량) 데이터를 함께 사용하였다. 실증 결과, 스태킹 모형의 방향성 적중률(Directional Accuracy, DA)은 43%~47% 수준으로 나타났다. 통상적인 기계학습 연구의 관점에서 이는 만족스럽지 못한 성능으로 비칠 수 있으나, 본 연구는 이 결과를 곧바로 모형의 실패로 해석하기보다는, 긍정적 뉴스와 검색량 급증이 단기 고점과 맞물리며 오히려 이후 하락으로 이어지는 투자심리의 역설(Sentiment Paradox) 관점에서 재조명한다. 즉, 대중의 관심이 집중되는 시점이 단기적으로는 과열을 의미할 수 있으며, 실제 데이터에서도 이러한 구간이 반전(reversal)과 자주 겹친다는 점을 확인하였다. 이는 AI가 학습한 '호재'의 패턴이 실제 시장에서는 '매도 기회'로 작동할 가능성을 보여준다. 백테스트에서는 예측값의 절대 크기를 활용한 신뢰도 필터 전략과 연속적인 비중 조절 전략이 단순 매수 후 보유(Buy \& Hold) 전략에 비해 대부분의 구간에서 더 낮은 최대낙폭(Maximum Drawdown, MDD)을 기록하였다. 특히 2022년 하락장과 2024년 변동성 장세에서 감정지표가 과열을 가리킬 때 비중을 축소하는 전략은 포트폴리오의 안정성을 크게 기여하였다. 이는 AI 기반 예측 모형이 단순히 향후 가격 수준을 맞히는 도구를 넘어, 투자심리의 비효율을 탐지하는 조기경보 지표(Early Warning Indicator)로도 활용될 수 있음을 시사한다. 본 연구는 행동재무학적 이론을 최신 AI 기술로 실증하고, 이를 실무적 리스크 관리 전략으로 연결했다는 점에서 학술적 의의를 가진다.

more

목차

국문 초록 3
1 서론 4
1.1 연구 배경 4
1.2 연구 문제의식: 투자심리와 예측의 불일치 4
1.3 연구 목적 및 접근 방식 5
1.4 주요 실증 결과의 요약 6
2 이론적 배경 및 선행연구7
2.1 효율적 시장가설과 행동재무학 7
2.1.1 효율적 시장가설(EMH)의 정의 및 한계 7
2.1.2 행동재무학적 접근과 주요 편향 7
2.2 투자심리, 뉴스, 검색량과 주가의 관계 8
2.2.1 비정형 데이터와 투자심리 측정 8
2.2.2 검색량 지표와 투자자 관심(Attention) 8
2.3 AI머신러닝 기반 주가예측 연구의 흐름 9
2.3.1 기존 연구의 한계와 새로운 접근 9
2.3.2 감정지표의 역발상(Contrarian) 기능 9
3 연구 설계 및 방법론 10
3.1 표본 선정 및 데이터 구성 10
3.1.1 표본 선정의 경제학적 타당성 10
3.1.2 시장 국면과 주간 데이터의 의미 10
3.2 변수 정의 및 감정지표 구축 11
3.2.1 가격 기반 변수 11
3.2.2 기술적 지표 11
3.2.3 뉴스 감정 지표 12
3.2.4 검색량 지표 12
3.2.5 상호작용항 (Interaction Term) 12
3.3 하이브리드 예측모형 구조 13
3.3.1 ARIMA: 선형적 추세의 포착 13
3.3.2 LSTM: 비선형 시계열 패턴 학습 13
3.3.3 LightGBM: 변수 간 복잡한 상호작용 처리 14
3.3.4 스태킹(Stacking)의 경제적 의미 14
3.4 검증 절차 및 평가 지표 14
3.4.1 Time Series Split 교차 검증 14
3.4.2 평가 지표의 선정과 의미 15
4 실증 분석 결과 16
4.1 기술통계 및 기초 분석 16
4.2 하이브리드 모형의 예측 성능 16
4.3 변수 중요도(Feature Importance) 분석 22
4.4 투자 전략 백테스트 및 경제적 성과 23
4.5 투자심리–예측오차–수익률의 연결 구조 23
5 결론 및 시사점 25
5.1 연구 요약 25
5.2 학술적 시사점 25
5.3 실무적 및 정책적 시사점 26
5.4 한계 및 향후 연구 과제 26
참고문헌 27
부록 28
감사의 글 30

more