딥러닝 알고리즘을 이용한 혐오 댓글 분류 및 혐오도 도출에 관한 연구
A Study on Hate Comment Classification and Hate Intensity Estimation Using Deep Learning Algorithms
- 주제어 (키워드) 혐오 , 혐오표현 , 혐오 댓글 , 분류 , 혐오도 , 순환신경망 , Hate , Hate Speech , Hate Comment , Classification , Hate Intensity , RNN , LSTM , GRU
- 발행기관 서강대학교 정보통신대학원
- 지도교수 문의현
- 발행년도 2023
- 학위수여년월 2023. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000076488
- UCI I804:11029-000000076488
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
2021년도 한국언론진흥재단 통계에 따르면, 70% 이상의 소셜 미디어 이용자는 혐오 표현을 접하는 것으로 나타났다. 이러한 상황이 지속되면 온라인 혐오표현이 규범화되고 사회갈등을 심화시킬 우려가 있다. 하지만, 영어에 비해 한국어 혐오표현 분류 연구 사례가 많지 않다. 이는 한국어의 고맥락 특성과 복잡한 문법으로 분류하기 어렵기 때문이다. 이러한 점을 고려하여 딥러닝 모델을 기반으로 분류하고 여러 문맥의 특징을 조합하여 혐오도를 도출하는 연구를 진행하였다. 본 연구는 한국어의 여러 문맥이 반영될 수 있도록 '감정', '욕설' 그리고 '혐오·차별'이라는 세 가지 댓글 분류 분석을 순환신경망 모델을 통해 동시에 수행한다. 이후 세 가지 예측값의 부정적인 특징값을 추출하여 댓글 문장의 혐오도를 도출하였다. 실험 결과, 감정, 욕설 여부와 상관없이 문맥상 혐오로 분류되는 결과를 확인할 수 있었다. 모델의 경우, LSTM보다 GRU에서 더욱 높은 정확도와 F1-score를 보여주었다. 본 연구를 통해 한 모델에서 세 가지 카테고리를 동시에 분류하고, 최종 예측값을 조합하여 문장의 혐오 정도를 수치화한 방법론을 제시했다는 점에서 의의가 있다.
more초록 (요약문)
According to the statistics from the Korea Press Foundation in 2021, more than 70% of social media users encounter hate speech. If this situation persists, there is a concern that online hate speech will become normalized and exacerbate social conflicts. However, there have been relatively few studies on classifying Korean hate speech compared to English. This is because it is difficult to classify due to the high-context characteristics and complex grammar of the Korean language. Taking these factors into account, this thesis conducted a study using a deep learning model to classify hate speech and derive its level of offensiveness by combining various contextual features. This thesis simultaneously performs sentiment analysis, profanity classification, and discrimination classification on comments using a recurrent neural network model to incorporate multiple contexts in the Korean language. Subsequently, negative features of the three predicted values are extracted to determine the hate intensity of the comment sentences. The experimental results confirmed the classification of hate speech based on contextual factors, regardless of sentiment and profanity. The model showed higher accuracy and F1-score in GRU (Gated Recurrent Unit) compared to LSTM (Long Short-Term Memory). The significance of this thesis lies in presenting a methodology that classifies three categories simultaneously in one model and quantifies the level of hate intensity in sentences by combining the final predicted values.
more