검색 상세

BERT 모델을 이용한 포털 기사의 댓글 감정 트렌드 분석

Emotion trends analysis of user comment on Internet portal articles using BERT model

초록 (요약문)

글 콘텐츠라는 상품의 품질은 정성적이기 때문에 측정하기 애매하다. 일반 재화의 품질은 재구매 또는 리뷰를 통해 확인 할 수는 있으나, 콘텐츠는 확인하기가 어렵다. 이에 대한 대체 방법으로 글 콘텐츠의 댓글을 통해 확인해보고자 한다. 한국리서치 자체 여론조사 결과 인터넷에서 뉴스를 볼 때 댓글도 같이 읽는다는 응답이 88%로 나타났다. 사람의 심리상 선호도가 높은 댓글이 콘텐츠가 전달하는 의미에 영향을 준다고 볼 수 있다. 이에 콘텐츠에 댓글을 통해 독자가 느끼는 감정들을 분석해 화자와 독자의 의사전달이 플랫폼 별 차이가 있는지 또는 콘텐츠 분류별로 차이가 있는지 비교해보고자 한다. 이에 전처리된 한국문장 말뭉치 데이터를 학습시키고, 학습된 모델을 이용하여 포털에서 수집한 댓글들을 모델에 집어넣어, 총 8가지의 감정을 예측해본다. 이 중 성능이 가장 좋은 4가지 감정으로, 각각 포털에서 비교하여 포털 및 분야별로 느끼는 감정에 차이가 있는지 기간 별로 차이가 있는지 분석하고자 한다. 특히 올해에는 정치 분야에서 큰 이슈 두 가지 대선과 지방선거라는 이벤트가 있었고, 경제 분야에서 금리가 지난 코로나로 인해 가파르게 상승하고 있다. 또한 사회분야에서는 코로나 사회적 거리두기 전면해제로 한 동안 비대면 사회에서 대면사회로 변화된 모습과 폭우피해로 사회적인 이슈가 있었다. 이 외에도 크고 작은 여러 이슈들이 각각이 분야에서 있는데 해당 기간 동안에는 어떠한 변화가 있는지 살펴보고자 한다.


초록 (요약문)

It is ambiguous to measure the quality of a content because it is qualitative. The quality of a goods can be checked through review and repurchase, whereas the content is difficult. I would like to check it out through the comments of the contents. According to a survey conducted by Korea Research, 88 percent of respondents said that they read contents with comments on the internet. It can be said that Top comments with preferences affect the meaning of the content. Therefore, I would like to compare whether differences between platforms or content classification for the emotions that caused by reading the comments in the content. I would like to execute training the preprocessed korean sentence corpus data, and to predict a result of eight emotions use the pre learned model that put the comments crawling or scraping from the portal. each of the predicted result in the data, I would like to compare and analyze whether are differences in result of by each of portal and by period or time. In particular, In politics had two big issues, and in the economic interest rates are rising called ' Giant Step' due to the coronavirus disease. In the society, there was a change from the non-face-to-face society to the face-to-face society. It was all social distancing is lifted off. In addition to this, there were various issues that were big and small. I would like to study what changes were made over the past year.
