검색 상세

Examining the Korean Semiconductor Industry with Language Models and Graph Networks

언어 모델과 그래프 네트워크를 활용한 한국 반도체 산업 네트워크 분석

초록 (요약문)

This study explores a methodology for analyzing the network structure of companies in the South Korean semiconductor industry using natural language processing (NLP) and graph neural networks (GNNs). Utilizing textual data from corporate annual reports disclosed in the DART system and stock price data, this approach integrates GPT-3.5-turbo, BERT, and the GraphSAGE model to examine the relationships within the industrial ecosystem. The findings indicate that incorporating natural language information into the graph model improves company classification accuracy compared to using only price information. This suggests that natural language information contains valuable insights into industry relationships that traditional methods may overlook. The proposed methodology offers a framework for combining advanced NLP techniques and GNNs to analyze industrial networks. This approach may have broader applications in supporting data-driven strategy development and decision-making.

more

초록 (요약문)

본 연구는 자연어 처리 기술과 그래프 신경망을 활용하여 대한민국 반도체 산업 내 기업 간 네트워크 구조를 분석하는 새로운 방법론을 제안한다. 금융감독원 전자공시시스템(DART)에 공개된 기업 사업보고서의 텍스트 데이터와 주가 데이터를 바탕으로, GPT-3.5-turbo, BERT, 그리고 GraphSAGE 모델을 통해 산업 생태계의 관계 구조를 탐색하였다. 분석 결과, 자연어 정보를 활용한 그래프 모델이 가격 정보만을 사용한 경우 대비 기업 분류 정확도 면에서 우수한 성능을 보였다. 이는 자연어 정보가 기존 방식으로는 포착하기 어려운 산업 네트워크의 관계를 효과적으로 반영하고 있음을 시사한다. 본 연구의 의의는 최신 자연어 처리 기술과 그래프 신경망을 결합하여 산업 네트워크 분석의 새로운 프레임워크를 제시한 데 있으며, 이 접근법은 데이터 기반 전략 수립과 의사결정을 지원하는 데 있어 다양한 분야에 폭넓게 응용될 수 있을 것으로 기대된다.

more

목차

I. Introduction 1

II. Related Work 3
1. Graph Theory and Traditional Research 3
2. Graph Neural Networks 4
3. Graph Neural Networks in Finance and Economics 5
4. Natural Language Processing and Graph Neural Networks 6

III. Data 9

IV. Experimental Results and Analysis 11
1. Natural Language-based Analysis 12
1.1. Text Data Preprocessing 13
1.2. Text Embedding Using Language Models 14
1.3. Constructing Node Features and Edges Using Natural Language Data 15
1.4. Learning Natural Language-based Graph Models 16
1.5. Results of Learning Natural Language-based Graph Models 17
2. Stock Price-based Analysis 28
2.1. Data Construction 30
2.2. Link Prediction 31
2.3. Stock Price-based Graph Model Learning and Results 32
3. Comparison of Natural Language-based Analysis and Stock Price-based Analysis Results 34

V. Conclusion 36

more