지속가능경영보고서 발간 기업 간 네트워크 분석 : Large Language Model을 활용한 의미적 유사도를 중심으로
Network Analysis of Companies Publishing Sustainability Reports : Focusing on Semantic Similarity Using Large Language Models
- 주제어 (키워드) ESG , 지속가능경영보고서 , 거대언어모델 , 검색증강생성 , 네트워크 분석; Sustainability Report , Large Language Model (LLM) , Retrieval Augmented Generation (RAG) , Network Analysis
- 발행기관 서강대학교 일반대학원
- 지도교수 정재식
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 석사
- 학과 및 전공 일반대학원 경제학과
- 실제 URI http://www.dcollection.net/handler/sogang/000000079071
- UCI I804:11029-000000079071
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
ESG에 대한 관심이 확대됨에 따라 국내외 기업들은 다양한 형태의 지속가능 경영보고서를 공시하고 있지만 그 양이 매우 많고, 평가기준 또한 일관되지 않는 한계점이 있다. 본 연구의 목적은 거대언어모델(Large Language Model) 과 네트워크 분석기법을 활용하여 일관되지 않은 ESG 평가 가이드라인을 극복 하고, 대규모 지속가능경영보고서 내용을 체계적으로 분석하는 것에 있다. 이 를 위해 자연어로 구성된 비정형적 보고서 데이터로부터 거대언어모델의 검색 증강생성(Retrieval Augmented Generation) 기법을 활용하여 환경 (Environment), 사회(Social), 지배구조(Governance) 관련 내용을 추출하여 의미적 유사도를 활용한 네트워크 구성 및 다양한 분석기법(최소신장트리, 노 드 중심성 분석)을 통해 각 기업의 네트워크에서의 역할과 ESG 영역별 중심 기업을 탐구하였다. 네트워크에서 중심성이 높은 기업의 보고서 내 키워드를 통해 ESG 영역별 기업 전략의 특징을 분석하였고, 중심성과 ESG ETF 구성 기 업과의 상관관계를 분석하여 네트워크와 시장의 연관성을 확인하였다. 그 결 과 네트워크에서 중심 노드에 해당하는 기업은 노드 중심성의 유형에 따라 다 양한 역할을 하는 것을 확인할 수 있었다. 또, 중심성과 ETF의 상관관계에서 환경과 지배구조 분야는 약한 상관관계 또는 음의 상관관계를 보인 반면, 사 회 분야에서 높은 중심성을 보이는 기업이 ETF 구성 종목과 높은 상관성을 나타냈다.
more초록 (요약문)
With the growing interest in ESG, companies worldwide are disclosing various forms of sustainability reports. However, the vast amount of data and in consistent evaluation criteria present significant challenges. The purpose of this study is to overcome the inconsistent ESG evaluation guidelines and systematically analyze the extensive content of sustainability reports using Large Language Models(LLM) and network analysis techniques. By employing the Retrieval Augmented Generation(RAG) method of LLMs, we extracted information related to Environment, Social, and Governance(ESG) from unstructured reports written in natural language. We then constructed and analyzed networks based on semantic similarity using various techniques, including Minimum Spanning Tree and centrality analysis, to explore each company's role and identify key companies in each ESG domain within the network. Through the keywords in the reports of companies with high centrality in the network, we analyzed the characteristics of corporate strategies in each ESG domain. Additionally, we examined the correlation between centrality and the composition of ESG ETFs to verify the relationship between the network and the market. The results revealed that companies corresponding to central nodes in the network play diverse roles depending on the type of node centrality. Furthermore, while the environmental and governance domains showed weak or negative correlations, companies with high centrality in the social domain exhibited strong correlations with ETF components.
more목차
1. 서론 1
2. 선행 연구 3
3. 분석자료 6
4. 분석방법론 13
4.1 최소 신장 트리 활용 네트워크 연결성 분석 13
4.2 노드 중심성을 통한 네트워크 내 기업의 중요성 분석 14
4.3 네트워크 내 상위 5개 중심 노드 기업의 키워드 분석 16
1) 데이터 준비 16
2) 데이터 준비 16
3) 키워드 추출과 해석 17
4.4 지속가능경영보고서 중심성과 ESG 관련 ETF의 연관성 분석 18
5. 실증분석 결과 20
5.1. 최소신장트리 분석 결과 20
5.2 중심성 분석 결과 24
5.3 키워드 분석 결과 32
5.4 지속가능경영보고서 중심 36
6. 결론 40
참고문헌 43