지식생산기관의 협력 연구 성과 측정 및 평가 방법 연구 : 디지털 헬스 분야를 중심으로
Study on Methods for Measuring and Evaluating Collaborative Research Outcomes of Knowledge-Producing Institutions: Focusing on the Digital Health Sector
- 주제어 (키워드) 데이터 경제 , 디지털 헬스 , 서지정보 기반 지식생산기관 식별 , 서지정보의 부정확성 , 저자 정보 기반 기관 고유식별자 , 규칙 기반 알고리즘 , 병원의 협력 연구 , 병원과 협력 연구 효과 , Data Economy , Digital Health , Bibliographic Information-Based Knowledge-Producing Institution Identification , Inaccuracies in Bibliographic Information , Author Information-Based Unique Institutional Identifier , Rule-Based Algorithm , Impact of Accurate Institutional Identification , Collaborative Research of Hospitals , Effects of Hospital Collaborative Research
- 발행기관 서강대학교 일반대학원
- 지도교수 문성욱
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 박사
- 학과 및 전공 일반대학원 기술경영학협동과정
- 실제 URI http://www.dcollection.net/handler/sogang/000000079121
- UCI I804:11029-000000079121
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
현대에는 개인 연구자 대부분이 지식생산기관에 소속되어 지식생산기관의 유형과 지식생산기관 간의 협력이 과학 지식생산에 미치는 영향이 높음에도 불구하고, 이에 대한 연구가 부족하다. 특히, 지식생산기관이 정확히 식별되지 않아 과학 지식생산 과정을 실증적으로 파악하는 데는 한계가 있으며, 고유한 특징을 지닌 지식생산기관의 연구 성과와 협력 효과도 측정하기 어렵다. 따라서 본 연구에서는 정보통신기술(ICT)과 헬스케어가 융합되어 다양한 형태의 지식생산기관이 활발하게 협력하고 있는 디지털 헬스 분야를 중심으로 연구 성과를 분석하였다. 구체적으로 데이터경제 관점에서 디지털 헬스의 주된 영역인 의료 부문을 고찰하고, 과학 기술 발전을 계량적으로 연구하는데 널리 활용되고 있는 서지 정보에서 지식생산기관 식별 정확도를 높이는 방안을 제시하였다. 이를 바탕으로 다른 지식생산기관과 구별되는 특징을 가지고 있지만 ‘숨겨진 연구시스템’인 병원의 참여 효과를 실증적으로 분석하였다. 먼저 제2장의 연구는 문헌 연구를 통해서 데이터경제의 주요 특징을 플랫폼(platform) 구축, 예측력(predictive power) 강화, 새로운 분석모델(new analytical model)의 활용으로 정리하고, 이에 입각하여 우리나라의 금융, 부동산, 의료 부문 간 데이터 기반 활동의 정도를 비교 분석하였다. 분석 결과 금융, 부동산, 의료 부문별로 데이터경제 특징이 실현되고 있는 속도와 내용이 다르다는 것이 관찰되었다. 특히 의료 부문의 속도가 가장 저조하였다. 이는 데이터경제의 확산을 위해서 의료 부문의 차별화된 정책 접근이 필요하다는 것을 시사하며, 이를 기반으로 디지털 헬스 분야 연구 성과를 측정하기 위한 변수를 설계하였다. 제3장에서는 지식생산기관의 식별 정확도를 높이는 방법을 제안하였다. 구체적으로 디지털 헬스 분야의 PubMed 서지정보를 수집한 후 알고리즘을 적용하기 전 데이터 처리 단계에서 ‘맥락적 연결’을 활용하여 기관 정보의 불완전성을 해소하고, 알고리즘 적용 단계에서는 기관명 모호성을 개선하는 방법을 제시하였다. 연구 결과 산출된 ‘지식생산기관 데이터셋’과 동일한 서지정보를 대상으로 하는 기존 공개 데이터셋인 ‘PKG datasets’을 비교했을 때, 본 연구가 제시한 방법은 지식생산기관 데이터셋에 포함된 대상 데이터 수를 2배로 증가시켰으며, 국가별 순위도 보다 정확하게 반영하였다. 또한 한국 지식생산기관의 디지털 헬스 분야 기여도가 과소 또는 과대 평가되고 있다는 사실도 발견하였다. 마지막으로 제4장에서는 제3장의 연구 결과로 생성된 지식생산기관 식별 데이터를 바탕으로 디지털 헬스 분야에서 병원의 참여가 연구 성과에 미치는 영향을 실증 분석하였다. 디지털 헬스 분야에서 한국의 지식생산기관이 참여한 PubMed 서지정보를 기반으로, 미국국립보건원(National Institutes of Health, NIH)이 제공하는 iCite 및 MeSH 데이터를 활용해서 연구의 영향도(influence)와 참신성(novelty)을 측정하였다. 연구결과 병원의 참여는 연구의 영향도를 증가시키고, 참신성을 감소시키는 패턴이 발견되었다. 또한 협력 유형별로도 병원의 참여 효과에 대해 동일한 패턴이 유지되었으나, 효과의 크기에는 차이가 있었다. 이는 병원이 연구 기관으로서 더 많은 학문적 관심을 받을 필요가 있음을 시사한다. 본 연구의 주요 기여는 지식생산기관을 식별하는 방법과 지식생산기관의 특성에 따른 연구 성과를 측정하는 방법을 제시하는 것이다. 이를 통해 지식생산기관 유형별로 생산되는 지식의 차이와 지식생산기관 간 협력의 성과를 보다 정확하게 측정할 수 있었다. 이는 향후 과학 지식을 생산하고 과학 혁신을 달성하는 데 있어 지식생신기관의 역할을 실증적으로 연구하는 데 기여할 것으로 판단된다.
more초록 (요약문)
In contemporary times, most individual researchers are affiliated with knowledge production institutions. However, research on the impact of these institutions' types and their collaborations on scientific knowledge production is lacking. The challenge of accurately identifying knowledge production institutions limits the empirical understanding of the scientific knowledge production process and hinders the measurement of research performance and collaboration effects of institutions with unique characteristics. This study focuses on the digital health field, where information and communication technology (ICT) and healthcare converge, fostering active collaboration among various types of knowledge production institutions, to analyze research performance. Specifically, from the perspective of the data economy, it examines the healthcare sector, a key area of digital health, and proposes methods to improve the accuracy of identifying knowledge production institutions in bibliographic information widely used for quantitative research on scientific and technological advancements. Based on this, the study empirically analyzes the impact of hospital participation, considered a 'hidden research system' with distinct characteristics from other knowledge production institutions, on research performance. First, Chapter 2 summarizes the key features of the data economy—platform building, enhancement of predictive power, and utilization of new analytical models—through a literature review. It compares the extent of data-based activities in Korea's financial, real estate, and healthcare sectors. The analysis reveals that the speed and content of data economy realization differ by sector, with the healthcare sector lagging behind. This suggests that differentiated policy approaches are necessary for the healthcare sector to advance the data economy. Based on this insight, variables were designed to measure research outcomes in the digital health field. Chapter 3 proposes methods to improve the accuracy of identifying knowledge production institutions. Specifically, by collecting PubMed bibliographic information in the digital health field and using 'contextual linkage' to address data incompleteness before applying algorithms, and suggesting methods to improve Institution Name Disambiguation (IND) in the algorithm application stage. Compared to the existing open dataset 'PKG datasets,' which targets the same bibliographic information, the proposed method doubled the number of target data included in the knowledge production institution dataset and more accurately reflected country rankings. Using this method, it was found that the contribution of Korean knowledge production institutions in the digital health field was either underestimated or overestimated. Finally, Chapter 4 analyzes the impact of hospital participation on research performance in the digital health field based on the knowledge production institution identification data generated in Chapter 3. Using PubMed bibliographic information from Korean knowledge production institutions in the digital health field, and leveraging data from iCite and MeSH provided by the National Institutes of Health (NIH), the study measures the influence and novelty of the research. The results show that hospital participation increases the influence of research but decreases its novelty. Additionally, although the participation effects of hospitals remained consistent across different types of collaborations, the magnitude of these effects varied. This suggests that hospitals, as research institutions, deserve more academic attention. The main contribution of this study is to propose methods for accurately identifying knowledge production institutions and measuring research performance according to their characteristics. This enabled a more precise measurement of the differences in knowledge produced among different types of knowledge-producing institutions and the performance of collaboration between these institutions. It is expected to contribute to future empirical research on the role of knowledge production institutions in producing scientific knowledge and achieving scientific innovation.
more목차
Ⅰ. 서론 1
1.1. 연구의 배경 및 목적 1
1.2. 연구 개요 4
Ⅱ. 한국의 데이터경제 현황 및 평가: 금융, 부동산, 의료 부문을 중심으로 6
2.1. 서론 6
2.2. 데이터경제의 특징 7
2.2.1. "전통" 경제와의 차이 7
2.2.2. 데이터경제의 핵심 동인 9
2.2.2.1. 플랫폼(Platform) 구축 9
2.2.2.2. 예측력(Predictive Power) 강화 11
2.2.2.3. 새로운 분석모델(New Analytical Model) 활용 13
2.3. 부문별 데이터경제 현황: 금용, 부동산, 의료 15
2.3.1. 금융부문 15
2.3.2. 부동산 부문 17
2.4. 부문별 데이터경제 평가: 금융, 부동산, 의료 19
2.4.1. 데이터경제 대응 노력 평가 틀 19
2.4.1.1. 국내 데이터 플랫폼 현황 22
2.4.1.2. 국내 데이터 플랫폼 현황과 특징 23
2.4.1.3. 평가지표 28
2.4.2. 데이터경제 대응 노력 부문별 평가 29
2.4.2.1. 플랫폼 구축 노력 29
2.4.2.2. 예측력 강화 노력 32
2.4.2.3. 새로운 분석모델 활용 노력 34
2.4.2.4 부문별 대응 노력 비교 35
2.5. 시사점 36
Ⅲ. 디지털 헬스 분야 지식생산기관 식별 정확도 제고 방안 38
3.1. 서론 38
3.2. 지식생산기관 식별의 한계 40
3.2.1. 부정확한 서지정보 40
3.2.2. 지식생산기관 식별 알고리즘의 한계 43
3.2.3. 개선 전략 46
3.3. 디지털 헬스 분야 서지정보 구축 48
3.3.1. PubMed 서지정보의 특징 48
3.3.2. 디지털 헬스 분야 PubMed 데이터의 수집 50
3.4. 지식생산기관 식별 개선: 데이터와 알고리즘 52
3.4.1. 저자 소속 데이터 전처리: 서지정보의 부정확성 개선 52
3.4.2. 고유 식별자를 활용한 알고리즘을 통한 지식생산기관의 식별 55
3.5. 지식생산기관 식별 개선 결과 59
3.5.1. 지식생산기관 식별 정확도 개선 59
3.5.2. PKG datasets과의 비교 63
3.5.2.1. 기관 식별에 활용 가능한 데이터 규모 63
3.5.2.2. 기관 식별 데이터 질 비교: 한국 디지털 헬스 분야 지식생산기관 식별을 중심으로 66
3.6. 결론 70
Ⅳ. 디지털 헬스 분야에서 병원의 참여가 연구 성과에 미치는 영향 72
4.1. 서론 72
4.2. 이론적 배경과 가설 73
4.2.1. 연구기관으로써 병원의 특징 73
4.2.2. 협력 유형별 병원 참여 효과 75
4.3. 연구방법 78
4.3.1. 데이터 78
4.3.2. 변수정의 79
4.3.2.1. 종속변수 79
4.3.2.2. 독립변수 81
4.3.2.3. 통제변수 81
4.3.3. 연구모델 82
4.4. 분석 결과 91
4.4.1. 병원의 참여 효과 91
4.4.2. 협력 유형별 병원 참여 효과 94
4.5. 결론 96
Ⅴ. 결론 98
5.1. 결과의 요약 및 논의 98
5.2. 연구의 의의 및 한계 100
참고문헌(reference) 102