검색 상세

특허문헌의 청구항 내용을 반영한 특허가치평가 변수 제안 및 검증 연구 : 자연어처리기술과 네트워크를 활용하여

Proposal and Verification of Patent Value Evaluation Variables Reflecting the Claims of Patent Literature : Utilizing Natural Language Processing Technology and Networks

초록 (요약문)

지식재산의 가치평가는 금융권에서 점점 중요해지고 있는데, 이에 활용되는 자동화 평가 모형은 특허 문헌이 담고 있는 기술적인 내용을 다루지 않는다는 점에서 한계가 있다. 본 연구는 이를 보완하기 위해 특허 문헌의 내용을 Sentence-Bert 자연어처리기술을 통해 벡터화한 후 특허 문헌 간 유사도를 도출하였다. 문헌 간 유사도와 출원시기를 이용하여 생성한 특허 문헌 네트워크를 통해 기술적인 내용을 반영하면서도 총피인용(인용) 수 변수를 보완할 수 있는 Indegree(Outdegree) Centrality를 구하였고, 두 Centrality 변수의 차이인 순피인용 지수 변수를 제시하였다. 로짓모형을 통해 순피인용 지수의 부호를 검증한 결과 양의 계수가 도출되어 예상과 일치함을 확인하였다. 또한, 로짓모형과 Xgboost 분류모형을 활용한 예측력 평가에서 새로운 변수가 존재하지 않을 때보다 존재 하는 경우 예측력이 상승하는 결과를 얻을 수 있었다. 마지막으로 섀플리값(Shapley value)을 활용한 설명력에 대한 기여도 평가 결과, 로짓모형과 Xgboost 분류모형에서 순피인용 지수가 대체로 높은 설명력 기여도를 가진다는 사실을 알아내었다. 이러한 결과는 지식재산가치평가모형에 자연어처리기술을 활용한 변수를 추가함으로써 특허가치 자동화평가모형의 신뢰도를 제고할 수 있음을 시사한다.

more

초록 (요약문)

The valuation of intellectual property is becoming increasingly important in the financial sector; however, the automated evaluation models used for this purpose have limitations in that they do not address the technical content contained in patent literature. To complement this, this study vectorized the content of patent literature using Sentence-Bert natural language processing technology and derived the similarity between patent documents. By utilizing the similarity between documents and the filing dates, a patent literature network was created, which allowed for the calculation of Indegree(Outdegree) Centrality to complement the total (forward and backward) citation count variable while reflecting the technical content. Additionally, a net citation index variable, which is the difference between the two Centrality variables, was proposed. The sign of the net citation index was verified through a logistic model, resulting in a positive coefficient that confirmed the expected outcome. Furthermore, in the evaluation of predictive power using the logistic model and Xgboost classification model, it was found that the predictive power increased when the new variable was present compared to when it was absent. Finally, the contribution to explanatory power evaluated using Shapley value revealed that the net citation index generally had a high explanatory power contribution in both the logistic model and the Xgboost classification model. These results suggest that adding variables utilizing natural language processing technology to the intellectual property valuation model can enhance the reliability of automated patent value evaluation models.

more

목차

Ⅰ. 서론 1
Ⅱ. 특허가치 및 인용에 관한 선행문헌연구 3
Ⅱ.A. 화폐 단위로 측정한 특허가치 3
Ⅱ.B. 수명 단위로 측정한 특허가치 4
Ⅱ.C. 특허 경제적 수명 추정 4
Ⅱ.D. 인용과 특허의 가치 5
Ⅱ.E. 특허 네트워크와 인용 5
Ⅱ.F. 선행연구와의 차별점 6
Ⅲ. 데이터 및 모형 구축 7
Ⅲ.A. 모형 가정 7
Ⅲ.B. 데이터 수집 7
Ⅲ.C. 텍스트 데이터 가공 8
Ⅲ.D. 특허 네트워크 구축 9
Ⅲ.E. 평가모형 변수 10
Ⅲ.E.1. 네트워크 중심성 변수 10
Ⅲ.E.2. 종속변수 11
Ⅲ.E.3. 독립변수 12
Ⅳ. 분석 결과 13
Ⅳ.A. 기초통계량 13
Ⅳ.B. 상관관계 15
Ⅳ.C. 변수 선정 및 새로운 변수 도입 후 기초통계량, 상관관계 18
Ⅳ.D. 분석 결과 19
Ⅳ.D.1. 로짓모형 계수 추정을 통한 부호 검증 19
Ⅳ.D.2. 모형의 예측력 평가 23
Ⅳ.D.3. 순피인용 지수의 설명력에 대한 기여도 26
Ⅴ. 시사점 및 한계점 30
참고문헌 32

more