대규모 언어 모델을 활용한 특허 청구범위 생성
Patent Claim Generation using Large Language Model
- 주제어 (키워드) 특허 , 청구항 , 청구범위 , 프롬프팅 , Patent , Claim , Claims , Prompting
- 발행기관 서강대학교 정보통신대학원
- 지도교수 구명완
- 발행년도 2024
- 학위수여년월 2024. 8
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제 URI http://www.dcollection.net/handler/sogang/000000078952
- UCI I804:11029-000000078952
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록 (요약문)
대규모 언어 모델의 출시 이래로, 프롬프트 엔지니어링에 대한 연구가 활발히 이루어지고 있다. 프롬프트 엔지니어링은 대규모 언어 모델의 재학습이 요구되지 않기에 비용 효과적이고, 효율적인 문제 해결이 가능하다는 장점이 있다. 또한, 프로그래머가 아닌 사람들도 쉽게 사용할 수 있다는 점에서 접근성이 높다. 한편, 특허 청구범위는 발명을 보호하고자 하는 사항이 정의된 문서로, 특허 전문가인 변리사는 특허 청구범위를 작성하기 위해 발명을 이해하는 것뿐 아니라, 특허법 지식을 토대로, 발명을 가장 잘 보호할 수 있는 청구범위를 설정한다. 최근 공개된 대규모 언어 모델은 고도의 추론 능력을 바탕으로 문제를 풀 수 있고, 프롬프트 엔지니어링으로 추론 능력을 향상시킬 수 있다는 점에서, 발명을 입력했을 때, 특허 청구범위를 생성해낼 수 있을 것으로 예상된다. 다만, 변리사와 같이 발명을 가장 잘 보호할 수 있는 특허 청구범위를 만들어 낼 수 있는지에 대해서는 제대로 논의된 바가 없다. 본 논문에서는 대규모 언어 모델을 활용하여 발명을 가장 잘 보호하는 청구범위를 생성할 수 있도록 하기 위해, 변리사가 청구범위를 작성하는 방식을 모사하는 프롬프트를 제시한다. 결과로, 발명을 트리 구조로 재구성한 발명 트리와 청구범위의 설계 내용을 담은 청구범위 설계서를 같이 입력할 경우, 발명 트리만을 입력하여 청구범위를 생성하는 것 대비, 타겟 청구항과의 유사성이 크게 향상되는 것을 확인하였다.
more초록 (요약문)
Since the release of large language models, research on prompt engineering has been actively conducted. Prompt engineering has the advantage of being cost-effective and capable of solving problems efficiently, as it does not require retraining large language models. Furthermore, it is highly accessible as it can be easily used by non- programmers. Meanwhile, a patent claim is a document that defines the matters to be protected by an invention. A patent attorney drafts patent claims by understanding the invention and setting the claims to best protect it. Recently released large language models can solve problems based on their advanced reasoning abilities, and their reasoning can be enhanced through prompt engineering. Therefore, it is expected that they can generate patent claims when provided with an invention. However, there has been no proper discussion on whether they can generate patent claims that protect the invention as well as a patent attorney does. In this paper, we present prompts that mimic the way patent attorneys draft claims to enable large language models to generate claims that best protect the invention. As a result, we found that when the invention is reconstructed into an invention tree and a claim design is inputted together, the similarity with the target claims is significantly improved compared to generating claims by inputting only the invention tree.
more목차
제 1 장 서론 1
제 1 절 연구 배경 및 목적 1
제 2 절 연구 내용 3
제 3 절 논문 구성 3
제 2 장 관련 연구 4
제 1 절 특허 생성에 관한 연구 4
제 2 절 프롬프트 엔지니어링에 관한 연구 6
제 3 장 특허 청구범위 생성 프롬프트 제안 10
제 1 절 특허 청구범위 작성 프로세스 10
제 2 절 효과적인 발명의 이해를 위한 입력 형태 12
제 3 절 청구범위 생성 프롬프트 제안 15
제 4 장 실험 및 분석 18
제 1 절 대규모 언어 모델을 활용한 데이터 생성 18
제 2 절 F1 점수 및 GPT-4를 활용한 유사도 평가 방법 26
제 3 절 청구범위 생성 실험 및 결과 28
제 5 장 결 론 47
참고 문헌 49