제한된 자원을 갖는 모바일 기기에 적합한 한국어 형태소 분석
Korean Morphological Analysis for Mobile Devices with Limited Hardware Resources
- 주제(키워드) 형태소분석 , 모바일기기
- 발행기관 서강대학교 일반대학원
- 지도교수 서정연
- 발행년도 2010
- 학위수여년월 2010. 2
- 학위명 석사
- 학과 일반대학원 컴퓨터공학과
- 실제URI http://www.dcollection.net/handler/sogang/000000045696
- 본문언어 한국어
- 저작권 서강대학교의 논문은 저작권에 의해 보호받습니다
초록/요약
형태소란 문장에서 의미를 갖는 최소 단위이다. 형태소 분석 및 품사 부착은 자연어 처리의 가장 기본적인 단계로 문장을 형태소 단위로 분리하는 작업이다. 한국어 형태소 분석 및 품사 부착에 대한 연구는 80년대부터 많이 이루어져 왔다. 규칙 기반 방법, 통계 기반 방법 등이 형태소 분석 및 품사 부착에 이용 되었다. 본 논문에서는 최근 활용도가 높아지고 있는 모바일 기기에 적합한 한국어 형태소 분석 및 품사 부착 방법을 제안한다. 모바일 기기는 계산 능력이 떨어지고 저장 공간과 사용 가능한 메모리가 부족하다는 특징을 갖는다. 따라서 모바일 기기에서 전통적인 방법을 사용하여 형태소 분석 및 품사 부착을 수행하기에는 한계가 있다. 본 논문에서는 기존의 규칙 기반 형태소 분석 방법인 좌최장일치법을 변형하여 형태소 분석을 수행 한다. 여기에 통계적인 방법인 Hidden Markov Model(HMM)을 축소해서 적용하여 형태소 품사 부착을 수행한다. 제안하는 시스템은 기존의 HMM을 사용한 시스템과 비교하여 적은 저장 공간과 메모리만을 사용하고 월등히 빠른 속도로 형태소 분석 및 품사 부착을 수행한다.
more초록/요약
Although many researches on Korean Morphological Analysis and Korean POS (Part-of-Speech) tagging have been performed since 1980s, it is not easy to find a Korean POS tagger for mobile devices. We will introduce a Korean POS tagger that performs well on mobile devices such as cellular phones and portable media players. Mobile devices have some critical restrictions that a computing power is low and a working memory capacity is small. Therefore, it may be impossible to perform POS tagging on mobile devices by using traditional methods based on statistical information. Our system performs morphological analysis by using a rule-based method (a modified left-longest-match-preference method), and performs POS tagging by using a statistical method (a Reduced Hidden Markov Model). In the experiments, our system requested smaller memory use and showed faster tagging speed than the system based a traditional Hidden Markov Model.
more

