단일 클래스 지지 벡터 기계로 보강된 최근접 평균 분류와 특징 선택 방법 : One-Class Support Vector Machine-Assisted Nearest Mean Classification with Feature Selection
- 발행기관 서강대학교 대학원
- 지도교수 김세준
- 발행년도 2008
- 학위수여년월 2008. 8
- 학위명 석사
- 학과 및 전공 컴퓨터학과
- 식별자(기타) 000000108471
- 본문언어 영어
목차
Classification is one of the most important tasks in the field of machine learning and pattern recognition. The ultimate goal of classification is to achieve the best possible classification performance for the problem at hand. This objective has led to the development of numerous classification methods and techniques. It has been observed that different classifiers offer complementary information about the examples to be classified which could be harnessed to improve the performance of the selected classifier.
These observation motivated the interest in combining multiple classifiers. Various classifier combination schemes have been devised and it has been experimentally demonstrated that some of them consistently outperform a single best classifier. We present a novel approach to classification which belongs to this category of combining multiple classifiers. Specifically, we propose a new multi-class classification algorithm based on one-class Support Vector Machine and Nearest Mean Classifier methods. A wrapper-style feature selection scheme designed specifically for our algorithm is also provided for increased classification accuracy.
It will be demonstrated that the proposed classification algorithm provide excellent performance, and in particular, performs strictly better than some of the currently known best classification algorithms on six real world datasets. Furthermore, our method has some desirable characteristics that many other classification methods do not have all at the same time, such as straightforward extensions to multi-class settings, applicability of kernel functions, and a feature subset selection scheme for the classification algorithm.
목차
기계 학습 및 패턴 인식의 분야에서 분류는 가장 중요한 작업 중 하나이다. 분류의 궁극적인 목적은 주어진 문제에 대하여 최선의 분류 정확도 및 성능 얻는 데에 있다. 이러한 목적은 수많은 분류 방법 및 기법들의 개발을 이끄는 원동력이 되었다. 서로 다른 분류기들은 분류의 대상이 되는 표본들에 대하여 상호 보완적인 정보를 제공하며, 이를 효과적으로 이용하면 선택된 분류기의 성능을 향상시킬 수 있음이 보여졌다.
이러한 관찰은 여러 분류기들을 결합하는 것에 대한 관심을 유발하는 동기가 되었다. 지금까지 다양한 분류기 결합 방법들이 연구되었으며, 이들 중 몇몇 결합 방법들은 가장 성능이 좋은 하나의 단일 분류기 보다 일관성 있게 성능이 뛰어나다는 사실이 실험적으로 보여졌다. 우리는 이러한 분류기 결합 방법에 속하는 새로운 접근 방법을 제시한다. 구체적으로 우리는 단일 클래스 지지 벡터 기계와 최근접 평균 분류법에 기반한 새로운 멀티클래스 분류 알고리즘을 제시한다. 더불어 분류 정확도의 향상을 위해 우리의 분류 알고리즘을 위한 특징 선택 방법도 함께 제시한다.
우리의 분류 알고리즘의 우수한 성능은 실험을 통해 보여질 것이며, 특히 현재까지 알려진 가장 좋은 분류 알고리즘들보다 엄밀히 좋은 성능을 발휘한다는 사실을 여섯 개의 실제 데이타에 대한 실험을 통하여 보인다. 나아가 우리의 분류 방법은 멀티클래스 문제로의 확장성, 커널 함수의 적용 가능성, 그리고 분류 알고리즘에 특화된 특징 선택 방법의 존재와 같은 다른 분류 방법들은 동시에 가지기 힘든 장점들을 모두 가지고 있다.

