검색 상세

A Visualization System Based on Unity3D for Multidimensional Analysis of Classified and Clustered Pap-Smear Data

분류와 군집화된 파프 도말 표본 데이터 다차원 분석을 위한 Unity3D 기반 시각화 시스템

초록/요약

Visual representation of data has become vital due to the high complexity and dimensionality of modern datasets collected from various industries. In the health sector, an increasing number of studies tried to find effective ways of analyzing medical data but the interesting patterns or structures that may exist in multi-dimensional spaces were not clearly reflected in their 2D data representation such as tables and charts. To this effect, we propose a new scientific data visualization system that leads to a more intuitive understanding and better perception of high-dimensional structures. As an experiment, this potentially powerful tool for multidimensional data visualization has utilized pap-smear test dataset which is classified by highly accurate algorithms including AdaBoost-based SVM-RFE or clustered by other methods so that it helps to identify either its useful patterns or misleading results from the analysis in a game-like environment. One restriction is that the input dataset should go through data cleaning and feature selection process before being loaded on the visualizer. As a result, the tool we developed using Unity3D can visualize up to an 8 dimensional scatter plot and let users customize it by mapping features into any given attributes of graphics to explore their massive and complex datasets.

more

초록/요약

다양한 산업에서 수집된 고차원의 복잡한 현대 데이터들로 인해 데이터의 시각적 표현은 필수가 되었다. 건강 분야에서 점점 더 많은 연구들이 의학 데이터를 효과적으로 분석할 방법을 찾고자 했지만, 다차원 공간에 존재할 수 있는 흥미로운 패턴들과 구조들은 테이블과 차트와 같은2D 데이터의 표시 방법에 명확히 반영되지 않았다. 이러한 취지로 우리는 고차원 구조들에 대한 보다 직관적인 이해와 더 나은 인식을 하도록 이끄는 새로운 과학적 데이터 시각화 시스템을 제시하고자 한다. 다차원 데이터 시각화를 위한 잠재적으로 강력한 이 도구는 매우 정확한 알고리즘인 AdaBoost-based SVM-RFE로 분류되거나 그 외 다른 방법들로 군집화된 파프 도말 표본 시험 데이터를 실험용으로 사용하여, 분석으로부터 나온 유용한 패턴 또는 빗나간 결과들을 게임과 같은 환경에서 확인할 수 있도록 했다. 한가지 제약은 입력 데이터가 그 가시화 도구에 로드 되기 전에 데이터 정리 및 피쳐 선택 과정을 거쳐야 하는 것이다. 결과적으로 우리가 Unity3D를 사용하여 개발한 그 도구는 거대하고 복잡한 데이터 세트를 탐색하도록 8차원까지 산점도를 시각화할 수 있으며, 사용자들은 원하는 대로 주어진 그래픽 특성들에 피쳐를 매핑하여 제작할 수 있다.

more