검색 상세

다양한 국내 연속간행물 일련번호에 대한 정형화 방법

A Formalizing Method for Various Enumeration Description Data of Korean Periodical Publications

초록/요약 도움말

연속간행물 발행 시 부여되는 다양한 형태의 권, 호 정보는 출판의 다양성과 시대 및 지역에 따라 다양한 표기법이 사용됨에 따라 형태의 규칙성을 찾기란 쉽지 않다. 관련 표준에 따라 표기 및 입력을 권장하지만 기관 간의 메타데이터 교환 시 권, 호 표기 방식이 통일되지 않아 메타데이터를 구축, 관리하는 기관의 입장에서는 불규칙한 권, 호 정보 중 의미 있는 숫자 데이터를 추출하여 따로 관리하거나 표준입력방식에 따라 변환해야 하는 문제점이 있다. 본 논문에서는 도서관에서 보유하고 있는 연속간행물의 다양한 권, 호 정보의 캡션데이터를 일반화하고 텍스트 형태로 기술된 넘버링데이터를 숫자 형태의 데이터로 변환하는 규칙 및 스키마를 제안한다. 제안한 방법에서는 연속간행물의 권, 연차 데이터의 다양성을 조사하고 이를 바탕으로 데이터 형태별로 일반화와 정형화 규칙을 설계한다. 마지막으로 권, 연차 표기 방법에 대한 여러 가지 국/내외 표준 기술의 종류를 파악하여 각 표준의 특징과 장, 단점을 비교 분석 후 제안하고자 하는 스키마의 조건에 가장 맞는 표준을 선정하여 스키마 설계 시 이를 최대한 반영 한다. 스키마 설계 과정에서 텍스트 형식의 넘버링 데이터 형태 및 연차표기 형태 구분을 위한 코드정보 테이블을 별도로 구현하여 이를 통해 원본 데이터에서 기술된 데이터의 의미적 정보를 최대한 반영 하고 캡션과 넘버링 형태를 관리할 수 있도록 고려한다. 마지막으로 데이터 변환 규칙과 제안된 목표 데이터 스키마를 구현하고자 하는 시스템에 적용하고 구현을 통하여 그 유용성을 분석한다.

more

초록/요약 도움말

It is hard to find any regularity of pattern string for serials’ enumeration and chorology due to variety of periodical publications and different kind of data description methods per regions and generations during publishing. Although there are global standards way to catalogue, many troubles have come over exchanging holding data between institutions because of using institutional internal format for enumeration numbering. Therefore institutions need to manage those data separately with extra efforts by extracting meaningful numbering value out of uneven descriptive enumeration data or converting the data into new formatted one based on the standards. In this thesis, new conversion rules and target schema will be discussed. The rules applied to normalizing process for caption string and formalizing process for numbering data that come from various institutional serials’ enumeration and chronology description. In order to define conversion rules, sample data analysis has been made to categorize descriptive patterns of various serials’ volume-issue. Relevant current global standards were reviewed by comparing its characteristic advantages to design the target schema for converted data. Database tables were created to contain not only the conversion rules but also predefined codes information that identifies meaning of the original numbering value. Finally, tests were made over the conversion system to verify its result where the rules applied.

more