검색 상세

On the Automatic Recognition of Jeongganbo Music Notation

초록(요약문)

The Jeongganbo notation, the first music representation system in East Asia capable of jointly expressing pitch and duration, has been extensively used—and still is—in the Korean music tradition since its inception in the 15th century. In this regard, there exists a plethora of music works that exclusively endure as physical sheets, which not only constitutes a heritage preservation challenge due to the inherent degradation of this format but also impedes the use of computational tools to study and exploit this music tradition. While the Optical Music Recognition (OMR) field, which represents the research area devoted to devising methods capable of automatically transcribing music sheets into digital formats, has addressed this issue in a number of music notations from the Western tradition, no previous research has considered the preservation of Jeonganbo scores. In this context, this work presents the following contributions: (i) the first data assortment of real Jeongganbo scores for OMR tasks; (ii) a collection of synthetic data generation and augmentation mechanisms to alleviate the scarcity of manual annotation; and (iii) a neural-based transcription scheme based on state-of-the-art OMR strategies specifically tailored to Jeongganbo scores. The experiments performed prove the validity of the approach—performance rates close to a 90% of success—and open new research avenues for under-resourced yet challenging music notations.

more

초록(요약문)

정간보는 동아시아 최초의 유량 악보이며, 15세기에 세종대왕에 의해 창안된 이래로 국악 전통에서 광범위하게 사용되어 왔다. 상당한 양의 음악 작품들이 정간보로 기록되어 보존되고 있으나, 대부분이 물리적 형태로 존재하는 한계를 지닌다. 이는 물리적 형태가 지니는 본질적인 열화에 대한 문제 뿐만 아니라, 음악 전통을 연구하고 활용하기 위한 전산적 방법론 적용을 저해하는 요인이 된다. 악보를 디지털 형식으로 자동 전사하는 방법을 개발하는 연구 분야인 광학 음악 인식 (Optical Music Recognition, OMR) 분야에서는 서양 전통의 여러 음악 기보법에 대해 해당 문제를 다루어 왔으나, 정간보 악보에 관한 선행 연구는 존재하지 않았다. 이러한 맥락에서 본 연구는 다음과 같은 기여점을 가진다. 첫째, 최초의 OMR 작업을 위한 정간보 악보 데이터셋 제시. 둘째, 훈련 자원 부족을 해결하기 위한 합성 데이터 생성 및 증강 기법 제안. 셋째, 정간보 악보에 특화된 최신 OMR 방법론 기반의 인공신경망 전사 모델 제안. 이상의 기여점들은 실험을 통해 타당성이 입증되었으며, 최종 모델은 평가 데이터셋에 대해 약 90%의 성공률을 달성하였다.

more

목차

1 Introduction 3
2 Background 8
2.1 Language Model 8
2.2 Sequence-to-Sequence Model 9
2.3 Transformer 10
2.3.1 Transformer Encoder 10
2.3.2 Transformer Decoder 11
2.4 Convolutional Neural Networks 12
3 Fundamentals of Jeongganbo Notation 14
3.1 The Jeonggan Unit 15
3.2 Ornamentation 17
4 Jeongganbo Score Dataset 19
4.1 Encoding Format 20
4.2 Jeonggan Segmentation and Annotation Stages 23
4.3 Synthetic Data 25
4.3.1 Data Generation 25
4.3.2 Data Augmentation 28
5 Neural Recognition Framework 30
6 Experimentation 33
6.1 Neural Model Configuration 33
6.2 Data Partitions 34
6.3 Evaluation Metrics 36
7 Results 39
7.1 Performance Analysis and Insights Based on the Train Data 40
7.2 Influence of the Data Generation and Augmentation Procedures 41
7.3 Statistical Significance Analysis 44
8 Application 46
8.1 Automatic Transcription and Rendering: the Jeongak Score Book 46
8.2 Symbolic Music Generation 47
9 Conclusions 50
Bibliography 52

more