검색 상세

Systematic Evaluation of Neural Network for Roman Numeral Analysis

로마 표기 화성법 분석을 위한 신경망의 체계적 평가

초록

In the Western Classical tonal music, harmonic analysis is a critical element for understanding music, prompting extensive research in the Music Information Retrieval (MIR) field. Two primary representation systems used in harmonic analysis are chord symbol charts and Roman Numeral Analysis (RNA). Particularly, machine learning methods are deemed well-suited for addressing the complex challenges inherent in Roman numeral Analysis (RNA), which has led to a significant increase in research interest within this domain. Despite numerous studies, RNA continues to face inherent limitations, maintaining its status as a vital ongoing research challenge. This study builds upon related works in Computational approaches and Multitask Learning (MTL), the latter of which has demonstrated high performance through the output of six distinct features. However, there has been a lack of systematic evaluation to determine whether these methods fully address the limitations of RNA and achieve meaningful performances. Recent studies have highlighted the need for actual accuracy verification due to random variability, a critical aspect applicable across all research fields. In the context of RNA, it is crucial to systematically evaluate and confirm the presence of substantial and meaningful performance differences, including those arising from random factors. This study, grounded in these needs, proposes a systematic evaluation of RNA using neural networks to verify the presence of significant performance differences. The experiment comprises three phases: firstly, the base model, AugmentedNet, was implemented before conducting evaluation experi- ments. Secondly, a systematic evaluation was experimented with the proposed AugmentedNet model’s structure and the six features consistently used in MTL, examining for performance differences through ablation studies, cross- validation, and random seed assessing the impact of random variability on meaningful performance outcomes. Lastly, an expert analysis was conducted to discuss challenging tasks where evaluated models consistently predicted incorrectly. This study is expected to contribute academically to the RNA and MIR fields, and it aims to establish an efficient verification experiments that can be effectively utilized in tonal Western Music analysis. Keywords: Roman Numeral Analysis, Systematic, Evaluation, Symbolic Music, Neural Network, Automatic Chord Recognition, Chord Prediction, Roman Numeral Prediction

more

초록

서양 고전 조성 음악에서 화성 분석은 음악을 이해하는 데 있어 중요한 요소로, 이는 음악 정보 검색(Music Information Retrieval, MIR) 분야에서 광범위한 연구를 촉진하고 있다. 화성 분석에 사용되는 두 가지 주요 표현 체계는 화성 기호 체계(chord-symbol)와 로마 숫자 분석(Roman Numeral Analysis, RNA)이다. 특히, 기계 학습 방법은 로마 숫자 분석 연구의 복잡한 도전 과제를 해결하는 데 적합하다고 여겨지며, 이로 인해 해당 분야의 연구 관심이 크게 증가하였다. 많은 연구에도 불구하고 로마 숫자 분석 연구는 여전히 내재된 한계를 지니며 중요한 연구 과제로 남아 있다. 본 연구는 계산적 접근법과 다중 작업 학습(Multi-Task Learning, MTL)에 대한 관련 연구를 바탕으로 하며, 특히 후자는 여섯 가지 독특한 특성의 출력을 통해 높은 성능을 보여주었다. 그러나 이러한 방법들이 로마 숫자 분석 연구의 한계를 완전히 해결하고 의미 있는 성능을 달성하는지에 대한 체계적인 평가가 부족하다. 최근 연구들은 무작위 변동성으로 인한 정확도 검증의 필요성을 강조하고 있으며, 이는 모든 연구 분야에 중요한 측면이다. 로마 숫자 분석 연구의 맥락에서는 무작위 요인을 포함한 실질적이고 의미 있는 성능 차이의 존재를 체계적으로 평가하고 확인하는 것이 중요하다. 이러한 필요성에 기반하여, 본 연구는 로마 숫자 분석 연구의 체계적인 평가를 위해 신경망을 사용하여 성능 차이의 중요성을 검증하고자 한다. 실험은 세단계로 구성된다: 첫 번째 단계에서는 실험을 진행하기 앞서 베이스 모델인 AugmentedNet를 구현한다. 두 번째로, 제안된 AugmentedNet 모델의 구조와 다중 작업 학습에서 지속적으로 사용된 여섯 가지 특성을 실험하여, 어블레이션 연구(ablation studies)를 통해 성능 차이를 검증하고, 교차 검증, 그리고 무작위 시드 실험으로 무작위 변동성이 의미 있는 성능 결과에 미치는 영향을 평가한다. 세 번째 단계에서는 평가된 모델들이 일관되게 잘못 예측한 어려운 과제의 음악적 특성에 대한 전문가 분석을 수행한다. 본 연구는 로마 숫자 분석 연구 및 음악 정보 검색 분야에 학문적으로 기여할 것으로 기대되며, 서양 고전 음악 분석에 효율적으로 활용될 수 있는 검증 평가 실험을 진행하는 것을 목표로 한다.

more

목차

1 Introduction 1
1.1 Motivation 1
1.2 Objectives 3
2 Background 5
2.1 Roman Numeral Models 5
2.1.1 Previous Research 5
2.1.2 Deep Learning 6
2.1.3 Multitask Learning (MTL) 7
2.2 AugmentedNet 8
2.2.1 Data Representation 8
2.2.2 Dataset 10
2.2.3 Model Architecture 11
3 Methodologies 13
3.1 Epoch Accuracy for Model Selection 13
3.2 Cross Validation 14
3.3 Random seed 15
3.4 Ablation study on Feature 16
3.5 Ablation study on Model Architecture 17
3.6 Environment Setting 18
4 Experiment results 19
4.1 Epoch Accuracy for Model Selection 19
4.2 Cross validation 22
4.3 Random Seed 24
4.4 Ablation Study on Feature 27
4.5 Ablation Study on Model Architecture 30
5 Expert Analysis 32
6 Conclusion 36
Bibliography 38

more