검색 상세

FedSPA: 비동기 연합 학습을 위한 피드백 기반 안정성 인식 우선순위 스케줄링 및 적 응형 집계 가중치 조정 기법

초록(요약문)

최근 데이터 프라이버시 보호와 대규모 분산 데이터 활용을 위한 핵심 기술로 연합 학습 (Federated Learning)이 주목받고 있다. 연합 학습 환경은 다양한 연산 능력과 네트워크 환경을 가진 이질적인(Heterogeneous) 기기들로 구성되며, 각 기기별 데이터 분포도 상이하다는 특징을 가지고 있다. 전통적인 동기식 연합 학습은 가장 느린 클라이언트에 의해 전체 시스템이 지연되는 낙오자(Straggler) 문제를 겪는다. 이를 해결하기 위해 대기 시간 없이 업데이트를 즉시 처리하는 비동기식 연합 학습(Asynchronous Federated Learning)이 제안되었으나, 이는 서로 다른 시점의 모델이 혼재됨에 따라 발생하는 업데이트 지연(Staleness) 문제로 인해 모델의 수렴 속도와 성능이 저하되는 한계를 가진다. 기존 연구들은 지연 시간에 비례하여 가중치를 단순히 낮추는 방식으로 이 문제에 접근해 왔으나, 본 논문은 이러한 시간 중심적 접근이 업데이트의 실제 내용과 품질을 고려하지 않는 품질 맹목성(Quality-Blindness)을 가지며, 집계 과정의 정보가 클라이언트 선택에 반영되지 않는 피드백의 부재로 인해 학습에 유해한 클라이언트가 반복적으로 선택되는 비효율성이 존재할 수 있음을 지적한다. 이에 본 논문은 통계적 및 시스템적 이질성이 공존하는 환경에서 학습의 안정성을 보장하고 수렴 속도를 가속화하기 위한 비동기식 연합 학습 방식인 FedSPA(Federated Similarity-aware Priority Scheduling and Adaptive Aggregation)를 제안한다. FedSPA는 품질 기반 적응형 집계기와 피드백 기반 둥적 스케줄러라는 두가지 핵심 메커니즘으로 구성된다. 첫째, 품질 기반 적응형 집계기는 업데이트의 방향성 일치도(Alignment), 신선도(Freshness), 안정성(Stability)을 종합적으로 평가하여 유효 가중치를 동적으로 조절함으로써 글로벌 모델을 보호한다. 둘째, 피드백 기반 동적 스케줄러는 집계 과정에서 도출된 품질 지표를 스케줄러에 피드백하여 기여도가 높은 클라이언트에게 우선순위를 부여하고, 공정성을 고려한 확률적 샘플링을 통해 효율적인 자원 배분을 수행한다. 제안하는 기법의 성능을 검증하기 위해 CIFAR-10 데이터셋을 활용하여 다양한 이질성 시나리오에서 비교 실험을 수행하였다. 실험 결과, FedSPA는 데이터 불균형이 큰 강한 Non-IID 환경과 시스템 지연이 결합된 환경에서도 기존 비동기 연합 학습 기법 (FedAsync, FedBuff, AsyncFedED) 대비 최대 2.87배 더 빠른 수렴 속도와 최대 17.7%p 향상된 최종 정확도를 달성함을 보인다.

more

목차

1 서론 1
2 이론적 배경 및 관련연구 4
2.1 동기식 및 비동기식 연합 학습 4
2.2 비동기 연합 학습 관련 연구 5
2.2.1 비동기식 집계 전략 (Asynchronous Aggregation Strategies) 5
2.2.2 클라이언트 스케줄링 (Client Scheduling) 7
3 연구 동기 9
3.1 기존 집계 전략의 한계: 품질 맹목성 9
3.2 기존 스케줄링 전략의 한계: 피드백의 부재 10
4 FedSPA: 비동기 연합 학습을 위한 피드백 기반 안정성 인식 우선순위 스케줄링 및 적응형
집계 가중치 조정 기법 13
4.1 FedSPA 개요 13
4.1.1 문제 정의 14
4.1.2 프레임워크 아키텍처 15
4.2 품질 기반 적응형 집계 16
4.2.1 방향성 점수 16
4.2.2 신선도 점수 17
4.2.3 안정성 스케일 18
4.2.4 최종 모델 집계 19
4.2.5 품질 기반 적응형 집계기 의사코드 21
4.3 피드백 기반 동적 스케줄링 21
4.3.1 클라이언트 우선순위 계산 22
4.3.2 소프트맥스 샘플링 기반 클라이언트 선택 22
4.3.3 피드백 기반 동적 스케줄링 의사코드 24
5 실험 및 분석 25
5.1 실험 설정 25
5.1.1 데이터셋 및 모델 25
5.1.2 통계적 이질성 26
5.1.3 시스템 이질성 26
5.1.4 학습 설정 27
5.1.5 Baseline 알고리즘 27
5.2 실험 결과 및 분석 28
5.2.1 주요 실험 결과 28
5.2.2 FedSPA 스케줄러 설정에 따른 성 능및 참여 공정성 비교 34
6 결론 및 향후 연구 38
Bibliography 39

more