검색 상세

모바일 플랫폼의 다양한 IP의 요구조건 보장을 위한 캐시 교체 알고리즘과 메모리 뱅크 분리 기법 설계

Design of Cache Replacement Policy and Memory Bank Partitioning Scheme for Guaranteeing IP’s Requirements in Mobile Platform

초록/요약

최근 모바일 환경에서 CPU와 더불어 GPU, 디스플레이, 카메라, 멀티미디어 등의 다양한 IP들이AP(Application Processor)에 통합되어 메모리 대역폭을 공유한다. 또한 다양한 IP들은 각각 자신의 요구 조건을 가지고 있다. 스마트 폰, 태블릿 PC 등의 모바일 활용의 증가로 모바일 애플리케이션에서 요구하는 성능이 점차 증가하고 있다. 특히, 프레임 기반 애플리케이션은 비디오 해상도가 향상함에 따라 상당한 양의 데이터를 사용하여 주 메모리의 간섭을 발생시킨다. 이로 인해 발생된 심각한 간섭은 멀티미디어 IP들의 데드라인을 놓치게 하며 CPU의 지연시간 또한 증가시켜 시스템 성능을 감소시킨다. 주 메모리 간섭 문제를 해소하기 위한 다양한 방법이 제시되었지만, 기존 환경과 다르게 모바일 환경은 자원이 한정적이며, 멀티미디어 IP포함 다양한 IP들의 메모리 특성을 충분히 활용하지 못했다. 본 논문에서는 다양한 IP코어들의 데이터 특성을 분석하고 이를 활용하여 IP코어 들의 요구 조건을 보장하기 위해 캐시 교체 알고리즘과 주 메모리 뱅크 분리 기법을 적용한 모바일 플랫폼 메모리 시스템을 제시한다. 먼저 멀티미디어 IP코어들로부터 가해지는 메모리 컨트롤러의 부하를 줄이기 위해 멀티미디어 IP코어가 서브 프레임을 사용했을 경우 동적 우회 방식의 RRIP(Re-Reference Interval Prediction) 교체 기법을 적용한 마지막 레벨 공유 캐시를 제시한다. 그리고 메모리 컨트롤러에서CPU 코어의 메모리 요청들을 최우선 처리하여 지연 시간을 감소시키고, 멀티미디어 IP코어들의 최고 대역폭을 이용하여 멀티미디어 IP 코어들에게 적절한 수의 뱅크를 할당하여 데드라인을 보장하는 방법을 제시한다. 본 논문에서 제시한 메모리 시스템은 다양한 조합의 워크로드(Workload) 상황에서 평가되었으며, 특히 메모리 컨트롤러에서 제시된 방식은 기존에 연구된 2개의 스케줄링 방식과 성능비교가 되었다. 실험 결과 제시된 메모리 시스템은 마지막 레벨 캐시에서 기존 LRU대비 메모리 대역폭을 14% 감소시켰다. 또한 CPU의 메모리 접근 지연시간을 FR-FCFS 대비 93.17%, TCM 대비 31.24% 감소시키고 다양한 IP 코어들의 데드라인 보장율을 FR-FCFS 대비 약 60%, TCM 대비 80% 향상시켰다.

more

초록/요약

In a mobile platform, diverse IP cores such as CPUs, GPUs and multimedia IP cores are integrated and share memory bandwidth. These IP cores such as video encoder/decoder, 2D composer, etc. have their own requirements. For frame-based applications (audio, video, and camera), they use large volume of data and cause severe interference while accessing memory. Severe interferences cause multimedia IP cores to miss their deadlines and slow down applications running on CPU cores. In this paper, we propose memory system of mobile platform using cache replacement policy and memory bank partitioning for guaranteeing IP’s requirements. First, we reduce the load on the memory controller by applying RRIP cache replacement policy with dynamic bypass scheme on shared last level cache. Second, on memory controller we prioritize CPU memory requests to improve system performance and allocate the proper number of banks to multimedia IP cores so that the estimated bandwidth of allocated banks is higher than multimedia IP’s maximum bandwidth requirement. We evaluate proposed scheme and compare to diverse policies on multiprogrammed workloads. Experimental results show that the proposed memory system decreases memory bandwidth by 12% over LRU. Also the proposed memory system enhances CPU performance and other IPs’ deadline met ratio by 93.17% and 60% over FR-FCFS and 31.24% and 80% over TCM.

more