딥러닝 모델/DQN for Cloud-Edge Caching

모바일 Edge Caching의 개념과 강화학습의 필요성

gksyb4235 2026. 3. 12. 13:43

Edge Caching의 등장배경과 개념


최근 몇 년 사이 모바일 네트워크 환경은 급격히 변화하였다.
스마트폰 보급이 폭발적으로 증가하면서 사용자들은 단순한 통신 서비스를 넘어 다양한 데이터 중심 애플리케이션을 사용하기 시작했으며, 대표적인 예는 다음과 같다.

  • 영상 스트리밍, 모바일 SNS, AR / VR
  • 이미지 및 음성 인식, 모바일 게임

이러한 서비스들은 공통적으로 다음 특징을 가진다.

  1. 대용량 데이터
  2. 높은 계산 요구량
  3. 낮은 지연(latency) 요구

문제는 대부분의 모바일 기기가 제한된 연산 능력과 배터리를 가진다는 점이다.
또한 수많은 사용자가 동시에 동일한 콘텐츠를 요청하면서 네트워크 트래픽 폭증 문제가 발생하고 있다.

이러한 환경에서 등장한 핵심 기술이 바로 Edge Computing과 Edge Caching이다.

 

 

모바일 데이터 시대의 문제: 같은 콘텐츠가 계속 다운로드된다


모바일 네트워크 트래픽의 중요한 특징 중 하나는 콘텐츠 인기의 편향(popularity skew) 이다.

실제로 많은 연구에서 다음과 같은 현상이 보고된다.

전체 콘텐츠 중 상위 10%가 전체 트래픽의 약 80%를 차지한다.

 

즉, 수많은 사용자들이 같은 영상, 같은 콘텐츠, 같은 데이터를 반복적으로 요청한다.

기존 구조에서는 이러한 요청이 다음과 같이 처리된다.

User → Base Station → Core Network → Cloud Server

 

이 방식에는 세 가지 문제가 존재한다.

1️⃣ Backhaul traffic 증가
2️⃣ 콘텐츠 전달 지연 증가
3️⃣ 원본 서버(origin server) 부하 증가

 

 

특히 인기 콘텐츠가 집중적으로 요청되는 경우 네트워크는 쉽게 병목 상태에 빠진다.

이 문제를 해결하기 위한 핵심 아이디어가 바로 Mobile Edge Caching(MEC)이다.

 

 

Mobile Edge Caching의 개념


Mobile Edge Caching은 클라우드 데이터센터 대신 사용자와 가까운 네트워크 엣지(edge) 위치에 서버를 배치하고,

인기 콘텐츠를 미리 저장(cache) 하는 방식이다.

이를 통해 사용자 요청이 발생했을 때 원격 클라우드 서버까지 데이터를 전달할 필요 없이,

엣지 서버에서 즉시 콘텐츠를 제공할 수 있다.

결과적으로 콘텐츠 전달 지연(latency)을 줄이고 네트워크 백홀(backhaul) 트래픽을 감소시키며,

전체 시스템의 서비스 품질(QoS)과 사용자 경험(QoE)을 향상시킬 수 있다.

 

특히 영상 스트리밍, 소셜 미디어, 웹 콘텐츠와 같이 다수의 사용자가 동일한 콘텐츠를 반복적으로 요청하는 환경에서는 엣지 캐싱의 효과가 더욱 크게 나타난다.

동일한 콘텐츠가 매번 클라우드로부터 전달되는 대신 엣지 서버에 저장된 데이터를 활용하면 중복 데이터 전송을 줄이고 네트워크 자원을 보다 효율적으로 사용할 수 있기 때문이다.

이러한 이유로 Microsoft, Google, Facebook과 같은 주요 인터넷 서비스 기업들도 엣지 환경에서의 콘텐츠 전달 및 캐싱 기술을 적극적으로 활용하고 있으며, Mobile Edge Caching은 차세대 모바일 네트워크에서 핵심적인 기술로 자리 잡았다.

 

 

 

 

왜 Mobile Edge Caching 문제에 강화학습이 적합한가


 Mobile Edge Caching 문제와 의사결정의 특성

Mobile Edge Caching 환경에서는 엣지 서버의 저장 공간이 제한되어 있기 때문에 모든 콘텐츠를 저장할 수 없다.

따라서 시스템은 항상 어떤 콘텐츠를 캐시에 저장하고, 어떤 콘텐츠를 제거할지를 결정해야 한다.

이러한 결정은 단순히 한 번 이루어지는 것이 아니라 시간이 흐르면서 반복적으로 수행된다.

사용자들의 콘텐츠 요청 패턴은 지속적으로 변화하며, 특정 콘텐츠의 인기도 역시 시간에 따라 크게 달라질 수 있기 때문이다.

 

예를 들어 특정 영상이나 콘텐츠가 갑자기 SNS를 통해 확산되면 해당 콘텐츠의 요청이 급격히 증가할 수 있고, 반대로 과거에 인기 있던 콘텐츠는 시간이 지나면서 거의 요청되지 않을 수 있다.

따라서 Edge Caching 시스템은 이러한 변화하는 환경에 적응하면서 지속적으로 캐싱 정책을 업데이트할 필요가 있다.

 

또한 캐싱 결정에는 항상 자원 사용에 대한 trade-off가 존재한다.

특정 콘텐츠를 캐시에 저장하면 해당 콘텐츠에 대한 접근 지연은 줄어들지만, 동시에 다른 콘텐츠를 저장할 수 있는 공간이 줄어든다. 즉 현재의 캐싱 결정은 이후의 콘텐츠 요청 처리 성능에 직접적인 영향을 미치게 된다.

이러한 특성 때문에 Edge Caching 문제는 단순한 규칙 기반 방법만으로는 최적의 성능을 달성하기 어렵고, 장기적인 성능을 고려한 전략적인 의사결정이 요구된다.

 

 

Edge Caching과 강화학습의 적합성


 

 

이러한 Edge Caching 문제는 강화학습의 순차적 의사결정(sequential decision making) 문제와 매우 유사한 구조를 가진다.

시스템은 현재의 네트워크 환경과 캐시 상태를 관찰하고, 그에 따라 캐싱 행동을 선택하며, 그 결과로 캐시 적중률이나 지연 감소와 같은 성능 변화를 경험하게 된다.

이러한 과정은 상태(state), 행동(action), 보상(reward)으로 구성되는 MDP 형태로 자연스럽게 표현될 수 있다.

 

특히 모바일 네트워크 환경에서는 사용자 수와 콘텐츠 종류가 매우 많기 때문에 캐싱 정책이 고려해야 할 상태 공간이 매우 커진다. 이와 같은 복잡한 환경에서는 전통적인 최적화 기법이나 정적인 캐싱 전략이 환경 변화에 충분히 대응하기 어렵다.

반면 강화학습 기반 접근 방식은 환경과 상호작용하면서 장기적인 보상을 최대화하는 정책을 학습할 수 있기 때문에,

변화하는 사용자 요청 패턴과 네트워크 상태에 적응적인 캐싱 전략을 학습하는 데 효과적인 방법으로 활용될 수 있다.