멀티 클라우드, AWS 장애가 증명한 분산해야 하는 3가지 이유

멀티 클라우드는 두 곳 이상의 클라우드 서비스를 조합해 쓰는 전략이다. AWS 하나만 쓰던 기업이 GCP나 Azure를 함께 도입하는 식이다. 2025년 Flexera 보고서 기준, 기업의 89%가 이미 멀티 클라우드 전략을 운영하고 있다.

나도 처음에는 “클라우드 하나면 충분하지 않나?”라고 생각했다. 그런데 2025년 10월 AWS 장애를 보고 생각이 바뀌었다. DNS 오류 하나에 퍼플렉시티, 캔바, 스냅챗이 동시에 멈추고, 15시간 동안 복구되지 않았다. 클라우드 하나에 전부 의존하면 그 클라우드가 무너질 때 사업도 같이 멈춘다.

멀티 클라우드란

멀티 클라우드 정의와 구조를 설명하는 다이어그램

정의와 구조

멀티 클라우드는 AWS, GCP, Azure 같은 퍼블릭 클라우드를 2개 이상 동시에 사용하는 방식이다. 핵심은 “의도적 조합”에 있다. 단순히 여러 클라우드에 계정이 있다고 멀티 클라우드가 아니다. 각 클라우드의 강점을 파악하고, 워크로드에 맞게 배분하는 전략적 선택이다.

예를 들어 컴퓨팅은 AWS EC2를 쓰고, 머신러닝 파이프라인은 GCP Vertex AI를 쓰는 구조가 있다. 스토리지 비용이 저렴한 곳에 데이터를 두고, GPU 성능이 좋은 곳에서 연산을 돌린다. 하나의 벤더에 모든 것을 맡기지 않겠다는 판단이 깔려 있다.

어디까지가 멀티 클라우드인가

AWS와 GCP를 함께 쓰면 멀티 클라우드다. AWS와 네이버 클라우드를 섞어도 마찬가지다. IaaS, PaaS, SaaS 레벨에서 서로 다른 벤더를 조합하는 것도 포함된다. 가령 인프라는 Azure, 데이터베이스는 AWS RDS, 협업 도구는 Google Workspace를 쓰는 기업이라면 이미 멀티 클라우드를 운영하고 있는 셈이다.

중요한 건 “의도”다. 인수합병으로 어쩌다 여러 클라우드가 섞인 경우도 현실에서 흔하다. 하지만 전략이 없으면 멀티 클라우드가 아니라 그냥 혼란이다.

클라우드 하나만 쓸 때 생기는 위험

AWS 장애 사례와 벤더 종속 위험을 보여주는 카드

2025년 AWS 장애, DNS 오류 하나에 수백 개 서비스가 멈췄다

2025년 10월 20일, AWS US-East-1 리전에서 DNS 오류가 발생했다. 원인은 내부 DynamoDB 서비스의 DNS 확인 실패였다. 장애의 영향은 약 15시간 동안 지속됐고, 퍼플렉시티, 캔바, 스냅챗, 포트나이트, 아마존 알렉사까지 동시에 접속 불가 상태에 빠졌다. 출처

이 사고가 보여준 것은 단순하다. 점유율 1위인 AWS도 장애를 피하지 못한다. 아무리 안정적인 인프라라도 DNS 같은 공통 계층에서 오류가 나면 그 위에 연결된 모든 서비스가 함께 중단된다. Reuters는 같은 리전에서 최근 5년간 최소 세 번의 주요 장애가 발생했다고 지적했다.

벤더 종속이 만드는 세 가지 위험

첫째, 장애 전파다. 한 벤더에 모든 워크로드를 집중하면, 그 벤더의 장애가 곧 회사 전체의 장애가 된다. 백업 리전을 설정해도 같은 벤더 안에서의 이중화에는 한계가 있다.

둘째, 가격 협상력을 잃는다. AWS만 쓰는 기업은 AWS 요금이 오르면 받아들일 수밖에 없다. 대안이 없기 때문이다. 반대로 GCP와 Azure를 병행하는 기업은 “옮길 수 있다”는 선택지 자체가 협상 카드가 된다.

셋째, 규제 대응이 어려워진다. 국가별 데이터 주권법이 강화되면서, 특정 데이터는 특정 지역의 데이터센터에 저장해야 하는 경우가 늘고 있다. 한 벤더가 그 지역에 리전을 갖고 있지 않으면 대응 자체가 불가능하다.

기업 89%가 멀티 클라우드를 선택한 이유

Flexera 2025 클라우드 현황 보고서에 따르면, 조사 대상 기업의 89%가 멀티 클라우드 전략을 운영하고 있다. 기업당 평균 2.4개의 퍼블릭 클라우드를 사용한다. 출처

국내도 비슷하다. 삼성SDS가 발표한 2025년 국내 퍼블릭 클라우드 현황 보고서에서, 클라우드를 도입한 기업의 58%가 2개 이상의 서비스를 함께 사용하는 멀티 클라우드를 채택하고 있었다. 출처

이유는 위에서 말한 세 가지, 장애 분산, 협상력 확보, 규제 대응과 정확히 일치한다. 특히 AI 워크로드가 늘면서 GPU 자원이 풍부한 클라우드를 추가로 확보하려는 수요도 멀티 클라우드 채택을 가속하고 있다.

도입 전에 알아야 할 현실

멀티 클라우드 도입 시 주의점을 정리한 경고 카드

관리 복잡도, 콘솔이 2개면 실수도 2배

AWS 콘솔과 GCP 콘솔은 UI도 다르고 개념도 다르다. IAM 정책, 네트워크 설정, 로깅 구조가 플랫폼마다 별도로 운영된다. 보안 정책을 AWS에는 적용했는데 GCP에는 빠뜨리는 일이 실제로 벌어진다.

운영팀의 학습 부담도 커진다. AWS 전문가와 GCP 전문가가 따로 필요하거나, 한 사람이 두 플랫폼을 모두 익혀야 한다. 중소기업 입장에서는 이 인력 부담이 멀티 클라우드 도입의 가장 큰 장벽이다.

비용 절감이라는 환상

멀티 클라우드의 장점으로 “비용 절감”을 꼽는 글이 많다. 반은 맞고 반은 틀리다. 서비스별로 가장 저렴한 벤더를 골라 쓸 수 있다는 점에서는 맞다. 하지만 클라우드 간 데이터 전송에는 egress 비용이 붙는다. AWS에서 GCP로 데이터를 옮길 때마다 요금이 발생한다.

Flexera 2025 보고서에 따르면 기업들은 IaaS·PaaS 지출의 27%를 낭비하고 있다고 자체 추정했다. 멀티 클라우드가 되면 이 낭비를 추적하기가 더 어려워진다. FinOps 팀을 운영하는 기업 비율이 2024년 51%에서 2025년 59%로 늘어난 것도 이 때문이다. 출처

결론적으로 멀티 클라우드는 “비용을 줄여준다”기보다 “협상 카드를 준다”에 가깝다. 관리 비용까지 합산하면 총비용이 오히려 늘어나는 경우도 드물지 않다.

크라우드스트라이크 사태의 교훈

2024년 7월, 크라우드스트라이크의 보안 소프트웨어 업데이트 오류로 전 세계 850만 대의 윈도우 기기가 동시에 멈췄다. 포춘 500대 기업에 약 54억 달러의 직접 손실이 발생한 것으로 추정된다. 출처

이 사고는 멀티 클라우드와 관련해 중요한 교훈을 남긴다. 크라우드스트라이크 장애는 특정 클라우드 벤더의 문제가 아니었다. 운영체제에 설치된 보안 소프트웨어의 문제였고, AWS든 Azure든 해당 소프트웨어를 쓰는 환경이면 어디서나 터졌다. 클라우드를 여러 곳으로 나눠 놨어도 막을 수 없는 사고였다.

이것이 핵심이다. 멀티 클라우드는 벤더 종속 리스크를 줄여주지만, 소프트웨어 계층의 장애까지 막아주지는 않는다. 클라우드를 분산하는 것과 소프트웨어 공급망을 관리하는 것은 별개의 문제다. 둘 다 해야 한다.

멀티 클라우드와 하이브리드 클라우드

멀티 클라우드와 하이브리드 클라우드 차이를 비교한 카드

구분 기준

멀티 클라우드와 하이브리드 클라우드는 자주 혼동된다. 구분 기준은 간단하다. 멀티 클라우드는 벤더 수의 문제다. AWS와 GCP를 함께 쓰면 멀티 클라우드다. 하이브리드 클라우드는 배포 유형의 문제다. 퍼블릭 클라우드와 프라이빗 클라우드(또는 온프레미스)를 연결해서 쓰면 하이브리드 클라우드다.

구글 클라우드는 이 차이를 자동차에 비유한다. 하이브리드 클라우드는 전기 엔진과 내연 엔진을 함께 단 하이브리드 자동차다. 멀티 클라우드는 용도에 따라 자동차, 기차, 자전거를 골라 타는 것이다.

둘 다 쓰는 기업이 73%

현실에서는 둘 중 하나만 고르는 경우가 드물다. Flexera 2024 보고서에 따르면 멀티 클라우드를 도입한 기업의 73%가 퍼블릭 클라우드와 프라이빗 클라우드를 혼합하는 하이브리드 전략을 병행하고 있었다. 출처

이유는 분명하다. 민감한 데이터는 프라이빗 클라우드에 두고, 확장이 필요한 워크로드는 퍼블릭 클라우드에 올린다. 퍼블릭 클라우드도 한 곳이 아니라 두 곳 이상으로 분산한다. 결국 “하이브리드 + 멀티”가 현재 가장 많은 기업이 운영하는 조합이다.

클라우드는 분산이 기본이다

멀티 클라우드는 더 이상 대기업만의 전략이 아니다. AWS 장애 한 번으로 수백 개 서비스가 동시에 멈추는 시대다. 벤더 종속은 장애 전파, 가격 종속, 규제 리스크를 동시에 만든다.

다만 멀티 클라우드가 만능은 아니다. 관리 복잡도가 올라가고, 오히려 총비용이 증가할 수 있다. 크라우드스트라이크 사태처럼 소프트웨어 계층의 장애는 클라우드를 아무리 분산해도 막지 못한다.

핵심은 “무조건 여러 개”가 아니라 “의도적으로 분산”하는 것이다. 어떤 워크로드를 어디에 둘지, 장애가 나면 어디로 전환할지, 비용은 어떻게 추적할지를 먼저 설계해야 한다. 클라우드 전략의 출발점은 기술이 아니라 판단이다.

광고 차단 알림

광고 클릭 제한을 초과하여 광고가 차단되었습니다.

단시간에 반복적인 광고 클릭은 시스템에 의해 감지되며, IP가 수집되어 사이트 관리자가 확인 가능합니다.