쿠버네티스 FinOps ②AI 기반 비용 최적화와 자동화
메타넷엑스는 AI-Ready 2026 4부작 웨비나 시리즈를 통해 쿠버네티스 FinOps부터 통합 옵저버빌리티, DR 및 보안관제, 디지털 트윈 기반 자율 운영 전략까지 아우르는 디지털 플랫폼 실행 로드맵을 제시했습니다.
이번에 소개드리는 영상은 1부 Part 2로, 쿠버네티스 비용 절감을 위한 실행 전략 중 하나인 Cast AI의 APA(Application Performance Automation) 기술과 비용 절감 사례·전략을 확인하실 수 있습니다.
Webinar Agenda
✔️ 쿠버네티스 비용 증가의 이유
✔️ 쿠버네티스 최적화의 새로운 기준, Cast AI
✔️ Cast AI 도입, 그 실제 효과와 방법
Webinar Preview
Q. 최근 많은 기업들이 클라우드 비용 증가를 호소하고 있는데요, 쿠버네티스도 비용 문제가 있다고 들었습니다. 정말 그런가요?
네, 맞습니다. 실제로 쿠버네티스가 전체 클라우드 지출의 60~70%를 차지하는 경우가 많습니다. 문제는 우리가 자원을 너무 낭비하고 있다는 것인데요, 최근 보고서들을 보면 쿠버네티스 환경에서 CPU는 평균 10%, 메모리는 23% 정도만 사용되고 있습니다. 즉 기업들은 실제 놀고 있는 컴퓨팅 파워에 막대한 돈을 지불하고 있는 셈이죠. 이런 비효율을 줄이는 게 현재 클라우드 업계의 핵심 과제입니다.
Q. Cast AI는 어떤 솔루션인지 설명 부탁드리겠습니다.
Cast AI는 APA(Application Performance Automation)라는 새로운 영역을 개척한 AI 기반 쿠버네티스 자동화 플랫폼입니다. 한문장으로 요약하면 클라우드 인프라의 비용 성능 보완을 실시간으로 분석하고, AI가 자동으로 조치해 쿠버네티스 클러스터를 자율적으로 최적화하는 플랫폼이라고 할 수 있죠.
Q. AI 기반 자동화라고 하셨는데, 엔지니어가 하는 수동 최적화랑 어떤 차이가 있나요?
가장 본질적인 차이는 모니터링만 하느냐, 아니면 자동 조치까지 하느냐의 차이입니다. 기존 도구들은 단순히 ‘이 부분을 수정하세요’라고 알려주는 관측 수준, 즉 모니터링만 해주는 부분인데, Cast AI는 AI가 클러스터를 분석하고 자동으로 리소스를 조정합니다. 예를 들어 Akamai의 경우, 이전에는 DevOps팀이 수동으로 조정하던 작업을 지금 수백 개의 Cast AI 에이전트가 초단위로 자동으로 수행합니다. 시간이 지날수록 스스로 학습하고 성능을 개선하는, 말 그대로 ‘자율적인 시스템’이라는 것이 본질적인 차이입니다.
Q. 쿠버네티스의 기존 오토스케일링 기능을 보완하는 Cast AI의 핵심 기능은 무엇인가요?
쿠버네티스의 기본 오토 스케일러는 설정과 관리에 상당한 DevOps 리소스가 필요하고, 무엇보다 클라우드 재고나 가격 변동에 민감하게 대응하기 어렵다는 한계가 있습니다. 반면 Cast AI는 훨씬 더 넓은 범위를 다루는데요, 크게 세 가지를 말씀드릴 수 있습니다. 먼저 지능형 리소스 선택과 라이트사이징인데요, 파드의 요청과 제안을 자동으로 조정을 하고 클러스터에 필요한 최적의 인스턴스 유형과 크기를 AI가 자동으로 선택합니다. 다음은 빈 패킹(Bin-packing) 기술입니다. 파드(Pod)를 최소한의 노드에 효율적으로 배치해서 클러스터 크기를 줄이고, 유휴 리소스를 제거합니다. 마지막으로 고급 Spot 인스턴스 자동화 기능입니다. 최대 90%까지 저렴한 Spot 인스턴스를 사용해서, 이 부분을 자동으로 활용하면서, 중단이 예상되면 즉시 다른 인스턴스나 아니면 온디맨드 VM으로 폴백해서 안정성을 유지하죠. 결과적으로 Cast AI는 기본 오토스케일러 대비 평균 40% 이상의 추가 절감 효과를 제공합니다.
본 내용은 웨비나 질의응답 중 일부 질문을 중심으로 정리한 내용입니다. Cast AI에 대한 보다 풍성하고 상세한 인사이트는 웨비나 다시보기 영상에서 확인하실 수 있습니다.
▶ 웨비나 다시보기