2026년 5월 19일, 구글은 연례 개발자 컨퍼런스 I/O 2026에서 제미나이 중심의 대규모 발표를 쏟아냈다. 새 모델, 24시간 돌아가는 개인 에이전트, 검색 구조 개편, 구독 가격 변경까지. 발표 항목은 많았지만 관통하는 메시지는 하나였다. AI가 질문에 답하는 도구에서, 사용자를 대신해 일하는 비서로 바뀌었다는 선언.
나는 발표 직후 키노트 전체를 돌려봤다. 인상 깊었던 건 화려한 데모가 아니라 가격표였다. 에이전트 시대를 열겠다면서, 핵심 기능은 월 100달러 구독자부터 열린다. 모델은 빨라졌지만 전작보다 3배 비싸졌다. 이 글에서는 구글 I/O 2026의 발표를 정리하면서, 에이전트가 왜 무료가 아닌지 따져본다.
구글 I/O 2026이 보여준 방향 전환

질문에 답하던 AI, 24시간 실행하는 AI
이번 I/O의 간판은 제미나이 스파크다. 구글이 직접 “스마트 디지털 어시스턴트의 다음 진화”라고 부른 개인 AI 에이전트다. 기존 제미나이가 사용자의 질문에 텍스트로 답하는 구조였다면, 스파크는 사용자의 지시를 받아 실제 작업을 수행한다. 이메일을 읽고 회신 초안을 쓰고, 스프레드시트에 데이터를 정리하고, 일정을 조율한다.
작동 방식도 다르다. 스파크는 구글 클라우드의 전용 가상머신(VM)에서 돌아간다. 노트북을 덮거나 휴대전화 화면이 꺼져 있어도 백그라운드에서 작업이 이어진다. 기반 모델은 제미나이 3.5, 장기 작업 안정성은 Antigravity Harness가 담당한다. 구글 자체 도구(Gmail, Docs, Sheets, Slides)와 먼저 연동되며, 몇 주 안에 MCP를 통해 서드파티 도구로 확장될 예정이다. 출처
안드로이드에서는 올해 말 출시 예정인 헤일로(Halo) UI를 통해 에이전트의 실시간 진행 상황을 화면 상단에서 확인할 수 있다. 여름 후반에는 크롬 브라우저에서 직접 작동해 웹 전반의 에이전틱 브라우저 역할까지 맡는다. 질문-응답 루프를 벗어나 “시키면 알아서 한다”는 구조로 전환한 셈이다.
검색도 에이전트가 된다
에이전트 전환은 제미나이 앱에만 국한되지 않는다. 구글 검색 자체가 에이전트 구조로 재설계되고 있다.
정보 에이전트(Information Agents)는 사용자가 설정만 해두면 백그라운드에서 24시간 웹을 모니터링하고, 조건에 맞는 정보가 나타나면 알림을 보낸다. 새 아파트 매물 추적, 한정판 스니커즈 출시 알림 같은 작업을 검색창 하나로 맡길 수 있다. 올여름 AI Pro, Ultra 구독자 대상으로 출시된다. 출처
검색 결과 화면도 바뀐다. Dynamic UI는 Antigravity 기반으로 검색어마다 맞춤형 레이아웃과 인터랙티브 시각화를 즉석에서 만든다. 같은 검색어를 넣어도 매번 다른 화면이 나온다. 이 기능은 여름에 무료 사용자도 쓸 수 있다.
미니 앱(Mini Apps)은 여기서 한 단계 더 나간다. 장기적으로 추적해야 할 주제를 위한 맞춤형 대시보드를 검색창 안에서 직접 만들어준다. 유튜브에는 Ask YouTube가 들어간다. 복합 질문에 답하면서 가장 관련된 영상 구간으로 바로 이동시킨다. 미니 앱은 Pro, Ultra 전용, Ask YouTube는 미국 YouTube Premium 대상이다.
지금까지의 검색이 “질문을 던지고 링크를 받는” 구조였다면, 이번 I/O 이후의 검색은 “질문을 던지면 맞춤 화면이 만들어지고, 이후에는 자동으로 추적해주는” 구조로 바뀌고 있다.
3.5 Flash, 빨라졌지만 싸지지 않았다

경량 모델이 최상위 성능을 넘었다
제미나이 3.5 Flash는 I/O 2026에서 발표와 동시에 출시된 모델이다. 구글의 설명대로라면 “프론티어급 성능을 Flash 속도로 쓸 수 있는” 첫 모델이다.
수치로 보면 과장이 아니다. 코딩과 에이전트 벤치마크에서 제미나이 3.1 Pro를 거의 모든 항목에서 넘었다. Terminal-Bench 2.1에서 76.2%, MCP Atlas에서 83.6%를 기록했다. 출력 속도는 다른 프론티어 모델 대비 약 4배 빠르다. 컨텍스트 윈도우는 100만 토큰, 최대 출력은 65,536 토큰을 지원한다. 출처
3.5 Flash는 발표 즉시 제미나이 앱과 구글 검색 AI 모드의 기본 모델로 적용됐다. 월간 활성 사용자 9억 명의 제미나이 앱, 10억 명의 AI 모드 검색이 모두 3.5 Flash를 기반으로 작동한다. 구글이 I/O에서 강조한 월간 3.2경 토큰 처리량의 엔진이 바로 이 모델이다.
3 Flash 대비 3배, 실사용은 5.5배
성능은 올라갔다. 문제는 가격이다.
직전 모델인 제미나이 3 Flash의 API 가격은 입력 $0.50, 출력 $3.00(100만 토큰당)이었다. 3.5 Flash는 입력 $1.50, 출력 $9.00이다. 단순 비교로 3배 인상이다. 출처
실제 체감은 더 크다. Artificial Analysis가 전체 벤치마크 테스트를 돌린 결과, 3.5 Flash는 이전 Flash 대비 약 5.5배 비용이 들었다. 에이전트 작업은 여러 단계에 걸쳐 입력 토큰이 누적되기 때문이다. 모델이 한 번 답하고 끝나는 게 아니라, 계획을 세우고 도구를 호출하고 결과를 확인하는 루프를 반복한다. 단계가 늘어날수록 컨텍스트가 커지고, 비용은 곱으로 늘어난다.
구글은 “다른 프론티어 모델 대비 절반 이하 가격”이라고 발표했다. 이건 GPT-5.5나 Claude Opus 4.7 같은 최상위 모델과 비교했을 때 맞는 말이다. 하지만 같은 Flash 계열 전작과 비교하면 3~5.5배 비싸졌다. 기업이 3 Flash 가격 기준으로 예산을 잡았다면, 마이그레이션 전에 비용 재산정이 필요하다.
구글이 “기업이 워크로드의 80%를 3.5 Flash로 옮기면 연간 10억 달러를 절감할 수 있다”고 한 추산은, 비교 대상이 GPT-5.5급 프론티어 모델이다. 기존 Flash에서 올라오는 사용자에게는 해당하지 않는 수치다.
에이전트는 무료가 아니다

Ultra $100, 요금제별로 다른 기능
구글 I/O 2026에서 구독 구조가 바뀌었다. 기존 월 250달러 단일이었던 AI Ultra가 100달러와 200달러 두 단계로 나뉘었다. 월 100달러짜리 Ultra가 새로 생겼고, 기존 최상위는 200달러로 내렸다. Plus($8)와 Pro($20)는 그대로다. 에이전트 시대의 최소 진입 비용이 100달러로 설정된 셈이다. 출처
요금제별로 쓸 수 있는 기능을 보면 구조가 명확하다. 제미나이 스파크는 Ultra 전용이다. 구글 Pics(AI 이미지 편집)와 미니 앱도 Pro, Ultra부터 쓸 수 있다. Daily Brief(아침 우선순위 요약)는 Plus 이상이면 쓸 수 있지만, 이건 스파크의 축소판이다. 무료 사용자가 쓸 수 있는 건 3.5 Flash 기본 사용과 여름에 나올 Dynamic UI 정도다.
정리하면 이렇다. 무료로는 빠른 모델을 쓸 수 있다. 하지만 “AI가 알아서 일한다”는 에이전트 경험은 월 100달러를 내야 시작된다. 에이전트 시대라는 타이틀과 달리, 대부분의 사용자는 아직 챗봇 시대에 머물게 된다.
프롬프트 횟수에서 컴퓨팅 사용량으로
과금 방식도 바뀌었다. 구글은 기존 일일 프롬프트 횟수 제한에서 컴퓨팅 사용량(compute-used) 기반으로 전환한다. 사용 한도는 주간 최대치에 도달할 때까지 5시간 단위로 갱신된다.
이 변화의 의미는 단순하다. 간단한 텍스트 질문은 컴퓨팅을 적게 소모하고, 에이전트처럼 복잡한 작업은 많이 소모한다. 같은 구독료를 내더라도 에이전트를 자주 쓰면 한도에 빨리 도달한다. 결국 에이전트를 본격적으로 활용하려면 상위 플랜으로 올라가야 한다.
이 구조는 구글만의 실험이 아니다. OpenAI의 Codex도 컴퓨팅 크레딧 기반이고, 앤트로픽의 클로드 역시 요금제별 사용량 한도를 두고 있다. AI 업계 전체가 “쓴 만큼 낸다”는 종량제 방향으로 수렴하고 있다. 에이전트가 클라우드에서 24시간 돌아가고, 여러 도구를 호출하며 장기 작업을 수행하려면 GPU 시간이 필요하다. 무료로 제공할 수 없는 구조적 이유가 여기에 있다. AI 에이전트의 비용은 단순 텍스트 응답과 차원이 다르다.
AI 활용 격차가 실력 격차가 된다
여기서 한 가지 불편한 질문이 생긴다. 에이전트를 쓸 수 있는 사람과 없는 사람 사이의 격차는 어떻게 되는가.
월 100달러를 내는 사용자는 스파크에게 리서치를 맡기고, 이메일 정리를 시키고, 데이터 분석을 자동화한다. 같은 시간에 더 많은 일을 처리한다. 무료 사용자는 여전히 한 번에 하나씩 질문하고 답을 복사해서 붙여넣는다. 생산성 차이는 구독료 차이보다 훨씬 크다.
이전까지 AI는 “누구나 접근 가능한 도구”라는 이미지가 있었다. 실제로 챗봇 수준에서는 그랬다. 하지만 에이전트 수준으로 올라가면 이야기가 달라진다. 도구를 쓰는 것과 비서를 고용하는 것은 비용 구조가 다르다. 에이전트 시대는 AI를 잘 쓰는 사람에게 레버리지를 주지만, 못 쓰는 사람에게는 더 큰 격차를 만든다.
이건 구글만의 문제가 아니다. 엔트로픽의 클로드 맥스도 월 100~200달러 구간이고, OpenAI의 ChatGPT Pro도 월 200달러다. AI 업계 전체가 “에이전트는 프리미엄”이라는 방향으로 움직이고 있다. 컴퓨팅 자원이 유한한 이상, 에이전트가 무료가 되기는 구조적으로 어렵다.
에이전트 시대, 쓰는 사람과 못 쓰는 사람
구글 I/O 2026을 한 문장으로 정리하면 이렇다. 제미나이가 챗봇에서 에이전트로 넘어갔고, 그만큼 비용도 올라갔다.
모델은 확실히 좋아졌다. 3.5 Flash는 프론티어 성능을 빠른 속도로 제공하고, 스파크는 24시간 돌아가는 개인 비서라는 비전을 실체화했다. 검색은 링크 목록에서 능동형 에이전트로 바뀌고 있다.
하지만 그 모든 기능의 이면에는 컴퓨팅 비용이라는 물리적 제약이 있다. 에이전트가 클라우드에서 24시간 돌아가고, 도구를 호출하고, 장기 작업을 수행하려면 연산 자원이 필요하다. 구글이 올해 인프라에 약 1,900억 달러를 투자하는 이유가 여기에 있다. 그 비용이 결국 구독료로 돌아온다.
AI를 도구로만 쓰는 시대에는 무료 접근이 가능했다. AI를 비서로 쓰는 시대에는 비용이 따라온다. 그리고 비서를 쓸 수 있는 사람과 없는 사람 사이의 생산성 격차는 시간이 갈수록 벌어질 가능성이 높다. 에이전트 시대가 기회인지 장벽인지는, 결국 각자가 AI를 얼마나 적극적으로 활용하느냐에 달려 있다.