터미널에서 돌아가는 AI 코딩 어시스턴트가 늘고 있다. 그중 가장 많이 비교되는 두 도구가 코덱스 vs 클로드 코드이다. 둘 다 터미널에서 프로젝트를 읽고, 코드를 고치고, 테스트까지 돌린다. 겉으로 보면 하는 일이 거의 같다.
나도 상용 프로젝트를 개발하면서 둘 다 써봤는데, 쓰는 동안은 차이를 크게 느끼지 못했다. 그래서 직접 비교하면서 어떤 상황에 어느 쪽이 맞는지 정리했다.
같은 터미널, 다른 하네스
공통점부터
코덱스와 클로드 코드는 둘 다 터미널 기반 AI 코딩 에이전트다. 에디터 안에서 자동완성을 해주는 코파일럿 류와는 성격이 조금은 다르다. 프로젝트 디렉터리 전체를 읽고, 파일을 만들고, 테스트를 실행한 뒤 결과를 보고 다음 행동을 스스로 판단한다.
설치 방식도 비슷하다. 코덱스는 npm i -g @openai/codex, 클로드 코드는 npm i -g @anthropic-ai/claude-code로 설치하고 프로젝트 루트에서 실행하면 된다. 둘 다 MCP를 지원하고, 프로젝트별 설정 파일로 지시를 줄 수 있다.
차이는 하네스 체계
기본 모델은 코덱스가 GPT 5.5, 클로드 코드가 오푸스 4.7이다. 하지만 모델 자체가 두 도구의 본질적인 차이는 아니다.
진짜 차이는 하네스 체계에 있다. 코덱스는 AGENTS.md로 프로젝트 규칙을 관리하고, 샌드박스 기반 실행 정책과 슬래시 커맨드 체계를 갖추고 있다. 클로드 코드는 CLAUDE.md를 중심으로 훅, 메모리 시스템, 커스텀 슬래시 커맨드 구조를 제공한다. 모델이 코드를 얼마나 잘 짜느냐도 중요하지만, 그 모델에게 프로젝트 맥락을 얼마나 정확히 전달하느냐가 결과물을 좌우한다. 그 역할을 하는 게 하네스다.
코덱스가 주목받는 이유

개발자 반응이 좋다
2026년 4월 GPT 5.5가 나오면서 코덱스에 대한 개발자 평가가 확 달라졌다. 복잡한 멀티파일 작업에서 맥락을 잘 유지하고, 같은 작업에 드는 토큰도 이전 모델 대비 40% 줄었다고 OpenAI는 밝혔다(출처). 토큰을 적게 쓰면 한도 안에서 더 오래 작업할 수 있으니 체감 사용량이 늘어나는 효과가 있다.
반면 클로드 오푸스 4.7은 4.6 대비 약 15% 성능 개선에 그쳤다는 평가가 많다(출처). 물론 벤치마크 수치와 실제 코딩 체감이 항상 일치하지는 않는다. GPT 5.5도 실사용에서 코드 일부를 플레이스홀더로 빼놓는 “게으른 코딩” 문제가 보고되고 있어서(출처), 숫자만 보고 판단하기는 어렵다.
저렴한 가격
코덱스는 ChatGPT Plus 20달러 구독에 포함된다(출처). 별도 결제 없이 쓸 수 있고, ChatGPT 인증 모드로 연결하면 API 비용도 붙지 않는다. Pro 200달러 플랜을 쓰면 6배 넉넉한 한도가 주어진다.
클로드 코드도 클로드 프로 20달러 플랜에서 쓸 수 있지만, 상용 프로젝트에서 사용하기에는 한도가 빠듯하다. 실무에서는 맥스 5x(100달러)나 맥스 20x(200달러) 플랜이 필요한 경우가 많다. 같은 200달러 기준이라면 코덱스 쪽이 한도에 여유가 있다는 의견이 많다.
클로드 코드를 유지할 이유
한도 격차가 줄었다
앤트로픽이 스페이스X와 협업하면서 클로드 코드의 사용 한도가 2배로 늘었다. 한도 부족은 클로드 코드 사용자들이 가장 많이 지적하던 문제였는데, 이번 확대로 불만이 상당히 줄었다. 맥스 플랜 기준으로 하루 종일 코딩해도 한도에 걸리는 일이 드물어졌다.
하네스라는 자산
클로드 코드를 이미 쓰고 있다면 CLAUDE.md, 커스텀 슬래시 커맨드, MCP 서버 설정 같은 프로젝트별 하네스가 쌓여 있을 가능성이 높다. 이건 단순한 설정 파일이 아니다. 프로젝트의 코딩 컨벤션, 자주 발생하는 실수 패턴, 테스트 실행 방법까지 담긴 축적된 지식이다.
코덱스로 옮기면 이 하네스를 AGENTS.md 형식으로 다시 만들어야 한다. 문법 자체는 비슷해도 도구마다 지시를 해석하는 방식이 다르다. 클로드 코드에서 잘 따르던 규칙을 코덱스가 무시하거나, 반대의 경우도 생긴다. 상용 프로젝트에서 이 전환 비용은 꽤 크다.
자율 코딩에서 여전히 강하다
오푸스 4.7은 에이전틱 코딩 벤치마크에서 공개 모델 1위를 다시 차지했다(출처). 사람이 중간에 개입하지 않아도 스스로 코드를 작성하고 테스트를 돌려 검증하는 장시간 자율 작업에서 특히 강하다는 평가가 이어지고 있다. 리팩토링처럼 파일 여러 개를 동시에 건드려야 하는 작업에서 체감 차이가 크다는 개발자도 적지 않다.
결국 뭘 고를까

새로 시작한다면
아직 어느 쪽에도 투자한 게 없다면 코덱스를 먼저 써보는 것도 괜찮다. ChatGPT Plus 20달러면 시작할 수 있고, GPT 5.5에 대한 개발자 평가가 지금 시점에서 좋은 편이다. 진입 장벽이 낮으니 가볍게 시작해볼 수 있다.
이미 클로드 코드를 쓰고 있다면
하네스가 쌓인 프로젝트를 두고 코덱스로 갈아타는 건 신중해야 한다. 오푸스 4.7도 성능이 나쁘지 않고, 한도 확대로 가격 불만도 줄었다. 도구를 바꾸면 생산성이 일시적으로 떨어지고, 하네스를 처음부터 다시 쌓아야 하는 시간도 만만치 않다.
모델 우위는 계속 바뀐다
한 달 전만 해도 오푸스 4.6이 최고였다. 지금은 GPT 5.5가 판을 뒤집었다. 곧 나올 것으로 알려진 구글 제미나이 3.5(가칭)가 이 둘을 다시 뒤집을 수도 있다. 모델 성능은 늘 엎치락뒤치락한다. 벤치마크 몇 퍼센트 차이에 따라 도구를 갈아타는 건 비용 대비 실익이 적다.
그보다 중요한 건 하나를 정하고 진득하게 쓰면서 하네스를 키워가는 것이다. 하네스가 촘촘해질수록 어떤 모델을 쓰든 결과물의 질이 올라간다. 모델은 계속 바뀌겠지만, 프로젝트에 맞게 다듬어놓은 워크플로우는 그대로 남는다.
마치며
코덱스는 진입 비용이 낮고 GPT 5.5에 대한 개발자 반응이 좋다. 클로드 코드는 축적된 하네스와 자율 코딩 능력이 강점이다. 정답은 없다. 다만 도구를 계속 갈아타는 사람보다, 하나를 깊이 쓰는 사람이 더 빨리 결과를 낸다. 벤치마크는 바뀌지만 하네스는 남는다.