
많은 개발자가 아직 LLM 기반 코드 생성으로 완전히 전환하지 않았다. 바이브 코딩, 스펙 개발, 에이전틱 엔지니어링 등 어느 방식이든 아직 체감하지 못했다면 당장 비용을 지불해 사용하려 하지 않을 가능성이 높다. 다행히도 남의 GPU 자원을 저렴하게 혹은 무료로 활용할 수 있는 방법들이 존재한다.
일반적으로 무료로 제공되는 모델은 실질적인 프라이버시 보장이 없다. 따라서 예비 검토용이나 오픈소스 프로젝트용으로만 사용하는 것이 바람직하다. 다시 말해, 미 국방부(DoD) 지원을 받는 무인기 항법 시스템의 코드를 중국 등 외부로 유출해서는 안 되며, 그런 일이 벌어지면 큰 문제가 발생할 수 있다.
완전 무료로 사용할 수 있는 AI 코딩 도구
큐웬 코드
구글 계정을 이용해 알리바바에 등록하고 인증하면, 큐웬 CLI나 엘엘엑스퍼트 코드(LLxprt Code)를 통해 큐웬3-코더(Qwen3-Coder-480B) 모델을 사용할 수 있다. 이 모델은 성능이 꽤 준수하며, 25만 6,000토큰의 긴 컨텍스트 길이를 지원해 입문용으로 적합하다. 무료 요금제의 한도도 상당히 넉넉한 편이다.
제미나이
제미나이 CLI나 엘엘엑스퍼트 코드를 통해 구글 인증 후 일정량의 제미나이 2.5 프로 모델을 무료로 이용할 수 있다. 사용 한도가 소진되면 제미나이 2.5 플래시 모델로 전환된다. 제미나이는 최대 100만 토큰 컨텍스트를 지원한다고 주장하지만, 실제 사용 경험상 모든 정보를 완벽히 반영하지는 못한다. 그래도 PDF를 직접 파싱하는 등 다양한 기능을 지원하는 점이 강점이다.
오픈라우터
항상은 아니지만, 오픈라우터(OpenRouter)는 주기적으로 무료로 사용할 수 있는 모델을 공개한다. 최근에는 ‘소노마 스카이(Sonoma Sky)’와 ‘소노마 더스크(Sonoma Nightfall)’라는 이름의 그록 패스트(Grok Quick) 2M 컨텍스트 초기 버전을 무료로 배포했다. 다만 모델 성능은 그리 인상적이지 않았다. ‘무료’라고 해도, 실제로는 그 이상을 기대하긴 어렵다. 오픈라우터의 디스코드 채널을 주시하면 새로운 무료 모델 출시 소식을 확인할 수 있다.
오픈라우터는 때때로 인기 모델의 무료 엔드포인트도 제공한다. 하지만 이런 경우 사용자 데이터가 학습에 활용될 수 있으며, 서비스가 불안정하거나 임의로 중단될 가능성이 있다. 속도 역시 느린 편이다.
커서/윈드서프
사용자마다 체감은 다르겠지만, 주요 통합개발환경(IDE)에서도 자체 모델이나 가끔 무료로 제공되는 모델을 이용할 수 있다. 다만 이런 모델은 대부분 소형·경량 버전이며, 대형 모델의 경우 사용자가 몰리면 금세 과부하로 인해 속도가 느려지거나 이용이 어려워지는 경우가 많다.
앰프 프리
이 서비스는 소개하기가 다소 조심스럽다. 앰프 프리(Amp Free)는 자체 명령줄 인터페이스(CLI)를 제공하며, 여러 무료 모델로 리디렉션하는 방식으로 동작하는 것으로 보인다. 다만 사용자의 데이터를 학습에 활용하고, 그 대가로 광고를 노출하는 형태로 운영된다.
정리하자면, ‘무료 티어’를 제공하는 서비스는 이외에도 많지만, 대부분 단순한 연결 테스트 수준에 그친다. 그중에서도 큐웬은 무료 제공 범위가 가장 넉넉하다. 오픈라우터는 새로운 우수 모델이 공개될 때 주목할 만하다.
자신의 도구를 홍보하려는 것은 아니지만, 엘엘엑스퍼트 코드는 하나의 CLI 안에서 여러 모델을 손쉽게 전환할 수 있어 유용하다. 큐웬과 제미나이 인증을 모두 지원하며, 프로그램을 종료하지 않고도 사전 승인 테스트(PAT, Pre-Acceptance Check) 환경으로 바로 전환할 수 있어 저비용 코딩을 시도하는 사용자에게 특히 도움이 된다.
거의 무료로 이용할 수 있는 AI 코딩 도구
솔직히 말해, ‘무료’에는 다 이유가 있다. 조금만 비용을 투자해도 훨씬 나은 품질을 얻을 수 있다.
최근 중국에서 공개된 오픈웨이트 모델들이 고품질 코드 생성을 위한 새로운 길을 열었다. 이들 모델은 기존의 초거대 모델 모델에 비해 실행 요구 사양이 훨씬 낮고, 결과물은 거의 비슷하거나 오히려 더 뛰어난 경우도 있다. 이에 따라 구독형 요금제와 토큰 단위 과금 방식을 적절히 조합하면, 서비스 제공자 입장에서도 수익을 낼 수 있는 구조가 만들어지고 있다. 솔직히 말해, 토큰 단위로 계속 비용을 지불하는 방식으로는 장기적인 코드 개발이 불가능하다.
하지만 앤트로픽이 도입한 구독형 모델과 중국산 오픈웨이트 모델의 결합은 새로운 전환점을 만들었다. 이제는 비교적 저렴한 비용으로도 소넷급의 코드 생성 성능, 혹은 그 이상의 결과를 얻을 수 있다. 아래는 비용이 낮은 순서대로 정리한 주요 선택지들이다.
Z.ai
Z.ai는 월 3달러(약 4,300원)부터 시작하는 요금제를 제공한다. 현재 정책상 사용자 입력값(immediate)을 학습에 활용하지 않는다고 명시돼 있지만, 필요할 경우 변경될 수 있다고 밝히고 있다. 필자는 이 모델을 주로 오픈소스 소프트웨어 개발이나 실험적인 아이디어 구현에 사용하기 때문에, 데이터가 학습에 일부 활용될 가능성은 크게 신경 쓰지 않는다.
Z.ai의 GLM-4.6 모델은 성능이 매우 우수하며, 20만 토큰의 컨텍스트 윈도우를 지원한다. 현재 필자가 가장 많이 활용하는 코딩용 모델이기도 하다. 최근 클로드의 품질이 불안정해지면서, 필자는 코드 작성에는 GLM-4.6을, 코드 기획과 검토에는 GPT-5-코덱스를 사용하는 방식으로 전환했다. 다만 GLM-4.6 모델의 인기로 인해 Z.ai의 응답 속도가 느려지고, 연결이 불안정한 경우가 잦아진 점은 아쉽다.
슈츠
슈츠(Chutes.ai) 역시 월 3달러(약 4,300원) 요금제로 시작한다. 이 서비스를 이용하면 훨씬 더 많은 모델에 접근할 수 있지만, 전반적인 성능은 기대에 미치지 못한다. 굳이 Z.ai보다 나은 점을 꼽자면 다양한 모델을 쓸 수 있다는 정도다.
슈츠의 개인정보 보호 정책은 다소 모호하다. 회원 가입 과정에서도 문제가 있었다. 현재 구글이나 깃허브 계정 인증이 제대로 작동하지 않는다. 다른 사용자가 디스코드에서 조언해준 대로, VPN을 사용해 구글이나 깃허브 계정을 거치지 않고 새 계정을 만들자 정상적으로 가입이 가능했다.
신테틱
신테틱(Artificial)은 월 20달러(약 2만 8,000원) 요금제로, GLM-4.6, 큐웬3-480B(Qwen3-480B), 키미 K2(Kimi K2), 딥시크-V3.1(DeepSeek-V3.1) 등 다양한 모델을 지원한다. 비교적 신생 서비스이지만 디스코드를 통해 활발하게 사용자와 소통하며, 투명한 개인정보 보호 정책을 제시하고 있다.
특히 사용자 입력과 생성 결과를 14일 이상 저장하지 않으며, 동의 없이 보관하지 않는다고 명확히 밝히고 있다. 다만 도구 호출이 지연되거나(오픈AI 호환 API 호출이 아닌 메시지 스트림에 직접 노출되는 등) 일부 버그가 발생하기도 한다.
신테틱은 오픈AI 엔드포인트를 지원하는 엘엘엑스퍼트 코드(LLxprt Code), 코드 퍼피(Code Pet), 루 코드(Roo Code) 같은 CLI나 IDE에서도 사용 가능하다. 또한 자체 코딩 에이전트인 ‘옥토프렌드(Octofriend)’도 개발 중이다.
세레브라스
세레브라스(Cerebras)는 월 50달러(약 7만 1,000원) 요금제부터 시작한다. 필자는 이전 칼럼에서 세레브라스를 강하게 비판했지만, 이후 초당 토큰 처리량(TPM, Tokens Per Minute)과 요청 한도(Request Cap)가 크게 개선됐다. 현재 세레브라스는 단연 업계에서 가장 빠른 제공자다.
세레브라스는 정책상 사용자 입력(immediate)을 학습에 사용하지 않는다고 명확히 밝히고 있다. 또한 세레브라스는 큐웬3-코더-480B 모델을 매우 빠르게 사용할 수 있는 플랫폼이다. 다만 큐웬3 모델이 원래 25만 6,000토큰의 컨텍스트를 지원하는 반면, 세레브라스 버전은 13만 1,000토큰으로 제한돼 있다. 실제 사용에는 무리가 없지만 다소 제약이 느껴지는 수준이다.
그럼에도 불구하고 필자는 여전히 구독을 유지하고 있다. 속도 면에서는 단연 최고이며, 현존하는 오픈웨이트 모델 중에서도 가장 강력한 성능을 제공하기 때문이다. 세레브라스 역시 무료 티어를 제공하지만, 단순 연결 테스트 수준에 불과하다.
2025년 10월 23일, 세레브라스는 큐웬3 모델을 단계적으로 중단하고 11월부터 GLM-4.6을 자사 인프라에 탑재하겠다고 발표했다. 컨텍스트 크기는 아직 공개되지 않았다. 이는 이 시장이 얼마나 빠르게 변화하고 있는지를 보여주는 사례다. 불과 몇 주 전 ‘최신 모델’이었던 것이 이미 대체되고 있는 셈이다.
정리하자면, 구독형 서비스 중에서는 세레브라스의 정책이 가장 투명하며, 그다음은 신테틱이 꼽힌다. 완벽한 데이터 보안을 원한다면 자체 모델을 운영하는 것이 최선이다.
현재 기준으로 가장 뛰어난 오픈웨이트 모델은 GLM-4.6이며, 이 모델을 활용하려면 신테틱을 선택하는 것이 합리적이다. 반면 가장 빠른 추론 속도를 원한다면 세레브라스를 따라올 서비스가 없다.
여러 모델을 오가며 사용하려면 슈트와 신테틱 중에서 선택할 수 있다. 가격 측면에서는 슈트가, 안정성과 신뢰도 측면에서는 신테틱이 한발 앞선다.
기존 AI 강자는 지금 어떤 상황일까?
앤트로픽 클로드
한때 코드 생성의 대표 주자로 꼽혔던 클로드 코드를 떠난 개발자가 많다. 우선 앤트로픽이 자주 정책을 바꾸고 있다. 이용 요금 대비 실제로 제공되는 가치가 불분명해졌다는 지적이 많다. 또한 모델의 성능이 일정하지 않다. 어떤 날은 오퍼스가 천재처럼 작동하다가, 다음 날은 전혀 다른 모델처럼 엉뚱한 결과를 내놓기도 한다.
필자의 경험에 따르면, 과거에는 클로드가 매일 안정적으로 수행하던 작업들을 이제는 신뢰하기 어렵다. “이번 세션에서 클로드는 어떻게 작동하나요?”라는 프롬프트가 등장하는 것을 보면, 내부적으로 A/B 테스트가 진행 중인 듯하다.
앤트로픽은 최근 하이쿠와 소넷 등 새로운 모델을 추가로 선보였다. 다만 그럼에도 불구하고 클로드 맥스/프로는 여전히 가격 대비 성능이 우수한 모델이다. 클로드 코드, 오픈코드(OpenCode), 엘엘엑스퍼트 코드(LLxprt Code) 등에서 직접 사용할 수 있으며, 월 20달러(약 2만 8,000원)부터 200달러(약 28만 원)까지 다양한 요금제가 있다. 단, 반드시 프라이버시 모드를 활성화해야 한다. 앤트로픽은 기본 설정을 사용자의 데이터를 학습에 활용하도록 변경한 전례가 있기 때문이다.
오픈AI 코덱스
오픈AI가 챗GPT 구독 이용자도 코덱스 CLI를 쓸 수 있도록 한 것은 큰 변화였다. 이전에는 코덱스 CLI가 비싸고 품질이 떨어져 거의 사용되지 않았다.
GPT-5가 처음 출시됐을 때는 느리고 실망스러웠지만, 현재의 GPT-5-코덱스는 합리적 추론 기능을 강화하면 최고의 코드 생성 모델 중 하나로 평가된다. 다만 여전히 속도는 느린 편이다.
코덱스 CLI는 여전히 개발자들이 선호하는 인터페이스는 아니지만, 과거에 비해 상당히 개선됐다. 월 20달러(약 2만 8,000원)에서 200달러(약 28만 원) 사이의 요금제를 통해 챗지피티와 코덱스를 모두 이용할 수 있다.
다음 주면 또 판이 바뀐다
앤트로픽은 클로드 프로/맥스 요금제를 통해 시장의 판도를 바꿨고, 큐웬은 실제로 유용한 오픈웨이트 모델인 큐웬3-코더-480B를 공개하며 판도를 크게 흔들었다. 세레브라스는 최초로 오픈웨이트 모델에 구독형 요금제를 도입한 추론 서비스 제공자로, 성능 면에서 새로운 기준을 세웠다.
이후 다른 여러 제공자들도 구독형 모델을 잇따라 내놓았다. 속도는 세레브라스보다 떨어지지만, 각기 기술적인 장점을 내세우며 경쟁 중이다. 이제 큐웬3 모델은 더 이상 최상위 모델로 평가되지 않는다. 클로드 시대가 저물고, 다양한 선택지가 쏟아지는 지금이야말로 개발자에게는 ‘풍요의 시대’다.
하지만 이런 흐름은 매우 빠르게 변하고 있다. 다음 달에는 새로운 모델과 구독 요금제가 속속 등장할 전망이다. 일부 서비스는 Z.ai처럼 수용 가능한 사용자 수를 초과해 서비스 품질이 저하될 가능성도 있다.
또한 동일한 모델이라도 제공 업체에 따라 성능이 크게 다를 수 있다. 이는 단순히 양자화(Quantization) 차이 때문만이 아니다. 따라서 단기 구독을 활용해 직접 시험해 보고, 새로운 모델이 등장하면 즉시 전환할 준비를 해두는 것이 좋다.
허깅페이스에 새로운 모델이 올라오는 순간, 시장의 흐름은 다시 바뀔 수 있다. 지금의 AI 코딩 경쟁은 그만큼 빠르고, 예측하기 어려운 단계에 들어섰다.
dl-ciokorea@foundryco.com