개발자 AI 코딩 생산성 5배 높이는 워크플로우 가이드

Anthropic Claude Code 개발 책임자 Boris Cherny의 AI 코딩 워크플로우가 공개되며 개발자 커뮤니티가 들썩이고 있습니다. AI를 단순한 비서가 아닌 '부대'처럼 활용하고, 느리지만 스마트한 모델을 선택하며, AI의 '건망증'을 해결하는 CLAUDE.md 파일, 반복 작업을 자동화하는 슬래시 명령어와 서브 에이전트, 그리고 AI 스스로 코드 품질을 검증하는 루프까지. 이 가이드에서 개발 생산성을 5배 높일 수 있는 실제적인 AI 코딩 전략을 확인하세요.

소프트웨어 개발 분야에서 AI는 이제 빼놓을 수 없는 도구다. 단순한 코드 자동 완성 기능을 넘어, AI를 활용해 실제 개발 생산성을 폭발적으로 끌어올리는 방법에 대한 관심이 커지고 있다. 최근 Anthropic의 Claude Code 개발 책임자인 Boris Cherny가 자신의 AI 코딩 워크플로우를 공개하면서 개발자 커뮤니티가 들썩이고 있다. VentureBeat AI가 전한 바에 따르면, 그의 방식은 한 명의 개발자가 작은 엔지니어링 팀 수준의 아웃풋을 낼 수 있도록 돕는다고 한다. 이 글에서는 Cherny의 핵심 전략을 분석하고, 실제 AI 코딩 생산성을 극대화할 수 있는 실용적인 워크플로우 구축 방안을 제시한다.

AI를 비서가 아닌 ‘부대’로 활용하는 법

대부분의 개발자가 AI를 코드 어시스턴트처럼 활용한다. 질문 하나를 던지고 답변을 기다리는 식이다. 그러나 Cherny의 접근 방식은 완전히 다르다. 그는 AI를 마치 실시간 전략 게임의 유닛처럼, 동시에 여러 개를 운용한다. 그의 X 게시글에서 밝힌 바에 의하면, 그는 터미널에서 5개의 Claude 인스턴스를 병렬로 실행한다. 각각의 탭에 1번부터 5번까지 번호를 매기고, iTerm2의 시스템 알림을 활용해 각 인스턴스가 입력이 필요할 때마다 인지한다.

이 병렬 처리 방식의 장점은 명확하다. 한 AI가 테스트 스위트를 실행하는 동안, 다른 AI는 레거시 모듈을 리팩토링하고, 또 다른 AI는 문서 초안을 작성한다. 개발자는 이 모든 과정을 직접 코딩하는 대신, 각 AI 에이전트에 명령을 내리고 그 결과를 조율하는 ‘사령관’ 역할을 한다. claude.ai 웹에서도 5~10개의 Claude 세션을 동시에 운영하며, 로컬 터미널과 웹 세션을 ‘텔레포트’ 명령으로 유연하게 오간다. 이 방법은 단순히 시간을 절약하는 것을 넘어, 개발자의 사고방식 자체를 바꾼다. 문법을 타이핑하는 데 집중하기보다, 고수준의 문제 해결과 아키텍처 설계에 더 많은 에너지를 쏟을 수 있는 환경을 만든다.

느리지만 스마트한 모델, 왜 Opus 4.5인가

AI 개발의 속도는 종종 토큰 생성 속도에 비례한다고 생각하기 쉽다. 하지만 Cherny는 이러한 통념을 뒤집는다. 그는 Anthropic의 가장 무겁고 느린 모델인 Opus 4.5를 모든 작업에 사용한다고 밝혔다. Opus 4.5를 선택한 이유에 대해 그는 "내가 사용해 본 코딩 모델 중 최고"라고 설명한다.

이 결정의 배경에는 중요한 통찰이 있다. 현대 AI 개발의 병목 현상은 AI가 코드를 생성하는 속도가 아니라, 개발자가 AI의 실수를 수정하는 데 드는 시간에 있다. 더 작고 빠른 모델은 초기에 빠르게 응답하지만, 그만큼 오류가 많아 수정에 더 많은 사람의 시간이 들어간다. 반면, Opus 4.5처럼 똑똑한 모델은 초기 컴퓨팅 비용은 높을 수 있어도, 오류가 적고 도구 사용 능력이 뛰어나 전체적인 수정 시간을 대폭 줄인다. 즉, 똑똑한 모델에 ‘컴퓨팅 세금’을 더 내는 것이 궁극적으로 ‘수정 세금’을 아껴 더 빠른 개발을 가능하게 한다는 뜻이다. 기업 기술 리더들에게 이 시사점은 상당히 크다.

AI 건망증 해결: CLAUDE.md 파일의 비밀

AI 모델의 고질적인 문제 중 하나는 ‘건망증’이다. 특정 세션에서 학습한 내용을 다음 세션에서 기억하지 못하는 경우가 많다. 기업의 고유한 코딩 스타일이나 아키텍처 결정 사항을 AI가 지속적으로 학습하게 하려면 어떻게 해야 할까?

Cherny 팀은 이 문제를 해결하기 위해 깃(Git) 저장소에 CLAUDE.md라는 단일 파일을 유지한다. 이 파일은 AI에게 전달되는 지속적인 지침서 역할을 한다. "Claude가 잘못된 작업을 할 때마다, 다음번에는 그러지 않도록 CLAUDE.md에 추가한다"고 그는 설명했다.

이러한 방식은 코드베이스를 스스로 교정하는 유기체로 변모시킨다. 개발자가 풀 리퀘스트를 검토하다가 AI가 만든 오류를 발견하면, 단순히 코드를 수정하는 데 그치지 않는다. AI의 지침을 업데이트하도록 태그를 지정한다. 아카쉬 굽타(Aakash Gupta)와 같은 제품 리더들은 "모든 실수가 규칙이 된다"고 이 방식을 평가한다. 팀이 함께 작업하는 시간이 길어질수록 AI 에이전트는 점점 더 똑똑해지는 구조다.

개발 반복 작업 자동화: 슬래시 명령어와 서브 에이전트

Cherny의 워크플로우는 반복적이고 지루한 개발 작업을 자동화하는 데 중점을 둔다. 그는 프로젝트 저장소에 커스텀 슬래시 명령어(slash commands)를 추가하여 복잡한 작업을 단 한 번의 키 입력으로 처리한다.

예를 들어, 그는 매일 수십 번 호출하는 /commit-push-pr이라는 명령어를 사용한다. 이 명령어는 수동으로 깃(git) 명령어를 입력하고, 커밋 메시지를 작성하고, 풀 리퀘스트를 여는 대신, AI 에이전트가 이 모든 버전 관리 작업을 자율적으로 처리하게 한다. 이는 개발자가 지루한 절차에 시간을 낭비하는 대신, 실제 문제 해결에 집중하도록 돕는 핵심 전략이다.

또한, 그는 개발 라이프사이클의 특정 단계를 전담하는 ‘서브 에이전트’를 배포한다. 메인 작업이 끝난 후 아키텍처를 정리하는 ‘코드 간소화(code-simplifier)’ 에이전트나, 최종 배포 전에 엔드 투 엔드 테스트를 실행하는 ‘앱 검증(verify-app)’ 에이전트 등이 그 예다. 이러한 전문화된 AI 페르소나는 개발 과정의 효율성을 한층 더 높인다.

AI 코드 품질의 핵심: 검증 루프의 힘

AI가 생성한 코드의 품질은 항상 논란거리였다. 단순히 코드를 생성하는 것을 넘어, 그 코드가 제대로 작동하는지 AI 스스로 검증할 수 있다면 어떨까? Cherny는 검증 루프(verification loop)가 AI 생성 코드의 품질을 2~3배 향상시킨다고 주장한다.

그는 "Claude는 Claude Chrome 확장 프로그램을 사용해 claude.ai/code에 적용하는 모든 변경 사항을 테스트한다"고 밝혔다. AI가 브라우저를 열어 UI를 테스트하고, 코드가 작동하고 사용자 경험이 만족스러울 때까지 반복적으로 수정 작업을 진행한다는 것이다.

이것은 AI를 단순한 텍스트 생성기가 아니라, 스스로의 작업을 테스트하고 개선하는 ‘테스터’로 만드는 것을 의미한다. 브라우저 자동화, 셸 명령어 실행, 테스트 스위트 실행 등 AI에게 자신의 작업을 검증할 수단을 제공하는 것이 중요함을 시사한다. AI가 코드를 작성하는 것을 넘어, 그 코드가 작동함을 스스로 증명하게 함으로써 최종 결과물의 신뢰성을 비약적으로 높일 수 있다.

개발자 역할의 변화, 그리고 다음 단계

Boris Cherny의 워크플로우는 개발자들이 AI를 바라보는 시각에 중대한 변화를 가져올 징후다. 한때 AI 코딩은 IDE의 자동 완성 기능에 머물렀지만, 이제는 노동 그 자체를 위한 ‘운영 체제’로 기능할 수 있음을 보여준다.

이러한 변화는 개발자의 역할에 대한 재정의를 요구한다. 더 이상 단순한 코더가 아닌, AI 에이전트의 부대를 지휘하고, 복잡한 시스템을 설계하며, AI의 학습을 돕는 전략가이자 아키텍트의 역할이 강조된다. AI를 보조 도구가 아닌, 협업하는 워크포스로 인식하고 이 새로운 패러다임에 적응하는 개발자들이 앞으로의 소프트웨어 개발 경쟁에서 우위를 점할 것은 분명하다.

출처: VentureBeat AI

AI리서치팀

AI리서치팀

Home-In-One AI리서치팀은 인공지능, 머신러닝, 생성형 AI의 최신 동향과 실용적 활용법을 연구합니다. ChatGPT, 클로드, 미드저니 등 AI 도구 비교 분석과 활용 가이드를 제공합니다.