에이전트 코딩의 최전선

결과물이 아닌 생성 장치를 만든다 — Lablup 신정규 대표가 Backend.AI:GO를 40일간 130억 토큰으로 만든 실전 경험을 바탕으로, 에이전트 코딩 방법론과 소프트웨어 산업의 구조적 변화를 이야기합니다.

단순한 "바이브 코딩" 팁이 아니다.

소프트웨어의 정의 자체가 바뀌고 있다는 관점에서, 실무자가 지금 무엇을 해야 하는지를 다룹니다.

1. 토큰은 새로운 자본이다

Anthropic의 holiday 토큰 두 배 이벤트가 Backend.AI:GO 탄생의 계기였습니다. 토큰을 쓸 수 있는 양이 IT 회사의 경쟁력과 직결되는 시대가 됐습니다.

3년 걸리던 100만 줄의 코드를 40일에 만들 수 있었던 건 Claude Code Max 2개 + 8개 PC 병렬 운영이라는 토큰 투입량 덕분이었습니다.

시사점

토큰 비용 최적화가 곧 개발 경쟁력입니다. 같은 결과를 더 적은 thinking으로 내는 adaptive thinking budget, 또는 5~10배 빠른 고속 inference — 이 두 축이 다음 경쟁의 핵심이 됩니다.

2. harness가 모델보다 중요하다

Backend.AI:GO를 통해 Claude Code의 백엔드 모델을 Gemini, Codex 등으로 교체하며 테스트한 결론:

"Claude Code의 핵심 경쟁력은 Opus나 Sonnet이 아니다. Claude Code 그 자체다."

같은 모델도 어떤 harness에 붙이느냐에 따라 결과가 완전히 달라진다

모델을 감싸서 결정론적으로 동작하게 만드는 코드 레이어가 진짜 경쟁력

사람과의 alignment를 맞추는 인터랙션 설계가 핵심

Claude Code harness + Gemini 3 Pro 조합이 매우 효과적이었다는 흥미로운 결과

3. 최종 결과물에 손대지 마라 — 생성 장치를 고쳐라

"코딩하는 대상이 최종 목적지가 아니라, 코딩을 하는 에이전트를 만드는 것이다."

에이전트 코딩의 가장 핵심적인 사고 전환입니다. 실전 프로세스:

컨텍스트 빌딩

원하는 것을 바로 지시하지 않고, 먼저 AI에게 탐색/조사시켜 컨텍스트를 쌓는다

soul document 작성

CLAUDE.md에 에이전트의 행동 방식을 기술한다 (단순 프로젝트 설명이 아님)

생성 장치 반복

결과물이 마음에 안 들어도 결과물을 직접 수정하지 않고, 그것을 만드는 에이전트/skill/command를 수정한다

자기 비판 루프

여러 각도에서 AI 스스로 비판하게 하고, 그 결과로 harness 자체를 업데이트한다

이 방식으로 Backend.AI:GO는 cron + Claude -p 만으로 GitHub 이슈 자동 검증 → 개발 계획 → 구현 → 테스트 → merge까지 전 과정을 자동화했습니다. 764개의 PR이 이 파이프라인을 통해 처리됐습니다.

4. 소프트웨어의 정의가 바뀌고 있다

미래 소프트웨어의 구성:

구성 요소	비중
AI 코어 엔진 (모델)	~80%
결정론적 제어 코드	~10%
인터페이스 (UI/UX, A2A, MCP)	~10%

코드 자체의 가치는 0으로 수렴합니다. 하지만 소프트웨어가 사라지는 게 아닙니다. 천공 카드에서 키보드로, 패키지에서 웹/모바일로 바뀌었듯이 지금은 코드 중심에서 모델 중심으로 세 번째 대변혁이 일어나고 있습니다.

"옛날에는 소프트웨어를 사람이 손으로 만들었구나, 하고 역사책에서 보게 될 것이다."

5. 인지 부하는 줄지 않는다 — 바이오 토큰의 한계

40일 동안 3년 치 코드를 짰지만, 사람으로서는 3년 치 늙었습니다. AI에게 맡겨도 끊임없는 피드백이 들어오기 때문에 인지 부하가 줄지 않습니다.

모바일 게임 가챠와 같은 도파민 구조: 에이전트가 빠르게 결과를 내놓으면 더 시키고 싶어지고, 더 시키면 또 잘 되고, 거기서 빠져나오지 못합니다. 이것이 개인의 삶을 피폐하게 만들고, 도파민이 끊기면 프로덕트도 버려지는 이중의 위험을 만듭니다.

6. 인스턴트 앱 시대 — 살아남는 것의 조건

소프트웨어가 폭발적으로 늘어나지만 대부분 수명이 짧습니다. 필요할 때 만들고 버리는 인스턴트 앱이 주류가 될 것입니다.

살아남는 소프트웨어의 공통점:

앱을 통해서만 가능한 소셜 기반 사용성

생활 밀착형 생산성 도구

오랫동안 유지된 브랜드 — "빨리 망하지 않겠다"는 확신

한 사람이 쓰는 앱은 30개를 넘지 않고, 상위 10개가 사용량의 90%를 차지한다.

7. 복제의 시대에서 스타트업이 살아남는 법

NotebookLM 클론이 나흘이면 나오는 시대. 스타트업에게 가장 안 좋은 것은 모든 아이템의 복제가 너무 쉽다는 것입니다.

물레방아론

사업은 낙차가 큰 곳에 물레방아를 설치하는 것. 지금 낙차가 가장 큰 곳은 IT 내부가 아니라, AI로 인해 새로 IT 영역에 편입되는 도메인입니다. CS 전문가가 도메인을 배우는 것이 도메인 전문가가 CS를 배우는 것보다 빠릅니다.

즉시 적용 가능한 실천 사항

에이전트 코딩 워크플로우

새 세션에서 바로 일 시키지 말 것 — 먼저 2~3턴의 컨텍스트 빌딩 대화를 깔아둔다

CLAUDE.md를 soul document로 다루기 — 프로젝트 설명이 아닌, 에이전트 행동 지침서로 작성한다

"다른 에이전트에게 줄 데이터"로 프레이밍 — AI가 방어적이 되지 않도록, 자기를 고치려는 게 아니라 협업 데이터라는 맥락을 준다

결과물 직접 수정 금지 — 결과가 마음에 안 들면 생성 장치(skill, command, agent)를 수정한다

한국어 음성 입력 활용 — 영어 대비 품질 차이 미미, 입력 속도가 병목

조직 적용 시사점

비개발 직군도 30분이면 Claude Code 사용 가능 (Lablup CFO, 콘텐츠 담당자 사례)

핵심은 남이 만든 skill을 다운받는 게 아니라, 내 일을 위탁하는 나만의 harness를 만드는 것

지금 안 되는 건 2개월만 미뤄라 — 모델 성능이 빠르게 올라가고 있다

Claude Code vs Codex — 두 가지 진화 방향

	Claude Code (아스라다)	Codex (오가)
철학	사람과 align 맞추며 공진화	AI가 최적해를 스스로 추구
최고 성능	상대적 낮음	더 높음
사용 경험	편안함, 과정을 함께함	결과는 좋지만 과정 불투명

사이버 포뮬러 애니메이션의 비유: 사람과 함께 성장하는 AI(아스라다)와 사람을 신뢰하지 않고 스스로 최적 주행하는 AI(오가). 두 접근 모두 유효하지만, 어떤 철학의 도구를 선택하느냐에 따라 사용자의 성장 경로가 달라집니다.

기억해야 할 문장들

"코드의 가치는 거의 0으로 수렴하게 된다."

"Claude Code의 핵심 경쟁력은 Opus나 Sonnet 엔진이 아니다. Claude Code 그 자체다."

"내 걸 만들게 되면 그 가속이 시작된다."

"진짜 파도는 이제부터 올 거다."

"지금 안 되면 2개월만 미루라. 그때 되면 된다."

Source

AI 프론티어 EP86 — 에이전트 코딩의 최전선

신정규 (Lablup 대표) | youtube.com