gstack — Claude Code를 가상 엔지니어링 팀으로
gstack은 Y Combinator의 Garry Tan이 만든 오픈소스(MIT) CLI 툴킷입니다. CEO·디자이너·엔지니어링 매니저·QA 리드·릴리스 엔지니어 등 전문 역할을 흉내 내는 23개 이상의 슬래시 커맨드를 제공해, Claude Code를 빈 캔버스가 아닌 구조화된 "엔지니어링 팀"처럼 동작하게 만듭니다.
"누가 타이핑했는지가 아니라, 무엇이 배포됐는지가 핵심이다."
gstack의 설계 철학. 역할 기반 스킬로 기획부터 배포·회고까지 개발 전 주기에 가드레일을 씌워, AI 코딩을 카오스가 아닌 규율 있는 워크플로우로 바꾼다.
1. gstack이란 무엇인가
일반적인 AI 코딩 어시스턴트는 빈 캔버스를 줍니다. gstack은 그 위에 스프린트 방법론을 강제하여, 잘못된 가정·과도한 복잡성·일관성 없는 기준 같은 흔한 AI 실패 모드를 막습니다. 마크다운 기반 컨텍스트와 로컬 우선 상태 관리를 채택해 특정 포맷에 종속되지 않는 것도 특징입니다.
역할 기반 스킬 구성 — 작업(task)이 아니라 역할(role)로 스킬을 나눈다
마크다운 기반 컨텍스트 — 독점 포맷 없이 사람이 읽을 수 있는 상태로 관리
세션을 넘는 취향 학습 — 디자인 선택과 학습을 누적해 점점 개인화된다
10+ 플랫폼 지원 — Claude Code 네이티브 외 Codex CLI, Cursor 등에도 설치
2. 어떤 문제를 푸는가
AI 코딩의 생산성은 높아졌지만, 구조 없이 맡기면 품질과 일관성이 무너집니다. gstack은 스프린트 전 과정에 워크플로우를 강제해 이 간극을 메웁니다.
AI 실패 모드 차단
잘못된 가정, 과도한 복잡성, 들쭉날쭉한 기준을 구조로 막는다
병렬 개발
Conductor로 10~15개 스프린트를 동시에 격리 실행
자동화된 품질
코드 리뷰·테스트·문서화·배포를 스킬로 자동화
일관성 유지
팀 전체에 아키텍처와 디자인 품질을 일관되게 적용
3. 스프린트 구조: Think → Ship → Reflect
gstack의 모든 스킬은 7단계 스프린트로 연결됩니다. 각 단계의 산출물이 다음 단계의 입력이 되어, 기획부터 배포 후 회고까지 끊김 없이 흐릅니다.
Think — 문제 재정의
/office-hours로 제품을 다시 묻고, 구현 전에 설계 문서를 만든다.
Plan — 계획 수립
CEO·엔지니어링·디자인·DX 관점의 플랜 리뷰로 범위와 아키텍처를 확정한다.
Build — 구현
확정된 스펙을 바탕으로 기능을 작성한다.
Review — 코드 감사
/review와 /codex로 CI를 통과한 프로덕션 버그까지 잡아낸다.
Test — 실제 QA
/qa가 실제 브라우저를 띄워 동작을 확인하고 회귀 테스트를 만든다.
Ship — 배포
/ship → /land-and-deploy → /canary로 PR·머지·배포·헬스체크를 자동화한다.
Reflect — 회고
/retro와 /learn으로 회고를 남기고 세션을 넘어 학습을 누적한다.
4. 23개+ 스킬 카탈로그
기획·디자인·구현·테스트·배포·문서화·안전까지, 역할별로 묶인 주요 슬래시 커맨드입니다. 각 스킬은 키워드로 자동 트리거되며 서로의 산출물을 이어받습니다.
기획 & 발견 (코드 작성 전)
| /office-hours | 여섯 가지 강제 질문으로 제품을 재정의하는 YC 오피스아워 |
| /plan-ceo-review | 확장·축소 4개 모드로 범위를 검증하고 숨은 10점짜리 제품을 찾는다 |
| /plan-eng-review | 아키텍처를 확정하고 ASCII 다이어그램·상태 머신을 그린다 |
| /plan-design-review | 디자인 차원을 0~10점으로 평가하고 AI 슬롭을 잡아낸다 |
| /plan-devex-review | 개발자 페르소나와 경쟁사 벤치마크로 DX 마찰을 추적한다 |
| /design-consultation | 리서치 기반으로 디자인 시스템을 처음부터 설계한다 |
디자인 & 프로토타이핑
| /design-shotgun | 4~6개 AI 목업 변형을 만들고 비교 보드에서 취향을 학습시킨다 |
| /design-html | 승인된 목업을 의존성 0의 프로덕션 HTML/CSS로 변환한다 |
| /design-review | 배포 후 디자인을 감사하고 비포/애프터 스크린샷과 함께 수정한다 |
구현 & 리뷰
| /review | CI를 통과하는 프로덕션 버그를 찾아 자명한 문제는 자동 수정한다 |
| /investigate | 근본 원인 중심의 체계적 디버깅 (수정 시도는 3회로 제한) |
| /codex | OpenAI Codex로 독립적인 2차 의견 — 리뷰·도전·상담 3모드 |
테스트 & 품질
| /qa | 실제 Chromium을 띄워 버그를 찾고 수정하며 회귀 테스트를 생성한다 |
| /browse | 명령당 ~100ms의 헤드리스 브라우저, 도메인별 패턴 메모리 지원 |
| /cso | OWASP Top 10 + STRIDE 위협 모델링 (고신뢰도 게이트) |
| /benchmark | Core Web Vitals를 베이스라인으로 잡고 성능 회귀를 추적한다 |
배포 & 릴리스
| /ship | 테스트·커버리지 감사 후 푸시하고 PR을 연다 |
| /land-and-deploy | PR 머지 → CI 대기 → 배포 → 프로덕션 헬스 검증 |
| /canary | 배포 후 콘솔 에러·성능 회귀·페이지 실패를 모니터링한다 |
문서화 · 회고 · 자동화
| /document-release | 배포된 변경에 맞춰 모든 문서를 갱신하고 낡은 README를 찾는다 |
| /retro | 팀 인지형 주간 회고 — 사람별 분석과 배포 스트릭 추적 |
| /learn | 프로젝트 학습을 검토·검색·정리하여 세션을 넘어 누적한다 |
| /autoplan | CEO → 디자인 → 엔지니어링 리뷰를 자동 실행하고 취향 결정만 노출 |
안전 & 제어
| /careful | rm -rf, DROP TABLE, force-push 등 파괴적 명령 전 경고 |
| /freeze | 디버깅 중 편집 범위를 한 디렉터리로 제한한다 |
| /guard | /careful + /freeze를 결합한 최대 안전 모드 |
5. 대표 워크플로우
스킬을 엮으면 강력한 파이프라인이 됩니다. 대표적인 세 가지 흐름입니다.
디자인 탐색 파이프라인
/design-consultation → /design-shotgun → /design-html → /design-review
엔드투엔드 기능 개발
/office-hours → /plan-ceo-review → /plan-eng-review → 구현 → /review → /qa → /ship
크로스 모델 2차 의견
/review (Claude) + /codex (OpenAI) = 모델 간 교차 검증
Conductor와 결합하면 10~15개의 스프린트를 격리된 워크스페이스에서 동시에 돌릴 수 있습니다. 스프린트 구조가 카오스를 막아주기 때문에, CEO는 의사결정 지점에서만 개입하면 됩니다.
6. 설치
저장소를 ~/.claude/skills/gstack 로 클론하고 setup 스크립트를 실행하면 30초 만에 준비됩니다. (요구사항: Claude Code, Git, Bun v1.0+)
Quick Setup
git clone --single-branch --depth 1 \ https://github.com/garrytan/gstack.git \ ~/.claude/skills/gstack cd ~/.claude/skills/gstack ./setup
팀 모드는 ./setup --team으로 공유 저장소의 .claude/ 디렉터리를 통해 팀원에게 gstack을 자동 배포합니다.
7. 설계 철학과 보안
gstack은 가드레일 있는 AI 개발을 지향합니다. 빠른 속도만큼이나 안전과 검증을 중시하며, 브라우저 자동화에는 프롬프트 인젝션 방어를 기본 탑재했습니다.
보안 우선 브라우저
로컬 ML 분류기 + Haiku 검증 + 카나리 토큰으로 프롬프트 인젝션을 방어
지식 영속화 (GBrain)
코드베이스 지식을 영속 저장소에 색인해 세션 간 컨텍스트를 유지
체크포인트 모드
WIP 커밋으로 작업을 자동 저장해 크래시·컨텍스트 전환에도 복구 가능
옵트인 텔레메트리
코드·파일 경로·프롬프트는 전송하지 않으며 기본값은 비활성