참고자료 · Open Source
오픈소스 에이전트와 모델 스택
요즘의 중요한 흐름 중 하나는 폐쇄형 런타임만 보는 것이 아니라, 오픈소스 에이전트 런타임과 오픈 모델로 어디까지 구축할 수 있는지를 같이 보는 것입니다. 이 페이지는 실제로 검증 가능한 프로젝트만 추려, “무엇이 있고 어디까지 가능한가” 관점으로 정리한 요약입니다.
1. 오픈소스 코딩 에이전트 런타임
SST가 유지하는 오픈소스 코딩 에이전트입니다. provider-agnostic, built-in agents, TUI 중심, desktop beta를 제공합니다.
오픈소스 에이전트 런타임을 바로 써 보고 싶을 때 가장 먼저 검토할 만한 후보입니다.
AI-driven development를 목표로 하는 대형 오픈소스 프로젝트입니다. 코드 작업과 소프트웨어 에이전트 실험을 폭넓게 다룹니다.
터미널 pair programming보다 더 넓은 autonomous development 축을 보고 싶을 때 적합합니다.
터미널 pair programming에 강한 오픈소스 도구입니다. 다양한 클라우드/로컬 LLM을 연결할 수 있습니다.
가볍고 빠른 pair programming 워크플로를 원할 때 여전히 강한 선택지입니다.
2. 그 위에 올릴 수 있는 오픈 빌딩 블록
Claude Code, Codex, OpenCode, Aider 등 여러 에이전트를 HTTP API로 감싸는 프로젝트입니다.
Claude Skills 스타일의 스킬을 로컬에서 여러 LLM과 함께 실행하는 오픈소스 도구입니다.
여러 코딩 에이전트를 선택적으로 붙일 수 있는 Vercel 기반 템플릿입니다.
OpenCode 위에 더 제품화된 인터페이스와 워크플로 공유를 얹으려는 오픈소스 앱입니다.
3. 그 위에 얹는 오케스트레이션 레이어
최근 흐름은 런타임 하나만 두고 쓰는 것이 아니라, 그 위에 workflow / team orchestration / hooks / skills / traces를 얹는 방향으로 빠르게 움직이고 있습니다. 아래 프로젝트들은 각 런타임 위에 다른 방식의 하네스 레이어를 추가합니다.
Claude Code 위에 얹는 멀티에이전트 오케스트레이션 레이어입니다. team 중심 파이프라인, tmux CLI workers, skills, hooks, trace 계층을 제공합니다.
README 기준으로 v4.1.7부터 Team이 표준이고, v4.4.0부터 Codex/Gemini는 MCP 서버가 아니라 tmux CLI worker 방식으로 전환됐습니다.
OpenAI Codex CLI 위에 얹는 workflow layer 입니다. Codex 를 실행 엔진으로 유지하면서 `$deep-interview`, `$ralplan`, `$team`, `$ralph` 같은 표준 workflow 를 제공합니다.
README 기준으로 `.omx/` 상태, native Codex hooks, team runtime, sparkshell/explore 같은 보조 표면을 함께 제공합니다.
OpenCode 위에 얹는 강한 orchestration · harness 레이어입니다. 다중 모델 오케스트레이션, built-in MCPs, skill-embedded MCPs, tmux, LSP, AST-Grep 같은 확장 표면을 강조합니다.
README는 `ultrawork` 같은 단일 키워드 진입과 OpenCode 설정 파일 위의 plugin/compatibility layer를 핵심 UX로 설명합니다.
4. 같이 볼 만한 오픈 모델 축
강한 오픈 30B 모델로, 코드 보조와 구조화된 reasoning 보조에 실전적으로 검토할 수 있는 구간입니다.
agentic coding과 browser-use 쪽을 전면에 내세운 오픈 coder 모델입니다.
공식 블로그에서 SWE-Bench Verified open-source SOTA를 강조하는 오픈 coder 계열입니다.
5. 어디까지 가능한가
- 로컬 또는 self-hosted coding assistant 구축
- 오픈 모델 + provider-agnostic agent runtime 조합
- terminal pair programming, review, search, 브라우저 기반 검증
- 에이전트 간 HTTP 래핑, 원격 제어, 워크플로 제품화
다만 “완전한 대체”로 말하면 과장됩니다. 현재 오픈 모델과 오픈 런타임은 충분히 강해졌지만, frontier 폐쇄형 런타임의 편의성과 완성도, 최신 도구 통합, 안정성 면에서는 아직 차이가 남아 있는 경우가 많습니다. 그래서 현실적인 선택은 대체라기보다 역할 분리 입니다. 메인 세션은 강한 런타임을 쓰고, 오픈 런타임은 로컬 검증, 사내 프라이버시 워크플로, 실험 환경, 보조 에이전트 계층에 배치하는 식입니다.
6. 최신 기준으로 추천할 만한 조합
조합 A — 로컬 pair programming 후보
OpenCode + LM Studio + Gemma 4 26B A4B 또는 Gemma 4 31B
OpenCode 공식 문서는 LM Studio 같은 OpenAI-compatible local provider 구성을 예시로 보여 줍니다. Gemma 4 공식 모델 카드는 E 계열은 노트북/폰, 26B A4B와 31B는 consumer GPU와 workstation을 배포 대상으로 설명합니다. 따라서 로컬 pair programming 용도로 검토할 만한 조합으로 볼 수 있습니다.
조합 B — 오픈 coder 중심의 agentic coding 실험
OpenCode 또는 Aider + Qwen3-Coder-30B-A3B-Instruct + OpenAI-compatible endpoint
Qwen3-Coder 30B 공식 카드 기준으로 30.5B total / 3.3B activated, 256K native context, agentic coding과 browser-use를 전면에 내세웁니다. exact hardware requirement는 이 페이지에서 직접 단정하지 않지만, 공식 카드 자체가 효율성과 agentic coding을 강조하므로 고성능 로컬 coder 실험에서 우선 검토할 만한 축으로 볼 수 있습니다.
조합 C — autonomous development 실험
OpenHands + LM Studio + Devstral Small 2505
OpenHands 공식 local LLM 문서는 이 조합을 예시로 보여 줍니다. 또한 같은 문서에서최소 16GB VRAM GPU 또는 Apple Silicon 32GB RAM을 hardware requirement로 명시합니다. 다만 OpenHands 문서도 local LLM은 기능이 제한될 수 있다고 경고하므로, pair programming보다 더 넓은 autonomous development 실험용으로 보는 편이 정확합니다.
7. 하드웨어 기준으로 보면
노트북 급
Gemma 4 E2B/E4B 같은 소형 모델, 문서 요약, 간단한 코드 보조, 경량 pair programming 정도가 현실적입니다. 공식 Gemma 카드도 작은 모델을 노트북/온디바이스 배포 대상으로 설명합니다.
고성능 개인 워크스테이션
Gemma 4 26B A4B, 31B, Qwen3-Coder-30B 같은 모델을 검토할 수 있는 구간입니다. 정확한 속도는 서빙 백엔드에 따라 크게 달라지지만, 실제 구현/리팩터/검증 보조까지 보는 실용 구간입니다.
팀 서버 / GPU 서버
OpenHands나 더 긴 autonomous workflow, 브라우저 검증, 다수 세션 동시 운영 같은 팀 단위 실험은 이 구간이 더 적합합니다. 특히 traces, observability, MCP governance까지 같이 붙이면 개인 장비보다 팀 서버 쪽이 운영하기 좋습니다.
8. 실제 사용성 기준으로 보면
- 빠르게 바로 쓰기: Aider
- provider-agnostic 오픈 런타임: OpenCode
- autonomous development 실험: OpenHands
- Claude Code 위의 강한 오케스트레이션: oh-my-claudecode
- Codex CLI 위의 workflow layer: oh-my-codex
- OpenCode 위의 aggressive harness layer: oh-my-opencode
- 오픈 모델만으로 팀 표준화: 가능은 하지만, 운영 편의성과 최신 도구 통합 면에서는 별도 검토가 더 필요합니다
- 현실적인 접근 후보: 폐쇄형 메인 세션 + 오픈 런타임/오픈 모델 보조 레이어