Ai2 SERA CLI: Claude Code로 나만의 코딩 에이전트를 터미널에서 실행하기
🚀 1. SERA CLI 란?
SERA CLI는 Ai2(Allen Institute for AI)가 발표한 Open Coding Agent프로젝트의 일부로, SERA (Soft-Verified Efficient Repository Agents) 모델을 CLI(커맨드라인)에서 쉽게 실행하고 Claude Code와 연동해 쓰는 도구다.
SERA는 코드 생성, 코드 리뷰, 디버깅 등 다양한 소프트웨어 개발 관련 업무를 자동화하는 코딩 에이전트 모델로 설계되었으며,
- 오픈 소스
- 비교적 저렴한 컴퓨팅 비용
- 자체 코드베이스에 맞춘 특화 가능 과 같은 강점을 가진다.
sera-cli는 이 SERA 모델을 간단한 명령어로 사용하도록 도와주는 도구라 보면 된다.
🛠️ 2. 준비하기
📌 필수 조건
sera-cli를 쓰려면 아래 도구가 필요하다:
- Claude Code – Anthropic이 만든 대화형 코딩 도구
- uv – 유틸리티 도구(sera-cli 설치 및 실행에 사용)
- Python 환경 – sera-cli 본체가 Python 기반
📥 3. 설치 방법
✅ Modal을 이용한 빠른 설치
Modal은 GPU를 자동 준비하고, SERA 모델을 내려받아 실행해주는 서비스다. 처음 설정 시 시간이 조금 걸릴 수 있지만, 이후부터는 빠르게 사용할 수 있다.
# Modal 설치
uv tool install modal
# sera-cli 설치
uv tool install ai2-sera-cli
# modal 계정 설정
modal setup
# SERA를 Modal로 실행하고 Claude Code 연동
sera --modal🔹 첫 실행에서는 약 65GB 정도의 모델 파일을 내려받는다. 이후에는 캐시되어 빠르게 시작된다.
🌐 4. 기존 엔드포인트를 쓰는 방법
이미 vLLM(예: HuggingFace나 자체 서버)이 준비되어 있다면, API 엔드포인트를 직접 연결해 쓰는 방법도 있다.
# sera-cli 설치
uv tool install ai2-sera-cli
# API KEY 환경 변수 지정 (엔드포인트 필요 시)
export SERA_API_KEY=<your_api_key>
# 연결해서 실행
sera --endpoint <your_vLLM_endpoint_URL>👥 5. 팀/공유 환경 설정
Modal을 이용하면 개인용으로만 실행되지만, deploy-sera 명령어를 쓰면 서버에 지속적으로 켜진 vLLM 인스턴스를 만들 수 있다. 이렇게 하면 팀원들과 API 키 기반으로 공유할 수도 있다.
# 지속형 인스턴스 배포
deploy-sera --model allenai/SERA-32B
# 팀원들은 아래처럼 연결
SERA_API_KEY=<api_key> sera --endpoint <endpoint_url>
# 중지하려면
deploy-sera --stop🧑💻 6. 사용 예제
sera-cli를 실행하면 기본적으로 Claude Code가 SERA 모델과 연결된 인터페이스가 뜬다. 여기서 언어로 프롬프트를 입력하면, 해당 코드베이스에서 필요한 작업을 수행하도록 지시할 수 있다.
일반적인 사용 흐름:
- 로컬 코드베이스 디렉토리로 이동
sera --modal또는sera --endpoint ...실행- Claude Code에서 질문/명령 입력 예:
- “이 함수 리팩토링 해줘”
- “테스트 실패 원인을 분석해줘”
🧠 7. 왜 SERA CLI가 유용한가?
Ai2에서 발표한 SERA 모델은 많은 기존 오픈 소스 코딩 에이전트보다 훨씬 낮은 비용으로 강력한 성능을 낸다. 또한,
- 자체 코드 스타일과 규칙을 반영한 에이전트 훈련 가능
- Claude Code와 즉시 연동 가능
- CLI 기반이라 개발자 워크플로우에 녹아들기 쉬움
이러한 특성 덕분에, 개인 개발자는 물론 소규모 팀에서도 자신만의 AI 코딩 도우미를 쉽게 구축할 수 있다.
🧾 마무리
sera-cli는 Ai2의 오픈 코딩 에이전트 생태계에서 가장 쉽게 SERA 모델을 실행해볼 수 있는 입문 도구다.
설치 및 실행 방법도 단순해서 CLI 기반 개발자 워크플로우에 잘 들어맞는다.