클라우드 AI 전성시대지만 프라이버시·비용·지연시간 문제로 로컬 실행을 선택하는 사람이 늘고 있습니다. 내 기기나 자체 서버에서 실행 가능한 AI 에이전트 7종을 골라 비교했습니다.
기준: 2026년 6월. 완전 로컬 또는 자가호스팅이 가능한 제품만 포함. 공식 사이트·저장소·공개 문서 기반.
왜 로컬인가?
- 프라이버시: 대화·파일·화면이 외부 서버로 전송되지 않음
- 비용: 로컬 모델 사용 시 API 과금 없음
- 오프라인: 인터넷 없이도 동작
- 커스터마이징: 시스템 프롬프트·모델·도구를 완전히 제어
카테고리 분류
| 카테고리 | 제품 | 포지션 |
|---|---|---|
| 범용 자율 에이전트 | Hermes Agent, Open Interpreter, AutoGPT | 자율 실행·자기 개선 |
| AI 코딩 에이전트 | Cline, aider, Pi | 코드베이스 이해·로컬 LLM |
| 개인 메모리·라이프로그 | Rewind AI | 완전 로컬 타임라인 |
| 스마트홈 특화 | Home Assistant AI | 3,000+ 디바이스 제어 |
제품별 프로파일
범용 자율 에이전트
Hermes Agent (Nous Research)
2026년 2월 출시 후 4개월 만에 GitHub 스타 188K+를 달성한 자기 개선형 오픈소스 에이전트. 어려운 작업을 해결할 때마다 재사용 가능한 스킬 문서를 자동으로 작성해 점점 더 잘 처리합니다. 2026년 5월 기준 OpenRouter 최다 사용 에이전트.
- 메모리: MEMORY.md + USER.md 고정 주입 + SQLite FTS5 전체 대화 저장. 세션 간 컨텍스트 완전 유지
- 로컬 모델: Ollama, llama.cpp, LM Studio 등 모든 OpenAI 호환 엔드포인트 지원
- 도구: 웹 검색, Playwright 브라우저 자동화, 코드 실행, 이미지 생성, TTS, 비전 분석 등 40+
- 플랫폼: Telegram, Discord, Slack, WhatsApp, Signal, iMessage, Email 등 20+ 단일 에이전트
- 실행 백엔드: 로컬, Docker, SSH, Modal, Daytona
- 자연어 스케줄러: “매일 오전 9시에 뉴스 요약” 같은 명령으로 크론 등록
- 과금: 완전 무료 (MIT) — 호스팅 $4~25/월 + LLM API or 로컬 모델
Open Interpreter
로컬 OS에서 코드·파일·브라우저를 직접 제어하는 에이전트. Rust 재작성으로 속도 개선. MCP + Agent Client Protocol 지원. DeepSeek·Kimi 등 저비용 로컬 모델 최적화 (64.1k ⭐).
- 메모리: 세션 내 컨텍스트 (영구 메모리 없음)
- 로컬 모델: Ollama, LM Studio, llama.cpp 완전 지원
- 도구: OS 네이티브 코드 실행 (Python·Shell·JS), 파일 조작, 브라우저
- 과금: 완전 무료 (로컬 모델 사용 시 API 비용 0)
AutoGPT
블록 연결 방식 시각적 에이전트 빌더. 에이전트 마켓플레이스에서 사전 구성 에이전트 설치. 셀프호스팅 가능 (185k ⭐). Docker Compose 한 줄로 로컬 배포.
- 메모리: 벡터 DB (로컬 ChromaDB 또는 Pinecone)
- 로컬 모델: Ollama 통합 지원
- 도구: API 연동, 웹 검색, 파일, 코드 실행
- 과금: 완전 무료 (셀프호스팅 시)
AI 코딩 에이전트
Cline
VS Code/JetBrains 오픈소스 AI 에이전트 (63.6k ⭐). .clinerules로 팀 코딩 표준 강제. 코디네이터-스페셜리스트 멀티에이전트 팀 구성. 8M+ 설치.
- 메모리:
.clinerules규칙 파일 (영구), 세션 내 컨텍스트 - 로컬 모델: Ollama, LM Studio, 모든 OpenAI 호환 엔드포인트. 완전 오프라인 동작 가능
- 도구: Git, 터미널, MCP 서버, 파일 시스템 전체
- 과금: 완전 무료 (로컬 모델 사용 시 0원)
Pi (pi.dev)
2026년 AI 코딩 에이전트 순위에서 Claude Code·Codex·Cursor와 나란히 비교되는 최소주의 터미널 에이전트. “도구에 맞춰 워크플로를 바꾸는 것이 아니라, 도구를 워크플로에 맞게 커스터마이징한다”는 철학. 필요한 시점에만 컨텍스트를 주입하는 lazy-loading 스킬 시스템으로 토큰 소모를 최소화합니다.
- 메모리: 트리 구조 세션 히스토리 (브랜치·내보내기), AGENTS.md / SYSTEM.md 프로젝트 지시
- 로컬 모델: Ollama 포함 15+ LLM 프로바이더, 세션 중 모델 전환 가능
- 도구: TypeScript 확장으로 커스텀 명령·도구·워크플로 추가
- 운영 모드: 대화형 TUI / JSON 출력 / RPC / SDK — 4가지
- 컨텍스트 관리: 오래된 메시지 자동 요약 (built-in compaction)
- 과금: 완전 무료 (MIT)
aider
터미널 기반 AI 페어 프로그래밍. Git 레포지토리에 자연스럽게 통합 — 변경 단위로 자동 커밋. 전체 코드베이스 구조 맵 자동 생성.
- 메모리: Git 히스토리가 실질적 컨텍스트, 코드베이스 맵 자동 생성
- 로컬 모델: Ollama 완전 지원.
--model ollama/llama3한 줄로 전환 - 도구: Git, lint/test 자동 실행, 음성→코드 변환
- 과금: 완전 무료 (로컬 모델 사용 시 0원)
개인 메모리·라이프로그
Rewind AI
macOS에서 화면·음성을 100% 로컬 암호화 저장해 “모든 것을 기억”. “지난주 미팅에서 뭘 얘기했지?”를 자연어로 검색. 클라우드에 전송되는 데이터 없음.
- 메모리: 완전 로컬 타임라인 인덱스 — 시간순 + 앱별 + 시맨틱 검색
- 로컬 모델: 온디바이스 처리 (Apple Silicon 최적화)
- 도구: 모든 Mac 앱 화면 캡처, 음성 녹음, 회의 요약
- 과금: $19/월
스마트홈 특화
Home Assistant AI
스마트홈 3,000+ 디바이스 통합. 완전 로컬 실행(Ollama/Llama 지원). 음성 명령으로 조명·온도·보안 직접 제어.
- 메모리: 스마트홈 상태 DB, 자동화 룰
- 로컬 모델: Ollama + Llama 3 로컬 실행. 완전 오프라인 음성 명령 가능
- 도구: 3,000+ 디바이스, 자동화 스크립트, 음성 파이프라인
- 과금: 완전 무료 (하드웨어 비용 별도)
기능 비교 매트릭스
| 제품 | 영구 메모리 | 완전 로컬 | 로컬 LLM | 코드 실행 | 스케줄·알림 | GitHub ⭐ |
|---|---|---|---|---|---|---|
| Hermes Agent | 세션 간 유지 | ✓ | ✓ | 터미널·Docker | 자연어 크론 | 188K |
| Open Interpreter | ✗ | ✓ | ✓ | OS 네이티브 | ✗ | 64K |
| AutoGPT | 벡터 DB | ✓ | ✓ | 코드 실행 | ✗ | 185K |
| Cline | .clinerules |
✓ | ✓ | 터미널 | ✗ | 63K |
| Pi | 트리 세션 히스토리 | ✓ | ✓ | 터미널 | ✗ | — |
| aider | 코드베이스 맵 | ✓ | ✓ | lint/test | ✗ | ~30K |
| Rewind AI | 타임라인 전체 | ✓ | ✓ (온디바이스) | ✗ | ✗ | — |
| Home Assistant | 스마트홈 DB | ✓ | ✓ | 자동화 룰 | 자동화 룰 | 73K |
로컬 LLM 추천 조합
각 에이전트에 붙일 수 있는 로컬 모델 추천입니다 (Ollama 기준).
| 용도 | 모델 | 최소 VRAM | 비고 |
|---|---|---|---|
| 일반 대화·작업 | Llama 3.3 70B | 40GB | 최고 품질 |
| 8GB VRAM | Llama 3.2 3B / Qwen2.5 7B | 8GB | 경량 |
| 코딩 | DeepSeek-Coder-V2 | 16GB | 코드 특화 |
| 한국어 | EXAONE 3.5 32B | 20GB | LG AI Research |
| 균형 | Mistral Small 24B | 16GB | 속도·품질 균형 |
선택 가이드
- 터미널·Git 중심 개발:
aider— 가장 가볍고 Git 통합이 자연스러움 - 커스텀 워크플로 + 토큰 절약:
Pi— lazy-loading 스킬, 세션 브랜치, 모델 실시간 전환 - IDE에서 대규모 리팩터:
Cline— VS Code 안에서 멀티에이전트 팀 구성 - 장기 기억이 필요한 개인 비서:
Hermes Agent— 세션 간 메모리 + 20+ 메시징 플랫폼 - OS 레벨 자동화:
Open Interpreter— 파일·브라우저·쉘 직접 제어 - “나는 뭘 했지?” 검색:
Rewind AI(Mac 전용) — 화면·음성 로컬 아카이브 - 스마트홈:
Home Assistant AI— 디바이스 통합 + 음성 완전 오프라인 - GUI로 에이전트 빌더:
AutoGPT— 비기술 사용자도 블록 조립으로 구성
나의 조합
코딩은 aider + Qwen2.5-Coder-32B(로컬), 일상 대화·스케줄은 Hermes Agent + Claude API, Mac 회의 요약은 Rewind AI. 세 개를 목적별로 분리해서 사용합니다.
이 글은 개인 조사 목적으로 작성됐으며, 각 제품의 기능은 업데이트에 따라 변경될 수 있습니다.