2025–2026 로컬 실행 가능한 AI 에이전트 비교

클라우드 AI 전성시대지만 프라이버시·비용·지연시간 문제로 로컬 실행을 선택하는 사람이 늘고 있습니다. 내 기기나 자체 서버에서 실행 가능한 AI 에이전트 7종을 골라 비교했습니다.

기준: 2026년 6월. 완전 로컬 또는 자가호스팅이 가능한 제품만 포함. 공식 사이트·저장소·공개 문서 기반.


왜 로컬인가?

  • 프라이버시: 대화·파일·화면이 외부 서버로 전송되지 않음
  • 비용: 로컬 모델 사용 시 API 과금 없음
  • 오프라인: 인터넷 없이도 동작
  • 커스터마이징: 시스템 프롬프트·모델·도구를 완전히 제어

카테고리 분류

카테고리 제품 포지션
범용 자율 에이전트 Hermes Agent, Open Interpreter, AutoGPT 자율 실행·자기 개선
AI 코딩 에이전트 Cline, aider, Pi 코드베이스 이해·로컬 LLM
개인 메모리·라이프로그 Rewind AI 완전 로컬 타임라인
스마트홈 특화 Home Assistant AI 3,000+ 디바이스 제어

제품별 프로파일

범용 자율 에이전트

Hermes Agent (Nous Research)

2026년 2월 출시 후 4개월 만에 GitHub 스타 188K+를 달성한 자기 개선형 오픈소스 에이전트. 어려운 작업을 해결할 때마다 재사용 가능한 스킬 문서를 자동으로 작성해 점점 더 잘 처리합니다. 2026년 5월 기준 OpenRouter 최다 사용 에이전트.

  • 메모리: MEMORY.md + USER.md 고정 주입 + SQLite FTS5 전체 대화 저장. 세션 간 컨텍스트 완전 유지
  • 로컬 모델: Ollama, llama.cpp, LM Studio 등 모든 OpenAI 호환 엔드포인트 지원
  • 도구: 웹 검색, Playwright 브라우저 자동화, 코드 실행, 이미지 생성, TTS, 비전 분석 등 40+
  • 플랫폼: Telegram, Discord, Slack, WhatsApp, Signal, iMessage, Email 등 20+ 단일 에이전트
  • 실행 백엔드: 로컬, Docker, SSH, Modal, Daytona
  • 자연어 스케줄러: “매일 오전 9시에 뉴스 요약” 같은 명령으로 크론 등록
  • 과금: 완전 무료 (MIT) — 호스팅 $4~25/월 + LLM API or 로컬 모델

Open Interpreter

로컬 OS에서 코드·파일·브라우저를 직접 제어하는 에이전트. Rust 재작성으로 속도 개선. MCP + Agent Client Protocol 지원. DeepSeek·Kimi 등 저비용 로컬 모델 최적화 (64.1k ⭐).

  • 메모리: 세션 내 컨텍스트 (영구 메모리 없음)
  • 로컬 모델: Ollama, LM Studio, llama.cpp 완전 지원
  • 도구: OS 네이티브 코드 실행 (Python·Shell·JS), 파일 조작, 브라우저
  • 과금: 완전 무료 (로컬 모델 사용 시 API 비용 0)

AutoGPT

블록 연결 방식 시각적 에이전트 빌더. 에이전트 마켓플레이스에서 사전 구성 에이전트 설치. 셀프호스팅 가능 (185k ⭐). Docker Compose 한 줄로 로컬 배포.

  • 메모리: 벡터 DB (로컬 ChromaDB 또는 Pinecone)
  • 로컬 모델: Ollama 통합 지원
  • 도구: API 연동, 웹 검색, 파일, 코드 실행
  • 과금: 완전 무료 (셀프호스팅 시)

AI 코딩 에이전트

Cline

VS Code/JetBrains 오픈소스 AI 에이전트 (63.6k ⭐). .clinerules로 팀 코딩 표준 강제. 코디네이터-스페셜리스트 멀티에이전트 팀 구성. 8M+ 설치.

  • 메모리: .clinerules 규칙 파일 (영구), 세션 내 컨텍스트
  • 로컬 모델: Ollama, LM Studio, 모든 OpenAI 호환 엔드포인트. 완전 오프라인 동작 가능
  • 도구: Git, 터미널, MCP 서버, 파일 시스템 전체
  • 과금: 완전 무료 (로컬 모델 사용 시 0원)

Pi (pi.dev)

2026년 AI 코딩 에이전트 순위에서 Claude Code·Codex·Cursor와 나란히 비교되는 최소주의 터미널 에이전트. “도구에 맞춰 워크플로를 바꾸는 것이 아니라, 도구를 워크플로에 맞게 커스터마이징한다”는 철학. 필요한 시점에만 컨텍스트를 주입하는 lazy-loading 스킬 시스템으로 토큰 소모를 최소화합니다.

  • 메모리: 트리 구조 세션 히스토리 (브랜치·내보내기), AGENTS.md / SYSTEM.md 프로젝트 지시
  • 로컬 모델: Ollama 포함 15+ LLM 프로바이더, 세션 중 모델 전환 가능
  • 도구: TypeScript 확장으로 커스텀 명령·도구·워크플로 추가
  • 운영 모드: 대화형 TUI / JSON 출력 / RPC / SDK — 4가지
  • 컨텍스트 관리: 오래된 메시지 자동 요약 (built-in compaction)
  • 과금: 완전 무료 (MIT)

aider

터미널 기반 AI 페어 프로그래밍. Git 레포지토리에 자연스럽게 통합 — 변경 단위로 자동 커밋. 전체 코드베이스 구조 맵 자동 생성.

  • 메모리: Git 히스토리가 실질적 컨텍스트, 코드베이스 맵 자동 생성
  • 로컬 모델: Ollama 완전 지원. --model ollama/llama3 한 줄로 전환
  • 도구: Git, lint/test 자동 실행, 음성→코드 변환
  • 과금: 완전 무료 (로컬 모델 사용 시 0원)

개인 메모리·라이프로그

Rewind AI

macOS에서 화면·음성을 100% 로컬 암호화 저장해 “모든 것을 기억”. “지난주 미팅에서 뭘 얘기했지?”를 자연어로 검색. 클라우드에 전송되는 데이터 없음.

  • 메모리: 완전 로컬 타임라인 인덱스 — 시간순 + 앱별 + 시맨틱 검색
  • 로컬 모델: 온디바이스 처리 (Apple Silicon 최적화)
  • 도구: 모든 Mac 앱 화면 캡처, 음성 녹음, 회의 요약
  • 과금: $19/월

스마트홈 특화

Home Assistant AI

스마트홈 3,000+ 디바이스 통합. 완전 로컬 실행(Ollama/Llama 지원). 음성 명령으로 조명·온도·보안 직접 제어.

  • 메모리: 스마트홈 상태 DB, 자동화 룰
  • 로컬 모델: Ollama + Llama 3 로컬 실행. 완전 오프라인 음성 명령 가능
  • 도구: 3,000+ 디바이스, 자동화 스크립트, 음성 파이프라인
  • 과금: 완전 무료 (하드웨어 비용 별도)

기능 비교 매트릭스

제품 영구 메모리 완전 로컬 로컬 LLM 코드 실행 스케줄·알림 GitHub ⭐
Hermes Agent 세션 간 유지 터미널·Docker 자연어 크론 188K
Open Interpreter OS 네이티브 64K
AutoGPT 벡터 DB 코드 실행 185K
Cline .clinerules 터미널 63K
Pi 트리 세션 히스토리 터미널
aider 코드베이스 맵 lint/test ~30K
Rewind AI 타임라인 전체 ✓ (온디바이스)
Home Assistant 스마트홈 DB 자동화 룰 자동화 룰 73K

로컬 LLM 추천 조합

각 에이전트에 붙일 수 있는 로컬 모델 추천입니다 (Ollama 기준).

용도 모델 최소 VRAM 비고
일반 대화·작업 Llama 3.3 70B 40GB 최고 품질
8GB VRAM Llama 3.2 3B / Qwen2.5 7B 8GB 경량
코딩 DeepSeek-Coder-V2 16GB 코드 특화
한국어 EXAONE 3.5 32B 20GB LG AI Research
균형 Mistral Small 24B 16GB 속도·품질 균형

선택 가이드

  • 터미널·Git 중심 개발: aider — 가장 가볍고 Git 통합이 자연스러움
  • 커스텀 워크플로 + 토큰 절약: Pi — lazy-loading 스킬, 세션 브랜치, 모델 실시간 전환
  • IDE에서 대규모 리팩터: Cline — VS Code 안에서 멀티에이전트 팀 구성
  • 장기 기억이 필요한 개인 비서: Hermes Agent — 세션 간 메모리 + 20+ 메시징 플랫폼
  • OS 레벨 자동화: Open Interpreter — 파일·브라우저·쉘 직접 제어
  • “나는 뭘 했지?” 검색: Rewind AI (Mac 전용) — 화면·음성 로컬 아카이브
  • 스마트홈: Home Assistant AI — 디바이스 통합 + 음성 완전 오프라인
  • GUI로 에이전트 빌더: AutoGPT — 비기술 사용자도 블록 조립으로 구성

나의 조합

코딩은 aider + Qwen2.5-Coder-32B(로컬), 일상 대화·스케줄은 Hermes Agent + Claude API, Mac 회의 요약은 Rewind AI. 세 개를 목적별로 분리해서 사용합니다.


이 글은 개인 조사 목적으로 작성됐으며, 각 제품의 기능은 업데이트에 따라 변경될 수 있습니다.

Written by

Atin Jin