M1 AI Agent란 무엇인가?

LLM을 "그냥 대화 잘 하는 봇"으로만 쓰는 시대는 끝났습니다. 이 모듈에서는 AI Agent를 목표를 달성하기 위해 스스로 판단하고 도구를 사용하는 시스템으로 재정의하며, 나중에 여러분이 직접 배포할 서비스의 설계 기반을 다집니다.

ChatGPT와 Agent, 무엇이 다른가

ChatGPT는 훌륭한 단발 질의응답 기계입니다. 사용자가 프롬프트를 넣으면 텍스트가 나옵니다. 대화 히스토리를 유지해도 결국 "입력 → 출력" 한 번의 LLM 호출로 끝납니다.

Agent는 다릅니다. 아래 흐름처럼, 목표가 달성될 때까지 반복 루프를 돕니다.

[목표 입력]
    │
    ▼
┌─────────────────────────────┐
│  인지(Perceive)              │  ← 환경 상태, 사용자 의도 파악
│  의사결정(Decide)            │  ← 다음에 할 행동 선택
│  행동(Act)                   │  ← 도구 호출 (API, DB, 코드실행 …)
│  학습/갱신(Learn/Update)     │  ← 결과를 메모리에 반영
└─────────────────────────────┘
    │
    ▼
 목표 달성? → YES → 종료
           → NO  → 루프 반복

단순 챗봇은 이 루프가 없습니다. Agent는 루프가 있고, 루프 안에서 **도구(Tool)**를 씁니다.

Agent 정의 4요소

요소	설명	예시
인지(Perceive)	현재 상태·맥락을 읽는다	유저 메시지, 이전 대화, 웹 검색 결과
의사결정(Decide)	다음 행동을 고른다	"지금은 DB 조회가 필요하다"
행동(Act)	외부 세계에 영향을 준다	REST API 호출, 파일 저장, 이메일 발송
학습/갱신(Learn)	결과를 내부 상태에 반영한다	요약 메모리 업데이트, 벡터 인덱스 갱신

팁: 4요소 중 "학습"은 완전한 모델 파인튜닝을 뜻하지 않습니다. 이 강의에서는 Vercel Blob에 대화 요약을 KV처럼 저장하고 다음 세션에 읽어오는 경량 방식으로 구현합니다.

Agent 분류

Reactive Agent — 규칙 기반 즉각 반응. LLM 없이도 가능. 빠르지만 유연성 낮음.

Deliberative Agent — 목표·계획·실행 순서를 LLM이 스스로 결정. 유연하지만 레이턴시가 증가.

Hybrid Agent — 빠른 규칙 레이어 위에 LLM 플래너를 얹음. 실전에서 가장 많이 씁니다.

Multi-Agent — 여러 Agent가 협력하거나 경쟁. 한 Agent가 오케스트레이터 역할을 맡고 나머지를 서브루틴처럼 호출.

이 강의의 선택: 프레임워크(LangChain, AutoGen 등) 없이 명시적 라우트 dispatcher 패턴으로 구현합니다. 어떤 도구를 언제 호출할지 코드 레벨에서 직접 라우팅하므로, 내부 동작이 투명하고 디버깅이 쉽습니다.

좋은 Agent의 5가지 특성

자율성(Autonomy): 사람의 매 번 지시 없이 서브태스크를 스스로 분해하고 수행한다.
반응성(Reactivity): 환경 변화(API 오류, 예외 입력)에 즉각 적응한다.
목표지향성(Goal-Directedness): 단순 응답이 아니라 최종 목표 달성 여부를 기준으로 행동을 평가한다.
도구 사용(Tool Use): 계산, 검색, 파일 조작, 외부 API 등 LLM 단독으로 할 수 없는 작업을 도구로 위임한다.
메모리(Memory): 단기(대화 컨텍스트)와 장기(Blob 저장 요약) 메모리를 모두 활용해 연속성을 유지한다.

케이스: AI Master의 5개 도메인 에이전트

aicrmeet.com의 AI Master는 단일 서비스 안에 아래 다섯 도메인 Agent를 Hybrid + Multi-Agent 방식으로 운영합니다.

도메인	주요 도구	핵심 특성
CRM 상담	고객 DB 조회, 이메일(Resend)	반응성, 도구 사용
콘텐츠 생성	RAG(코사인 유사도), 보고서 조립	목표지향성, 메모리
음성 인터페이스	ElevenLabs Scribe v2(STT) + eleven_v3(TTS)	반응성, 자율성
데이터 분석	코드 실행, 차트 생성	도구 사용
보안 모니터링	Prompt Injection 4방어 레이어	반응성, 자율성

이 다섯 Agent가 서로 결과를 공유하며 하나의 일관된 서비스 경험을 만들어 냅니다. 이 강의 전체를 마치면 여러분은 이 구조를 본인 도메인으로 직접 배포하게 됩니다.

왜 지금 Agent인가

두 가지 변화가 동시에 일어났습니다.

LLM 비용 급락: Claude Haiku, GPT-4o-mini 등장으로 수천 번의 도구 호출 루프도 경제적으로 실현 가능해졌습니다.
도구 호출 정확도 상승: Function Calling / Tool Use API의 성숙으로 LLM이 "언제, 어떤 도구를, 어떤 파라미터로" 호출할지 훨씬 안정적으로 판단합니다.

이 두 조건이 맞물린 지금이, Agent를 학습하고 프로덕션에 올리기 가장 좋은 시점입니다.

핵심 정리

Agent = 인지 → 의사결정 → 행동 → 학습 루프를 갖는 시스템. 단발 LLM 호출과 근본적으로 다릅니다.
Agent 분류는 Reactive / Deliberative / Hybrid / Multi-Agent이며, 이 강의는 Hybrid + 명시적 dispatcher 패턴을 사용합니다.
좋은 Agent는 자율성·반응성·목표지향성·도구사용·메모리 5특성을 갖추며, 단순 챗봇은 이 중 대부분이 빠져 있습니다.
AI Master처럼 여러 도메인 Agent가 협력하면 단일 서비스로 복잡한 워크플로를 자동화할 수 있습니다.
LLM 비용 하락과 Tool Use 정확도 상승이 맞물려, 지금이 Agent를 실전에 배포하기 최적의 시점입니다.
이 강의 전반에서 RAG는 외부 vector DB 없이 코사인 유사도 직접 구현, 저장은 Vercel Blob, LLM 호출은 callLLM() 추상화를 일관되게 사용합니다.