AI Agent란?

2025. 10. 16. 10:20

AI Agent

스스로 환경을 인식하고 목표를 달성하기 위해 행동을 선택하는 시스템

 

Agent를 구성하는 주요 개념들

  구성요소 역할 대표 기술/예시
기본 LLM 언어 이해, 계획, 추론 GPT-4, Claude, Gemini, Llama
실행 Tools
(Function Calls)
외부 API, RAG, DB 질의 등 실행 OpenAI Function Calling, LangChain Tools
표준화 MCP
(Model Context Protocol)
표준 연결 인터페이스
여러 도구나 시스템을 LLM에 연결하는 공통 규격
OpenAI MCP, Vercel MCP, Anthropic MCP
고도화 Memory 장기/단기 기억, 상태 유지 LangGraph Memory, vector store
지식 RAG
(Retrival-Augmented Generation)
검색 기반 지식보강 도구
LLM이 모르는 정보를 벡터DB 등에서 검색
LlamaIndex, LangChain Retrieval
확장 Multimodal 여러 입력 모달리티(텍스트 이미지, 음성, 영상) 지원 GPT-4o, Gemini, Claude 3.5등
고도화 Planning / Reasoning Loop LLM이 도구를 순서대로 사용할 계획을 세움 ReAct, Tree-of-Thoughts, AutoGPT
프레임워크 Framework / Agent Runtime 위 모든 걸 자동 orchestration LangChain, OpenAI Agents, CrewAI, LlamaIndex Agents

 

Agent = LLM + (필요한 부가 구성 요소 조합)

 

AI Agent 유형

유형 역할 / 특징 필요한 구성요소 예시
대화형 (Chat Agent) 단순 Q&A, 자연어 이해/응답 LLM
검색형 (RAG Agent) 외부 정보 검색 + 답변 생성 LLM + RAG Tool
행동형 (Action / Tool Agent) 도구 호출, 계산, API 사용 LLM + Function Calls / Tools
멀티스텝 플래너형 (Planner Agent) 목표 달성을 위해 여러 단계 계획 LLM + Planning Loop + Tools + Memory
멀티모달형 (MultiModal Agent) 텍스트, 이미지, 음성, 영상 입력/출력 LLM(Multimodal) + Tools + Interface
지속/상태 기반(Stateful Agent) 기억, 세션 유지, 이전 대화 맥락 활용 Memory + LLM + Tools
자동화/자율형 (Autonomous Agent) 목표 기반 반복 수행, 스스로 판단 Planner + Memory + Tools + Multi step Loop

'자연어 처리 > LLM' 카테고리의 다른 글

LiteLLM vs Pydantic AI  (0) 2025.10.17