AI Agent란?
2025. 10. 16. 10:20
AI Agent
스스로 환경을 인식하고 목표를 달성하기 위해 행동을 선택하는 시스템
Agent를 구성하는 주요 개념들
| 구성요소 | 역할 | 대표 기술/예시 | |
| 기본 | LLM | 언어 이해, 계획, 추론 | GPT-4, Claude, Gemini, Llama |
| 실행 | Tools (Function Calls) |
외부 API, RAG, DB 질의 등 실행 | OpenAI Function Calling, LangChain Tools |
| 표준화 | MCP (Model Context Protocol) |
표준 연결 인터페이스 여러 도구나 시스템을 LLM에 연결하는 공통 규격 |
OpenAI MCP, Vercel MCP, Anthropic MCP |
| 고도화 | Memory | 장기/단기 기억, 상태 유지 | LangGraph Memory, vector store |
| 지식 | RAG (Retrival-Augmented Generation) |
검색 기반 지식보강 도구 LLM이 모르는 정보를 벡터DB 등에서 검색 |
LlamaIndex, LangChain Retrieval |
| 확장 | Multimodal | 여러 입력 모달리티(텍스트 이미지, 음성, 영상) 지원 | GPT-4o, Gemini, Claude 3.5등 |
| 고도화 | Planning / Reasoning Loop | LLM이 도구를 순서대로 사용할 계획을 세움 | ReAct, Tree-of-Thoughts, AutoGPT |
| 프레임워크 | Framework / Agent Runtime | 위 모든 걸 자동 orchestration | LangChain, OpenAI Agents, CrewAI, LlamaIndex Agents |
Agent = LLM + (필요한 부가 구성 요소 조합)
AI Agent 유형
| 유형 | 역할 / 특징 | 필요한 구성요소 예시 |
| 대화형 (Chat Agent) | 단순 Q&A, 자연어 이해/응답 | LLM |
| 검색형 (RAG Agent) | 외부 정보 검색 + 답변 생성 | LLM + RAG Tool |
| 행동형 (Action / Tool Agent) | 도구 호출, 계산, API 사용 | LLM + Function Calls / Tools |
| 멀티스텝 플래너형 (Planner Agent) | 목표 달성을 위해 여러 단계 계획 | LLM + Planning Loop + Tools + Memory |
| 멀티모달형 (MultiModal Agent) | 텍스트, 이미지, 음성, 영상 입력/출력 | LLM(Multimodal) + Tools + Interface |
| 지속/상태 기반(Stateful Agent) | 기억, 세션 유지, 이전 대화 맥락 활용 | Memory + LLM + Tools |
| 자동화/자율형 (Autonomous Agent) | 목표 기반 반복 수행, 스스로 판단 | Planner + Memory + Tools + Multi step Loop |
'자연어 처리 > LLM' 카테고리의 다른 글
| LiteLLM vs Pydantic AI (0) | 2025.10.17 |
|---|