AI Agent란?

AI Agent란?

2025. 10. 16. 10:20

AI Agent

스스로 환경을 인식하고 목표를 달성하기 위해 행동을 선택하는 시스템

Agent를 구성하는 주요 개념들

	구성요소	역할	대표 기술/예시
기본	LLM	언어 이해, 계획, 추론	GPT-4, Claude, Gemini, Llama
실행	Tools (Function Calls)	외부 API, RAG, DB 질의 등 실행	OpenAI Function Calling, LangChain Tools
표준화	MCP (Model Context Protocol)	표준 연결 인터페이스 여러 도구나 시스템을 LLM에 연결하는 공통 규격	OpenAI MCP, Vercel MCP, Anthropic MCP
고도화	Memory	장기/단기 기억, 상태 유지	LangGraph Memory, vector store
지식	RAG (Retrival-Augmented Generation)	검색 기반 지식보강 도구 LLM이 모르는 정보를 벡터DB 등에서 검색	LlamaIndex, LangChain Retrieval
확장	Multimodal	여러 입력 모달리티(텍스트 이미지, 음성, 영상) 지원	GPT-4o, Gemini, Claude 3.5등
고도화	Planning / Reasoning Loop	LLM이 도구를 순서대로 사용할 계획을 세움	ReAct, Tree-of-Thoughts, AutoGPT
프레임워크	Framework / Agent Runtime	위 모든 걸 자동 orchestration	LangChain, OpenAI Agents, CrewAI, LlamaIndex Agents

Agent = LLM + (필요한 부가 구성 요소 조합)

AI Agent 유형

유형	역할 / 특징	필요한 구성요소 예시
대화형 (Chat Agent)	단순 Q&A, 자연어 이해/응답	LLM
검색형 (RAG Agent)	외부 정보 검색 + 답변 생성	LLM + RAG Tool
행동형 (Action / Tool Agent)	도구 호출, 계산, API 사용	LLM + Function Calls / Tools
멀티스텝 플래너형 (Planner Agent)	목표 달성을 위해 여러 단계 계획	LLM + Planning Loop + Tools + Memory
멀티모달형 (MultiModal Agent)	텍스트, 이미지, 음성, 영상 입력/출력	LLM(Multimodal) + Tools + Interface
지속/상태 기반(Stateful Agent)	기억, 세션 유지, 이전 대화 맥락 활용	Memory + LLM + Tools
자동화/자율형 (Autonomous Agent)	목표 기반 반복 수행, 스스로 판단	Planner + Memory + Tools + Multi step Loop

'자연어 처리 > LLM' 카테고리의 다른 글

LiteLLM vs Pydantic AI (0)	2025.10.17

Powered by Tistory, Designed by wallel

티스토리툴바