AI Agents Overview
LLM を脳とする AI agent の構造、ReAct、tool use、planning、memory、multi-agent、coding / web agent の全体像を整理します。
ReAct and Reasoning Agents
ReAct、Reflexion、Plan-and-Execute、Tree-of-Thoughts、ReWOO の流れを整理します。
Tool Use and Function Calling
Function calling、JSON schema、Toolformer、MCP、tool execution loop を整理します。
Agent Memory
Short-term memory、long-term memory、vector store、episodic / semantic memory、context engineering を整理します。
Multi-Agent Systems
AutoGen、CrewAI、debate、role split、orchestrator-worker など multi-agent LLM system を整理します。
Coding Agents
SWE-agent、Devin、Cursor、Codex 系など、コードを書く・修正する agent の流れを整理します。
Web and Computer-Use Agents
Browser-Use、Operator、Claude Computer Use、WebArena など、画面・ブラウザ操作 agent を整理します。
Agent Frameworks
LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、LlamaIndex Agent などの比較を整理します。
Agent Evaluation
SWE-Bench、GAIA、AgentBench、WebArena、tau-bench など、agent benchmark と評価指標を整理します。
Agent Benchmarks
WebArena、SWE-bench、OSWorld、GAIA、AgentBench など agent benchmark の評価軸を整理します。
Agent Safety and Sandboxing
Tool-use agent の権限管理、approval gate、sandbox、不可逆操作の制御を整理します。