AI Agents | Haruk1y Wiki

📄️AI Agents Overview

LLM を脳とする AI agent の構造、ReAct、tool use、planning、memory、multi-agent、coding / web agent の全体像を整理します。

ReAct、Reflexion、Plan-and-Execute、Tree-of-Thoughts、ReWOO の流れを整理します。

Function calling、JSON schema、Toolformer、MCP、tool execution loop を整理します。

Short-term memory、long-term memory、vector store、episodic / semantic memory、context engineering を整理します。

AutoGen、CrewAI、debate、role split、orchestrator-worker など multi-agent LLM system を整理します。

SWE-agent、Devin、Cursor、Codex 系など、コードを書く・修正する agent の流れを整理します。

Browser-Use、Operator、Claude Computer Use、WebArena など、画面・ブラウザ操作 agent を整理します。

LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、LlamaIndex Agent などの比較を整理します。

SWE-Bench、GAIA、AgentBench、WebArena、tau-bench など、agent benchmark と評価指標を整理します。

WebArena、SWE-bench、OSWorld、GAIA、AgentBench など agent benchmark の評価軸を整理します。

Tool-use agent の権限管理、approval gate、sandbox、不可逆操作の制御を整理します。