GrowPIP
← 返回所有概念

NODE

AI Agent

[NODE] AI Agent

  • 类型: 概念
  • 定义: 能够自主感知环境、做出决策并执行动作的人工智能系统

关系

关系目标说明
requiresLLM大语言模型作为推理核心
requiresNLP自然语言理解与生成
enablesPhysical AGI在物理世界中的应用
part_ofAGI通用人工智能的关键组件
implemented_byLangChain主流开发框架
enhanced_byMemory 系统上下文记忆增强(记住)
enhanced_by策略网络 + RL自学习优化(学会)
usesReAct 范式推理+行动循环
requires终身学习持续进化能力
constrained_by人机分工原则人负责元认知,AI 负责信息处理
explained_byINFO-113/114AI 智能本质:关联计算 + 涌现三层

核心范式:ReAct

循环:Thought(思考)→ Act(行动)→ Observation(观察)→ ...
组件作用
Thought决定下一步该做什么
Act执行动作(工具调用)
Observation环境反馈结果

ReAct vs CoT

范式能力边界
CoT模型内部知识 × 推理能力
ReAct(内部知识 + 外部工具) × 推理能力

能力增强路径

基础 Agent (LLM + Tools)
    ↓ + Memory 系统
记忆型 Agent (能记住用户/上下文)
    ↓ + 策略网络 + RL
自学习 Agent (能从交互中优化)
    ↓ + 终身学习
进化型 Agent (能持续学习不遗忘)
增强层作用方案
Memory让 Agent 记住三维记忆系统 (INFO-057)
自学习让 Agent 学会ReAct + PPO (INFO-009)
终身学习让 Agent 进化记忆重放 + 适配器 (INFO-077)

工程实现:Agentic Loop

while True:
    context = gather_context()      # 收集上下文
    response = llm.think(context)   # LLM 推理
    if response.is_done():
        break
    result = execute(response.action)  # 执行动作
    context.add(result)             # 更新上下文

(参考 INFO-061 Claude Code 架构)

三维记忆系统

记忆类型功能终身学习对应
语义记忆世界知识预训练知识
情景记忆交互历史核心集/记忆重放
程序记忆技能/流程适配器/专家模块

关键人物

人物贡献领域
Sherwin WuOpenAI Agent API
Jim FanPhysical AGI / 机器人
Lilian WengAgent 安全
Oriol Vinyals复杂任务 Agent

理论基础

领域代表人物
深度学习Jürgen Schmidhuber
NLPChristopher Manning
可泛化 AIFrançois Chollet
AGIDemis Hassabis

人类 EA 工作法的启发

来源:[[INFO-20251225-097]] 虚拟EA工作法

人类顶级 EA 的工作方式,对 AI Agent 设计有直接参考价值:

核心原则:先建模,再接管

人类 EAAI Agent 启发
不急于"替你做",先理解客户Onboarding 阶段收集用户偏好
2-3 周持续观察决策方式渐进式建立用户模型
审计邮箱现状形成假设先观察用户行为再优化

Onboarding 建模提问(可迁移)

  • 典型的工作流程是什么?
  • 什么时候处理、多久处理一次?
  • 哪里顺、哪里不顺?
  • 需要代执行,还是先草稿确认?

根据用户类型调整节奏

用户类型EA 策略Agent 策略
低频型提前整理,给 daily brief批量汇总,定时推送
高频型协作信号系统,约定边界实时同步,明确标记状态

沟通机制设计

类型渠道Agent 实现
紧急短信息提醒推送通知,只限紧急
日常End-of-day summary日终报告:做了什么/推进了什么/待处理
同步Daily Sync 文档共享状态面板

质量评估标准

用户"更安静、更自由",就是做对了。

  • 噪音是否减少
  • 用户是否有更多时间
  • 是否开始承担"前置思考"(带备选方案而非只抛问题)

关联条目

INFO

  • INFO-20251225-097:虚拟EA工作法(人类助手的最佳实践)
  • INFO-20251219-001:AI Agent 领域 X 关注列表
  • INFO-20251219-003:Memory 系统技术方案
  • INFO-20251219-009:自学习 Agent 技术方案
  • INFO-20251219-057:AI Coding 三维记忆系统
  • INFO-20251219-061:Claude Code Agentic Loop
  • INFO-20251219-075:ReAct vs CoT 范式对比
  • INFO-20251219-077:终身学习技术路径(稳定性-可塑性平衡)
  • INFO-20251219-082:OpenSpec 框架(Agent 行为 Spec 化)
  • INFO-20260114-113:AI 智能本质(关联计算引擎)
  • INFO-20260114-114:智能涌现三层模型(AI 能力如何产生)
  • INFO-20260114-115:AI 前沿研究综述(学术验证)
  • INFO-20260115-117:用户认知图谱(Agent 的上层应用——从记住到理解心智)

RULE

  • RULE-人机分工原则:人负责元认知层,AI 负责信息处理层

NODE

  • NODE-终身学习:Agent 的持续进化能力
  • NODE-元认知:人类元认知 vs AI 信息处理的对比