文章目录[+]
Agent算是最近几个月比较关注的点,但不少同学还是不明白具体是什么意思。这篇文章,我们来简单了解下。
定义:让 AI 以类似人的工作和思考方式,来完成一系列的任务
AI Agent 能做什么?
靠 LLM 思考、能使用工具、能召唤助手
本质:给出任务,能帮你搞定的,就是 Agent
P(感知)P(规划)A(行动)
举个例子,此刻你肚子饿了,想吃东西。
假如你回家说:妈,我饿了!那么妈妈会:(感知)听到你说的-(规划)计划做你爱吃的东西-(行动)做好吃的叫你吃饭。
假如你身在他乡,你肚子饿了,想点外卖,打开了饿了么app,那么饿了么会:(感知)你在app下单-(规划)餐厅接单,骑手接单-(行动)骑手将你的饭送到你手中。
每个AI Agent 都会包括大脑(LLM)、规划(Planning)、记忆(Memory)、工具使用(Tool use)
用大语言模型 (LLM) 作为大脑
一项复杂的任务需要涉及到许多步骤,Agent 需要知道这些步骤并提前规划:子目标分解、反思和完善。
对应人脑的记忆类型,可以用以下映射表述:
短期记忆包含所有上下文内容,受 Transformer 有限的上下文窗口长度的限制。
长期记忆作为 Agent 在查询时可以处理的外部存储数据库,可以通过快速检索进行访问。
AI Agent 可以调用外部 API,以获得模型权重中缺少的额外信息,包括当前信息、代码执行能力、专有信息源的访问。
每个bot都可能包括大脑(LLM)、规划(Planning)、记忆(Memory)、工具使用(Tool use)
- 是否需要一个 Agent 监控 当前的 Agent
- 为保证AI Agent 决策的透明性,系统可能需要向用户展示推理过程
- LLM的上下文限制,影响大体量任务的执行
- LLM 会出现格式与内容错误、甚至在一些时候也会表现出叛逆行为
作为AI 的新型应用模式 Agent,无论是作为我们的助力还是独立智能体,都将显著提高工作效率,激发创新活力。随着AI技术的发展,那些能够理解AI的潜力、制定有效策略并指导AI行动准则的人,确实将成为企业中非常宝贵的资产。同时,这也要求员工不断提升自己的技能,以适应这个快速变化的时代。
本文由 @wanee 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。