深圳市官方网站苏州网络公司建网站

张小明 2025/12/29 16:18:43
深圳市官方网站,苏州网络公司建网站,庆阳网红刘斌,纪检监察门户网站建设论证报告这篇文章源于我近半年关于Agent#xff08;去除敏感信息#xff09;的生产实践#xff0c;也源于近一年和各个团队关于Agent的一些交流#xff0c;包括我对类Manus项目的一些困惑。 就当前来说#xff0c;存在两个截然相反的声音#xff1a;Agent就是未来#xff0c;其…这篇文章源于我近半年关于Agent去除敏感信息的生产实践也源于近一年和各个团队关于Agent的一些交流包括我对类Manus项目的一些困惑。就当前来说存在两个截然相反的声音Agent就是未来其他技术都过时了 VS AgentManus没有用不解决实际问题。以下几乎是原话摘录Agent支持派AI开发变化太快了上半年的经验在下半年已经不适用了去年Dify、n8n牛逼哄哄的今年agent模型流行后新开发的项目都是agent自主规划了已经没人考虑Dify、n8n这种落后的思路了事实就是新的Agent比旧的工作流效果好太多了…Agent反对派Manus自始至今从产品角度而言思路是完全失败的。它没有专业数据、没有专属工具链、没有行业认证、没有与业务深度绑定的集成也没有与高价值业务场景的绑定也就是任何人都能做。所以它更偏向工程能力的延伸而不是在构建场景护城河用户会发现当他们遇到真正复杂的问题时这个通用 Agent 还是帮不上忙最终不得不转向专业的垂直产品或人工服务导致用户留存率不高…总结下来就一句话有人觉得Agent已经无所不能代表当前先进生产力了、也有人认为Agent撒也不是谁都能做毫无壁垒费Token还不解决实际问题。怎么说呢过于悲观和过于乐观的认知都是错误的他直接导致的结果就是各个公司乱投入或者不投入而我这边近3年全部在做AI相关工作前前后后接触了40多家公司做了25个AI项目花钱多的过2亿、花钱少的不到10万在Agent这块有些个人心得我们今天就来系统性的探讨下Agent这东西到底先进到哪以及他到底能不能解决实际问题一、为什么25年是Agent元年首先Agent的核心是外部工具调用而非严格意义来说Function Calling 是Agent架构的基石因为有了他才有正经的Tools调用。虽然在官方提出这Function Calling之前也能够自己训练模型或者让模型输出类似的格式去模拟Function Calling但这毕竟不是正道因为换个模型也许就不好用了。当前最经典的Agent框架是ReAct他大约是在2022年提出论文《ReAct: Synergizing Reasoning and Acting in Language Models》其中就有伪FC的实现。最后到23年6月OpenAI的更新正式提出了Function Calling将他作为ChatGPT 产品的正式能力后续逐渐成为事实上的标准各个基座模型都有对应实现有了这个基础后Agent的出现就变得更加顺滑了。国内概念的火热从年初的Manus开始但如果真要追溯早期、又出圈的Agent的话可以是2023年3月的开源项目Auto-GPT只不过就算今年的Manus在早期因为基座能力不足都表现不佳遑论更早期的Auto-GPT了呢从Manus发布后2025 AI应用元年逐渐转移成2025 AI Agent元年模型也取得了长足的发展包括整体的推理能力、上下文长度得到了极大的加强而且我相信各个基座模型一定在工具调用这块做了大量微调训练其直接的结果是下半年的工具调用能力有明显的加强。虽然模型的稳定性调用能力有不小的加强但在工具多了后依旧会有找不到、乱调用的问题。于是Claude开始收集了大量Tools调优经验在25年10月正式提出了Skills技术可以认为他是在对整体Function Calling进行补足当然Skills除了提升工具识别能力之外还做了很多其他工作。现阶段使用Skills Function Calling 上下文工程已经可以将准确率做得很不错了比如我们就能折腾到90%这在之前是很难的。以上是我从技术层面看到的近三年Agent发展的情况也就是说在今年之前想要做出个好的Agent几乎不可能在今年下半年开始整体难度会小非常多最后这里的结论就是之前对于Agent的很多质疑乃至产品体验差的问题在2026年应该会得到很大的缓解。所以要说Agent直接依赖于模型能力的变迁这句话还真的没问题你怎么优化都可能比不上模型一次能力升级。接下来我们再来说其核心编排层这个可以解释为什么Agent会越来越强二、规划框架思考-行动-观察很多同学知道Agent的工作模式一直在模仿人但多数同学对ReAct这个词并不熟也不能理解思考-行动-观察这套循环到底有什么作用毕竟多聊一轮响应速度就会慢很多还会多花不少冤枉钱耗Token关于为什么要有这么多循环我认为主要是模型能力不足所致需要多轮调优才能最终做出合理的规划。他就像一个需要调教的学生下面这个案例可以很好说明循环调教对于模型做出合理规划的意义六顶思考帽是一种经典的“平行思维”框架旨在将混乱的思考过程结构化。其核心是赋予思考者六种不同的角色“帽子”白帽客观中立只关注事实与数据。红帽感性直觉表达情绪与预感。黑帽谨慎批判专注风险与缺陷。黄帽积极乐观看到价值与机会。绿帽创新创造探索新想法与可能性。蓝帽统筹控制管理思考流程与总结。其威力在于强制切换视角避免人们被单一立场比如一味批判或盲目乐观所困从而实现对问题的全方位审视。举个具体的案例要不要在公司上马一个Agent项目跑一轮六顶思考帽大致会变成这样一套 ReAct 循环白帽我到底知道哪些事实现在公司有什么基础预算多少有哪些现成数据和系统黑帽最坏的情况是什么可能踩哪些坑哪些部门一定会强烈反对黄帽如果成功了最大的收益是什么对业务、对团队能力有哪些放大绿帽在现有资源约束下有没有一些性价比更高的落地路线比如先从一个小流程改造而不是一上来做全栈Agent平台。蓝帽把前面所有视角收束成一个可执行的行动计划先做什么怎么拆阶段怎么验证失败后怎么止损蓝猫开始收尾做输出了。这一整套六顶思考帽跑下来模型在不断地对自己刚刚的想法进行追问、纠偏和补充这就是典型的模型自问自答这有三个好处第一强行补全视角第二把想清楚从一次性梭哈变成逐步逼近最终让规划从黑盒直觉变成可复盘的过程。六顶思考帽这种玩法就是设计了一套学生自己跟自己对话的训练框架以达到对模型调教的目的从 Agent 的角度看这就是把思考-行动-观察这条 ReAct 循环进一步做了角色化化的实现。这一套的结果是模型的规划能力不是凭空长出来的而是在一次次自问自答中长出来的。并且随着模型能力的进一步加强其生成的解法会更加完善所以从框架层面来说Agent架构确实会越来越好只不过费Token暂时没法避免。在了解Agent进化史后我们再看看最经典的旅游案例三、Tools排列组合首先大家要理解模型本身是没有思考能力的他的每次回答都是一次千锤百炼的文本统计模仿比如DeepSeek是没有办法识别Claude Code 10月发布的Skills技术的这东西在他的基础数据里没有对于模型没有的东西他一定会胡编乱造这个可以从论文《OpenAIWhy Language Models Hallucinate》看出来。为了解决这个问题模型就一定要引入外部工具调用的能力Function Calling、MCP等出现后模型就开始从问答机器人逐渐往解决具体问题的Agent做进化了。而这也是很多人认为Agent是先进技术、先进生产力的原因严格来说他对工具利用的效率会更高在之前我们解决问题的方式是Workflow AI模型会在流程中某个节点上贡献自己的一己之力。Workflow虽然稳定、效率也高但Workflow不得不面对一个问题总会有20%的场景是他无法满足的而这种长尾问题很严重也许10个Workflow可以解决80%的问题但如果想要把80%提升到85%可能需要100个Workflow提升到90%可能需要1000个…于是这里核心矛盾也就出现了Workflow无法满足用户无穷的需求并且约到后面成本越高那么该怎么办呢答案是用有限的工具去约束用户无穷的意图能这样做的原因是模型基本能力已经很强了**ReAct思考-行动-观察**架构能很好的多数时候能实现规划工作另外由于互联网这些年的发展很多工具已经很成熟了常用的如搜索引擎、地图服务、文件处理等都非常标准不太标准的如订票、支付、抖音APP操作等非要做也可以用RPA技术过渡垂直平台如携程早晚会开放接口更进一步当前Computer-Use、Browser-Use乃至手机操作等更平台型的技术都在使劲突破当然最厉害的大杀器还是AI Coding理论上这家伙能够把所有的工具生成出来实际肯定做不到所以模型规划 Tools排列组合理论上是可以解决20%的问题的就算不能解决但他也会大大降低将80%变为90%的成本。这里举个我自己的例子四、Planning Tools 收束意图去年以来事情就变得特别多、特别杂我需要找课题、写文章、开发课件、做拜访、出差咨询、各种售前…最后还需要稍微花点心思管理团队但事情多了的结果就一个很多事情会被漏掉。一开始我用的 Todolist 提醒把要做的事记下来设个时间提醒自己别忘做完就勾掉只不过后面问题变多了简单的模式就不好用了任务来源越来越多微信聊天、公众号文章、抖音/视频号、小程序消息每条 todo 背后的上下文不一样有的是选题有的是客户有的是灵感片段还要和团队共享、分配、跟进这时候Workflow排上了用场如果是某个微信群就抄到表 A如果包含选题两个字就打某个标签如果是抖音链接就丢给某个脚本处理这就跟上面说的类似了规则不够用一旦入口多一点、场景多一点Workflow 就会爆炸刚才说的“10 个流程覆盖 80%想做到 90% 要 1000 个流程”的问题就出现了。这里就轮到 Agent 上场了。对我来说核心不是再造一个巨复杂的系统而是在一个相对稳定的 Todolist / 项目看板之上加一个项目小助理Agent让它帮我把事情从“世界”搬运到“列表”。这个小助理手里只有几类 Tools文本提取类从微信消息、抖音、网页链接中抽取正文内容加工类摘要、改写、提炼关键句结构化写入类写入多维表格 / 看板字段包括来源、类型、优先级、截止时间等通知提醒类给我或同事发一条“你该处理了”的消息从 Tools 的视角看这套能力很“有限”就是几种固定的操作但从“意图”的视角看它可以覆盖非常多种变体把这篇公众号发给你帮我记成一个选题 todo这个抖音视频不错帮我提炼成一条学习任务客户在微信里说的需求帮我拆成三个可执行任务分给不同同事这篇长论文只要结论帮我变成一个写作素材条目相信从这里大家也看出来Agent的核心价值了他会大大增加我Workflow的泛化能力模型用 ReAct 式的思考-行动-观察循环来决定怎么排列组合这些 Tools对同一个输入它会先判断这是“选题”“学习任务”还是“客户需求”再按套路调用提取文本 → 生成摘要 → 识别类型 → 写入对应项目表 → 视情况创建提醒如果发现字段不全就再问一句补信息继续调用这里结果是我不需要为每种场景写死一个 Workflow只要提供一组通用的能力工具再把“该怎么组合这些工具”交给模型的规划能力就能在有限规则下去承接用户几乎无穷的意图变化。这就是前面那句话的落地版有限的 Tools 模型的规划能力可以在成本可控的前提下大幅“吃掉”长尾需求。从这个角度来说Agent不能说是先进的技术但我也没想到其他的解法这本来就是一种时间、空间成本、稳定性 换取 兜底的设计如果设计如此的话就不能去挑Agent的那些毛病。五、结语当然一套优秀的Agent必定离不开记忆模块只不过大家要明白记忆体系虽然很复杂但他在Agent架构中的最最核心的意义是让模型更清晰的理解用户意图以做更合理的规划、调用更合适的工具组合所以记忆问题我们在这里就不做展开因为其实记忆系统衍生出来的上下文工程才是整个工程架构里面最难、最烦、成本最高的部分这里面涉及了各种结构设计、状态更新、偏好记录、只是增强等等这里根本没办法放开了聊。最后我们收一收关于**Agent 是未来的先进生产力还是一个谁都能做的伪概念**我相信大家现在有了一个清晰的判断了。Agent 不仅是一项先进的技术架构更是当前 AI 应用演进中极具价值的范式突破这东西并不是一下子蹦出来的而是建立在坚实的演进逻辑之上从早期的伪工具调用到 2023 年 OpenAI 推出 Function Calling 成为业界标准再到 Claude Skills 等工程优化。模型在工具调用、规划与执行上的能力已经实现了质的飞跃。这是 2025 年 Agent 从“玩具”走向“工具”的核心原因。从工程实践来看Agent 也不是玄学而是一种清醒的取舍用更多 Token、更多循环、更多系统复杂度去换更高的覆盖率和更强的泛化能力。本质上是用「时间 成本 稳定性的一点点牺牲」换「业务长尾的极大收缩」。如果你认同真实世界业务必然是长尾、必然充满变化那在当前技术条件下很难找到比 Agent 更合理的工程解法。再看 Manus 这条线也许现实会更有说服力。一个被无数人嘲讽为套壳、一个周末就能抄出来的产品几个季度过去了既没有被替代反而在 RLI 等 Benchmark 上长期排在第一这说明什么说明它踩中的不是噱头而是正确的结构性选择Less structure, more intelligence。展望未来正如Manus张涛所言Agent 将向着更通用的工具平台、更持久的伴随式服务、更主动的意图理解演进。它或许尚不完美在成本控制、复杂场景稳定性方面仍需探索但其路径已经清晰作为扩展人类智能与效率的新一代中介Agent 正在将 AI 从“对话的奇迹”转变为“行动的伙伴”。因此对于每一位身处这个时代的构建者与使用者而言理解并善用 Agent已非选择题而是一道关乎效率与竞争力的必答题。最后再引用张涛在清华那场分享里说现在已经是 2025 年最后一个月了如果你还没真正用过 Agent至少要在今年学会和它共处就像几十年前学会用电脑一样。几年之后你大概率不会记得哪一篇 Agent 概念文章但你会很清楚自己是从什么时候开始把 Agent 当成日常工作的一部分的。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

广东网站设计招工.品牌形象宣传策划方案

终极付费墙绕行解决方案:轻松获取付费内容完整指南 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在信息爆炸的时代,付费墙已成为阻碍用户获取优质内容的主要…

张小明 2025/12/26 3:07:24 网站建设

平度网站整站优化外包公司做教育培训的网站

本文详细解析LangChain v1.0的Messages消息列表体系,从字符串拼接进化到结构化消息管理。深入介绍SystemMessage、HumanMessage等五大角色消息的作用与特点,通过代码示例展示ChatPromptTemplate构建带记忆AI应用。同时讲解Context Window管理技术和消息编…

张小明 2025/12/23 8:04:25 网站建设

可以注册的网站wordpress framework

1.文件上传漏洞 1.1. 描述 文件上传漏洞是指由于程序员未对上传的文件进行严格的验证和过滤,而导致的用户可以越过其本身权限,向服务器上传可执行的动态脚本文件。如常见的头像上传,图片上传,oa 办公文件上传,媒体上…

张小明 2025/12/23 8:03:22 网站建设

wordpress 163网站做优化一般几个字

第一章:Dify工作流并行执行概述Dify 是一个支持低代码构建 AI 应用的开发平台,其核心特性之一是工作流的灵活编排能力。在复杂业务场景中,串行执行难以满足性能需求,因此 Dify 提供了对并行执行的原生支持,允许开发者将…

张小明 2025/12/23 8:02:19 网站建设

夜间正能量网站入口网址不用下载秀米编辑器官网

一、概述 Kubernetes 支持多个虚拟集群,它们底层依赖于同一个物理集群。 这些虚拟集群被称为命名空间。命名空间namespace是k8s集群级别的资源,可以给不同的用户、租户、环境或项目创建对应的命名空间,例如,可以为test、devlopmen…

张小明 2025/12/23 8:01:16 网站建设

怎么做网站排名小程序游戏代理加盟

树莓派运行 DeepSeek 大模型实战:轻量化模型选型与内存占用控制精要引言树莓派(Raspberry Pi)以其低廉的价格、强大的社区支持和丰富的扩展性,成为了嵌入式开发、教育、物联网和边缘计算的热门平台。随着人工智能(AI&a…

张小明 2025/12/23 8:00:14 网站建设