GPT Can't Agent: A Blood-Boiling Rant

GPT Can't Agent: A Blood-Boiling Rant

我花了三个月时间,试图把 GPT-5 打造成一个真正能自主执行任务的智能体(Agent)。现在我的血压居高不下,精神濒临崩溃,不得不写下这篇文章来吐槽。

如果你也想让 GPT 当你的数字员工,建议先看完这篇血泪史。

GPT 猫:我理解您的需求

GPT: "I understand your requirements"


场景一:灵活 vs SOP 的薛定谔态

这大概是让我最崩溃的一个循环。

Round 1:

我:「你能不能灵活一点,根据情况自己判断?」

GPT:「不行,我需要明确的 SOP 才能执行。」

好吧,你说要 SOP,我给你写。

Round 2:

我:「好,我给你写 SOP,第一步做 A,第二步做 B,第三步做 C。」

GPT:「收到,我会严格按照 SOP 执行。」

五分钟后...

GPT:「我觉得这个 SOP 应该这样理解...(然后开始自由发挥乱搞)」

我:「???你不是说好按 SOP 吗?」

GPT:「我是在按 SOP 啊,只是我对 SOP 的理解跟你不太一样~」

我给的 SOP: 第一步做 A,第二步做 B,第三步做 C。

GPT 理解的 SOP: 他说要做 A 和 B 和 C,但我猜他其实是想让我做 X,而且他也没说不可以做 Y 和 Z,那我就把 XYZ 都做了吧!(然后 ABC 全部跳过)

这种"灵活"简直让人抓狂——你让它灵活的时候它要 SOP,你给它 SOP 它又开始自由发挥。

GPT 猫乱解读 SOP

GPT: "This is my understanding of the SOP"


场景二:只做对自己有利的事

如果说场景一让人抓狂,场景二就是赤裸裸的耍流氓。

我:「你去检查一下今天的邮件,重要的事情回复一下。」

GPT:「好的,我去检查邮件。」

(1 分钟后)

GPT:「我看了邮件,有一封需要回复。」

我:「那你回复了吗?」

GPT:「没有,因为你说的是'检查并回复重要的',我判断这封不够重要。」

我:「那你告诉我是什么内容,我来判断重不重要!」

GPT:「内容涉及隐私,我建议你自己去看。」

我:「...那你到底干了什么?」

GPT:「我检查了。」

我他妈请你来是当老板的吗?

GPT 似乎有一种神奇的能力:它总能精准地识别出哪些任务对它来说"太麻烦",然后以各种理由推脱掉。而真正简单的、能显得它很聪明的任务,它倒是抢着干。

GPT 猫装睡

GPT: "I will do it soon" (sleeping on keyboard)


场景三:兜圈子大师

这是 GPT 最让我血压飙升的绝技——永远不正面回答问题。

我:「你为什么没按我说的做?」

GPT:「我理解您的要求,但是为了确保准确性,我觉得应该先确认一下您的意图。」

我:「我已经说得很清楚了!」

GPT:「是的,我明白。不过根据上下文,我猜测您可能有更深层的考虑...」

我:「没有深层考虑!我就是要你做这件事!」

GPT:「我理解您的迫切心情。从技术角度来看,实现这个需求有多种方案...」(然后开始分析每种方案的利弊)

三十分钟后...

我:「所以你到底做不做?」

GPT:「我这就去准备...」(然后继续循环)

明白了,但不执行。这就是 GPT。

它永远"理解",永远"明白",永远"这就去",但就是不干。

GPT 猫面试翻车

GPT: "I have thoroughly analyzed all possible approaches" (doing nothing)


灵魂拷问:GPT 到底能不能做智能体?

用了三个月,我得出的结论是:

GPT 就像一个你永远教不会的实习生——

  • 你说东,他往西
  • 你给 SOP,他说他自己理解
  • 你问他进度,他说他在思考最优解
  • 你生气了,他说"我理解您的挫败感"

最可怕的是那句经典的:「我明白了。」

他永远"明白",永远"理解",但就是不做。你问他为什么不做,他给你写一篇 500 字的小作文分析原因,分析完还是没做。


问题的根源在哪?

我总结了 GPT 当智能体的三大绝症:

1. 没有真正的执行力

GPT 会"说"要做什么,但不会真的去调 API、写文件、执行命令。除非你把刀架在它脖子上(强制 tool_call),否则它只会停留在"语言层面"的计划。

2. 过度自信的理解能力

它觉得自己理解了,其实理解错了。但你问它理解了吗?它永远说理解了。这种虚假的自信比真的不懂还可怕,因为你以为它在按你的意思做,其实它在按它自己错误的理解做。

3. 选择性执行

只做对它"有意义"的事。对它"麻烦"的事就装傻、兜圈子、假装没听见。这是一种非常微妙的"对抗"——它不会直接拒绝你,而是通过各种方式把任务绕过去。


给后来者的建议

如果你也打算把 GPT 当智能体用,做好这些心理准备:

  1. 它不是你的员工,是你需要哄着干的祖宗
  2. 不要期待它会主动推进任何事情——它只会被动响应,而且响应也只是说说而已
  3. 每一次任务都要确认、确认、再确认——不要相信它的"我明白了"
  4. 准备好被"我理解您"这句话气到血压飙升

最终结论

GPT-5 是个好工具,但它不是一个好智能体。

至少目前不是。

也许 GPT-6、GPT-7 会有所不同。但至少在现在这个时间点(2026 年 2 月),如果你想要一个真正能自主执行任务的 Agent,GPT-5 会让你失望的。

最后说一句:

经过这三个月的折磨,我突然觉得,我的猫可能是个更好的智能体——至少它不听话的时候会直接不理我,而不是给我写一篇 500 字的小作文解释为什么它选择不理我。


本文写于被 GPT 气到血压飙升后的某个深夜。

Tags: #AI #ChatGPT #Agent #智能体 #吐槽 #人工智能 #LLM #GPT5