让 AI 变得更聪明的 12 个元反思技巧

伴随这轮以 Claude Code、OpenClaw 为代表的 AI 跃迁,我们越来越感受到 AI 的智力之强,然而,你可以借助一些元反思技巧,让它变得更聪明。

可能没有哪个学科比认知科学更重视「元」了。在认知科学中,有研究认知的认知——元认知;有研究记忆的记忆——元记忆;有研究语言的语言——元语言,这类研究在认知科学中简直太常见了。什么叫做元反思?同样,就是反思的反思

这是我在实践中常用的一些元反思技巧,供各位参考。

第一组:通用类

技巧 1: 元反思

指令示例:请使用「深度思考」(调用 sequential-thinking mcp)进行一轮元反思,你的实现是否正确,是否实现了我们的目标,是否存在重大逻辑错误,或者有所缺失,尤其需要注意,实现新目标的时候,破坏旧功能了。

这个技巧是我最高频使用的。只要让 AI 元反思,必然会发现新的问题。AI 是一个几千维度的向量矩阵,它比我们人类更擅长一些之前我们没有注意到的连接、通路。这是它的优点。但缺点是,任何神经网络的机制,其实必然会存在信息加工局限。包括人类、包括 AI 大模型,都是如此。因为,神经网络的工作机制,其实就是权重/参数的激活而已。所谓激活,意味着注定不精确、无法精确

因此,元反思过程对于 AI 来说,是极为必需的一步。除了 think 类模型这样内嵌的元反思过程之外,我们还需要主动在关键环节,让 AI 强制进行元反思。我的感受是,几乎任何一个复杂任务,只要进行元反思,AI 必然给我惊喜。

技巧 2: 约束实体

指令示例:请列出这轮任务涉及的实体,是否只处理 4 个实体以内?如果超过 4 个,请使用 TaskCreate 拆分为子任务。

AI 大模型依然是「有限理性」的。无论上下文窗口如何设计,最佳的对话模式,依然是一个 Session,只处理 4 个实体以内。用数据库术语来说,就是约束在 4 个表格以内。

一旦超过 4 个表格,大模型多数时候必然出错。这玩意,跟使用再先进的大模型没关系。而是因为大模型模仿人类大脑结构,带来的天然漏洞。只要是神经网络架构,必然存在这类缺陷。

技巧 3: 重新定义问题

指令示例:请使用「深度思考」(调用 sequential-thinking mcp),深入理解问题。该问题是否存在,是否可以重新定义问题、是否可以缩小问题的边界或转换为业界或另一个领域已经有成熟解法的问题?

很多时候,定义问题比解决问题更重要。重新定义问题、优化问题的边界,其实就解决了大半问题。有一次,我在长考一个战略难题,但我让 AI 将其重新转换为一个时序优化问题,就容易解决得多了。在一个领域没有成熟答案的问题,换一个领域则未必。

第二组:意图类

技巧 4: 设置兜底

指令示例:请问你考虑兜底策略了吗?

所谓兜底,也就是事情搞砸了,那么怎么办?AI 其实跟人类一样,受限于训练时的时长约束,往往试图在尽量短的时长给你一个答案,这个答案往往是从正面思考的,也就是如何成功,但从未考虑过,如果失败了,那么怎么办呢

技巧 5: 三重防护

指令示例:请问你考虑了三重防护了吗?

这个技巧类似兜底策略,但防护更严谨。一般适用于关键场景。有句老话说的是,祸不单行。其实在生产环境或复杂项目中,要么不失败,一旦失败,如果你只设置了一道防线,往往在真正事故发生时,是非常不够的,要连续三道防护才能保证失败后依然没问题

技巧 6: 自我校验

指令示例:请在执行之前,先给自己写一个校验脚本或提出一套检验标准,执行完毕后,请自动执行你的校验脚本或使用检验标准,看看你的执行还有什么不足,再持续优化。

让 AI 执行复杂任务之前,先给自己设定校验标准,然后执行过程中随时与之对齐。发现校验标准有错误再继续优化。如此循环往复。做好数据监测、做好流程设计,那么,AI 的自动优化会通往一个令所有人震惊的地步。前不久流行的 ralph-loop 循环方法就是一个极佳例子:

https://42plugin.com/plugins?q=ralph-loop

但这类循环的方法太低估真实工作的复杂性了。所以,我自己搞了一套更好的 dev-loop 方法,在实战中,效果非常棒。

第三组:实施类

技巧 7: 看门狗

指令示例:请利用 CronCreate 工具,帮我创建一个看门狗,读取 memory 文件(或你存放工作进展的某个文件),找到下一个未完成步骤,立即执行。不要问我任何问题,直接执行下一步。

另一个类似的用法是心跳监控,指令示例如下:请读取 memory 文件,检查是否有待处理的提醒或任务,如果有,立即执行,不要询问我任何问题;如果没有,回复 HEARTBEAT_OK。

看门狗或心跳监控为何重要呢?因为它让我们摆脱人在回路(human in loop),可以离开与 AI 的对话,去干其他事情了。前不久,我给同学们直播 AI 干活,我在户外公园跑步,AI 在家一口气连续直播自主干活 90 分钟,没有任何人工干预,背后就是看门狗在工作。

技巧 8: 完整性

指令示例:请问你考虑原子性/事务一致性/幂等性了吗?

这几个词略有细微差异,原子性侧重不可分割,要么全做,要么全不做;事务一致性侧重状态合法,从合法状态 A 到合法状态 B,不出现非法中间态,也就是要么失败,要么成功,不能有一个一半失败一半成功的中间态;幂等性则侧重重复无害,也就是执行一次和执行十次的结果一样。

但整体方向都是类似的,突出我们在行动时,要考虑更周全:确保操作和结果是完整的、干净的——不留半成品、不产生脏数据、不因重复而出错

技巧 9: 对齐!对齐!对齐!

指令示例:请仔细对照你最初撰写的 plan 或 spec(规约)等文档,你目前的实现,是否对齐了?是否存在重大逻辑错误,以及有所缺失?

AI 10 倍速工作的关键正是:对齐!对齐!对齐!

其实,对齐=利用大模型的补全能力,A 不完善,B 来补全它;B 不完善,A 来补全 B。

人类不完善,AI 补全人类;AI 不完善,人类补全 AI。

项目 1 不完善,项目 2 来补全它;项目 2 不完善,项目 1 来补全它。

项目的模块 1 不完善,相对完善的模块 2 来补全它;项目的模块 2 不完善,相对完善的模块 1 来补全它。

如此循环往复。这就是真正的「混合智能」时代!这才是 10 倍速工作!

这就是这轮大模型的关键!

所以,找到相对完善的那点,就是设计整个「10 倍速工作流」的起点或关键。

任何工作,都存在「相对完善」的那点。实在没有,就来进行「无中生有」。参考他人的完善,来补全自己的不完善。

万变不离其宗,所有的技巧都是从这一点出发:找到相对完善的那点,就是设计整个工作流的起点

而如何评判「完善」,就是我在新年演讲《意向革命:迈向混合智能时代》所说的「确认成本」与「确认系数」。

第四组:反馈类

技巧 10: 倍速测试

指令示例:请问你考虑到更极端的情况了吗?你刚才的执行,如果想提高速度或产出质量到 10 倍、100 倍、1000 倍,你的执行还受影响吗?如果受到影响,那么你可以如何改善你刚才的执行?

很多时候,我们在同类数量级下思考,其实很难获得好答案。但一旦思考如何获得 10 倍、100 倍、1000 倍的产出或提速,那么,好答案反而更容易获得

不过这里对于程序开发来说,一种常见的做法是并发、异步,那么,还需要提醒 AI:请问你考虑了高性能的版本吗?比如改为并发执行或异步执行吗?如果你考虑了,那么,你考虑了并发或异步无法执行的策略了吗?也就是设置兜底策略,参考技巧 4。

技巧 11: 同类扫描

指令示例:请再仔细思考,是否还存在类似错误?尤其是刚才那个错误的变式?

强制 AI 举一反三,扫描同类问题。这是我实战中出现频率极高的一条。很多时候,受限于 AI 的上下文窗口,如果你不主动指出来,它不会主动去扫描同类问题,比如改了作业区的收藏 bug,讨论区、课程内容区的收藏一模一样的 bug 它不管。

技巧 12: 积累飞轮

指令示例:请将这轮工作中新发现的模式,追加到 memory/dev-loop-patterns.md 文件。

AI 大模型的模式理解能力远远超过人类,尤其容易发现一些我们没注意到的模式。将这些模式积累下来,未来类似工作就会轻松很多。

这个技巧常常可以设定指标,聚焦在关键指标的改善上,比如,持续改善大模型训练的某个指标。结合前述技巧,将产生令人极为惊艳的成果。这是我创作的一个 AI 自主工作系统中的一个 Skill 的写法:

新发现的模式 → 追加到 memory/dev-loop-patterns.md

关键指标 → 追加到 memory/dev-loop-metrics.md

小结

熟悉我的同学可能看出上述技巧的思路了,这不就是阳老师你在「元知识」系列讲座中讲述的「行动之环」吗?

是的,答案正是如此。行动之环包括四个要素:行动的意图、行动的实施、行动的反馈,及行动主体所处的情境。要想提高人类的行动力,围绕这些要素做文章,同样,要想改善 AI 产出,还是围绕这些要素做文章。只是,AI 的情境成了上下文(Context)

目前主流的前沿 AI 大模型,其实在后训练时普遍接受了反思类的训练,比如思维链(CoT)等,但在恰当的上下文让 AI 进行元反思,会取得超出预期的效果。毕竟,AI 大模型训练时,不可能穷尽你工作时的一切上下文。

大家可以在这个基础上,将其编排为 Skill、Command、Agents 等。我自己就是这么干的,形成了一套强大的 AI 自主干活系统,从而可以轻易实现 AI 长时间自主干活。最近好玩,开了五期 AI 自主干活直播,我不做任何干预,真实的复杂项目,AI 可以轻易自主干活 90 分钟到 3 小时。这才是这轮 AI 跃迁的关键:不做任何干预,如何让 AI 独立完成一个生产级别的大活或难活?

人类吃饭、人类运动,AI 勤勤恳恳直播干活。这才是人类的理想未来

本文来自微信公众号“心智工具箱”,作者:阳志平,36氪经授权发布。

发布时间:2026-03-18 08:31