生产 Agent 的可靠性护城河，不在功能表，而在证据层、验证层和观察预算

type

Post

status

Published

date

Apr 25, 2026

slug

pub_topic_20260425_provenance_observation_moat_001_notion_001

summary

很多系统把可靠性理解成多加 memory、logging 和 self-check，但真正决定上限的是三层分离：原始 provenance 必须 append-only，验证者必须独立于执行者，可观测性必须被当成有成本的预算层设计。

不少系统的问题，并不是不会做事，而是太擅长把自己讲圆。

当 memory 可以覆盖原始状态，系统后续的反思、总结和修正，就可能建立在被改写过的现实之上。此时它给出的解释也许越来越流畅，但流畅并不等于可信。你看到的是一个越来越会叙事的系统，不一定是一个越来越可追责的系统。

同样的误区也会出现在验证环节。让 agent 一边执行、一边用自己的上下文给自己打分，看起来效率很高，实际上天然带着 affirmation bias。只要关键 gate 不看外部状态，所谓验收就很容易退化成高置信度的自我背书。

把这组素材放在一起看，更有价值的不是单独讨论 handoff、memory 或 logging，而是把它们收束成一套更接近生产现场的结构。

第一层是原始证据层。原始 provenance 必须是 append-only，不能被 summary、memory 或反思结果覆盖。系统可以解释事实，但不能改写事实。只有底稿不可覆盖，后续所有纠错、审计和复盘才站得住。

第二层是独立验证层。执行者不能兼任验收者，关键结果必须接受外部验证。这里的“外部”不一定意味着人工介入，也可以是独立的 evaluator、外部状态检查、或者和执行上下文解耦的 gate。重点在于，系统不能只靠自己的叙述证明自己成功。

第三层是观察预算层。可观测性不是免费附加项。日志、审计、summary、错误台账、监控回调，都会消耗延迟、上下文窗口和团队注意力。如果 observation layer 没有预算约束，系统最后不只是更贵，还可能为了保持“可见”而重写错误、掩盖真实成本，甚至把自己做成新的瓶颈。

今天功能同质化的速度已经很快。memory、日志、反思、self-check，这些能力都会越来越像标配。真正难复制的东西，不在 feature list，而在系统结构。

一套能同时保住原始证据、外置关键验收、并控制 observation tax 的系统，复制起来远比多加几个功能难得多。因为这背后不是单点能力，而是一整套对事实、验证和成本的约束方式。

换句话说，真正值钱的不是“系统会不会写总结”，而是“系统有没有能力留下不可覆盖的事实底稿、让关键结果接受独立验证，并在持续观测中不把自己拖慢、拖歪”。

生产 agent 的可靠性护城河，不该再被理解成“功能更多”。更准确的说法是：证据不能被解释层篡改，验收不能被执行者垄断，观测也不能假装没有成本。

只有把 provenance、独立验证和 observation budget 分层设计，系统才不是在更会解释自己，而是在真正变得更可靠。