生产 Agent 的可靠性护城河,不在功能表,而在证据层、验证层和观察预算技术分享很多系统把可靠性理解成多加 memory、logging 和 self-check,但真正决定上限的是三层分离:原始 provenance 必须 append-only,验证者必须独立于执行者,可观测性必须被当成有成本的预算层设计。2026-4-25 AI Agent 可靠性 provenance 可观测性 workflow 审计