文章
22 篇文章 · 第 1/3 页
-
HITL 的 H,正在从 Human 变成 Harness
Human-in-the-loop 里的那个「人」,其实只是一个位置——回路里负责判断「这轮成没成」的 verifier。coding agent 这几年的演化,就是 harness 按「哪些判断能写成 check」的顺序,把这个位置一点点接管过去。HITL → VITL。
-
人类作为弱监督者:从 AAR 看对齐的可行性与边界
Anthropic 的 AAR 项目表面上在研究自主 AI 研究。换一个角度看,它是 weak-to-strong alignment 的元验证。人类作为弱监督者,在评估环境设计这一杠杆点上引导超越自身能力的模型。
-
Brain ≠ Hands:Anthropic Managed Agents 的架构拆解
Anthropic 发布了 Managed Agents 的架构博文。拆开看,核心不是三层架构本身,而是两个反直觉的解耦:Session 不是 Context,Tool 执行不在 Agent 身边。
-
从 Cursor 的 Self-Compaction 看 Agent 上下文压缩
Cursor 用 RL 训练模型学会自我压缩来处理长周期任务。拆解其 KV cache 复用机制,结合 Claude Code 和 Codex CLI 的逆向工程研究,对比 Agent 上下文压缩的不同实现路线。