文章

22 篇文章 · 第 1/3 页

HITL 的 H，正在从 Human 变成 Harness

2 Jun, 2026

Human-in-the-loop 里的那个「人」，其实只是一个位置——回路里负责判断「这轮成没成」的 verifier。coding agent 这几年的演化，就是 harness 按「哪些判断能写成 check」的顺序，把这个位置一点点接管过去。HITL → VITL。
人类作为弱监督者：从 AAR 看对齐的可行性与边界

15 Apr, 2026

Anthropic 的 AAR 项目表面上在研究自主 AI 研究。换一个角度看，它是 weak-to-strong alignment 的元验证。人类作为弱监督者，在评估环境设计这一杠杆点上引导超越自身能力的模型。
Brain ≠ Hands：Anthropic Managed Agents 的架构拆解

9 Apr, 2026

Anthropic 发布了 Managed Agents 的架构博文。拆开看，核心不是三层架构本身，而是两个反直觉的解耦：Session 不是 Context，Tool 执行不在 Agent 身边。
被困在同一条河里的 Agent

31 Mar, 2026

给 AI Agent 造 memory 的一个月。最终理解到的不是怎么搭管道——而是 memory 和数据库的根本区别：数据库保存事实，memory 让知识生长。
从 Cursor 的 Self-Compaction 看 Agent 上下文压缩

18 Mar, 2026

Cursor 用 RL 训练模型学会自我压缩来处理长周期任务。拆解其 KV cache 复用机制，结合 Claude Code 和 Codex CLI 的逆向工程研究，对比 Agent 上下文压缩的不同实现路线。
Bub Tape 架构深度解读：从可追踪记忆到可控上下文窗口

27 Feb, 2026

深入拆解 Bub 的 Tape 子系统：存储结构、上下文选择、handoff/reset 语义、搜索机制与工程权衡。
从 pi-mono 源码看 Agent 架构的真实取舍——容忍探索 vs 确定性收敛

17 Feb, 2026
Next-generation large language model interface architecture

17 Dec, 2025

文章

HITL 的 H，正在从 Human 变成 Harness

人类作为弱监督者：从 AAR 看对齐的可行性与边界

Brain ≠ Hands：Anthropic Managed Agents 的架构拆解

被困在同一条河里的 Agent

从 Cursor 的 Self-Compaction 看 Agent 上下文压缩

Bub Tape 架构深度解读：从可追踪记忆到可控上下文窗口

从 pi-mono 源码看 Agent 架构的真实取舍——容忍探索 vs 确定性收敛

Next-generation large language model interface architecture