我发布过的所有文章时间线。
Anthropic 的 AAR 项目表面上在研究自主 AI 研究。换一个角度看,它是 weak-to-strong alignment 的元验证。人类作为弱监督者,在评估环境设计这一杠杆点上引导超越自身能力的模型。
Anthropic 发布了 Managed Agents 的架构博文。拆开看,核心不是三层架构本身,而是两个反直觉的解耦:Session 不是 Context,Tool 执行不在 Agent 身边。
给 AI Agent 造 memory 的一个月。最终理解到的不是怎么搭管道——而是 memory 和数据库的根本区别:数据库保存事实,memory 让知识生长。
Cursor 用 RL 训练模型学会自我压缩来处理长周期任务。拆解其 KV cache 复用机制,结合 Claude Code 和 Codex CLI 的逆向工程研究,对比 Agent 上下文压缩的不同实现路线。
深入拆解 Bub 的 Tape 子系统:存储结构、上下文选择、handoff/reset 语义、搜索机制与工程权衡。
How to build effective agents.
浅析 Python venv.
Some interesting research findings about CoT.
Everything about gguf.
Jina reader-lm 诞生日记
对 TEI 的魔改与 Rust 在 ML 相关的支持探索
深入探索 Cargo 使用
一份模型推理性能测试报告。
The core of Embedding.
再探 OS 的世界。
Type to search articles, tutorials, and ideas...