标签: Research
包含标签“Research”的全部文章。
-
人类作为弱监督者:从 AAR 看对齐的可行性与边界
Anthropic 的 AAR 项目表面上在研究自主 AI 研究。换一个角度看,它是 weak-to-strong alignment 的元验证。人类作为弱监督者,在评估环境设计这一杠杆点上引导超越自身能力的模型。
包含标签“Research”的全部文章。
Anthropic 的 AAR 项目表面上在研究自主 AI 研究。换一个角度看,它是 weak-to-strong alignment 的元验证。人类作为弱监督者,在评估环境设计这一杠杆点上引导超越自身能力的模型。