大模型训练全攻略：从数据准备到模型优化的完整指南

2026-06-28

拖更三年万字长文，前OpenAI安全VP翁荔拆解Scaling Laws：你的模型可能喂错了数据

停更 13 个月后，前OpenAI安全研究副总裁、现Thinking Machines Lab联合创始人翁荔在个人博客Lil'Log上发表了一篇逾万字的技术长文《Scaling Laws， Carefully》，自称"迟到了三年多"。这篇文章将支撑大模型行业数百亿美元投入的Scaling Laws从头拆解一遍，得出的核心结论让不少从业者难以平静：当前模型的数据配比，很可能从一开始就走偏了。从Kaplan到Chinchilla：一场被写反的行业共识故事始于 2020 年，OpenAI研究员Jared...