#scaling-laws

共 2 篇

2026-03-11
《Training Compute-Optimal Large Language Models》：Chinchilla 改变了什么
Chinchilla 论文：为什么 2022 年的大模型全都「喂少了」，以及算力预算到底该怎么分配，附真实 Python 核心代码

#paper-reading #chinchilla #scaling-laws #AI #LLM #python
2026-03-01
《Scaling Laws for Neural Language Models》：规模的数学
规模的数学：为什么更大的模型可预测地更强，附真实 Python 核心代码

#paper-reading #scaling-laws #AI #LLM #python