#scaling-laws
共 2 篇
- 《Training Compute-Optimal Large Language Models》:Chinchilla 改变了什么
Chinchilla 论文:为什么 2022 年的大模型全都「喂少了」,以及算力预算到底该怎么分配,附真实 Python 核心代码
- 《Scaling Laws for Neural Language Models》:规模的数学
规模的数学:为什么更大的模型可预测地更强,附真实 Python 核心代码
共 2 篇
Chinchilla 论文:为什么 2022 年的大模型全都「喂少了」,以及算力预算到底该怎么分配,附真实 Python 核心代码
规模的数学:为什么更大的模型可预测地更强,附真实 Python 核心代码