#scaling-laws
총 2개
- 《Training Compute-Optimal Large Language Models》: Chinchilla가 바꾼 것
Chinchilla 논문 — 왜 대부분의 대형 모델이 과소 학습되었는지, 그리고 컴퓨팅 예산을 현명하게 쓰는 법, 실제 Python 코드 예시 포함
- 《Scaling Laws for Neural Language Models》: 규모의 수학
규모의 수학 — 더 큰 모델이 예측 가능하게 더 나은 이유, 실제 Python 코드 예시 포함