#paper-reading
총 9개
- 《Externalization in LLM Agents》: LLM Agent의 인지적 외부화
Externalization in LLM Agents를 cognitive artifacts 관점에서 읽는다. Agent의 진전은 점점 더 memory, skills, protocols, harness를 모델 밖의 인프라로 옮기는 일에 가까워지고 있다.
- 《AutoCodeBench》: LLM이 코드 벤치마크를 자동 생성할 때
AutoCodeBench에서 왜 Elixir 열이 눈여겨볼 만한지, 그리고 그것이 자동 생성 다국어 코드 benchmark의 난도 등가성 논의를 어떻게 이끄는지
- 《Training Compute-Optimal Large Language Models》: Chinchilla가 바꾼 것
Chinchilla 논문 — 왜 대부분의 대형 모델이 과소 학습되었는지, 그리고 컴퓨팅 예산을 현명하게 쓰는 법, 실제 Python 코드 예시 포함
- 《Scaling Laws for Neural Language Models》: 규모의 수학
규모의 수학 — 더 큰 모델이 예측 가능하게 더 나은 이유, 실제 Python 코드 예시 포함
- 《Language Models are Few-Shot Learners》: GPT-3와 인컨텍스트 학습
더 큰 모델, 컨텍스트에서 더 잘 능력을 이끌어내다, 실제 Python 코드 예시 포함
- 《BERT》: 언어 이해 사전학습 패러다임의 확립
사전학습 패러다임의 확립, 실제 Python 코드 예시 포함
- 《Sequence to Sequence Learning with Neural Networks》: 인코더-디코더 패러다임의 출발점
인코더-디코더 패러다임의 확립, 실제 Python 코드 예시 포함
- 《Neural Machine Translation by Jointly Learning to Align and Translate》: Transformer 이전의 어텐션
어텐션 메커니즘의 기원, 실제 Python 코드 예시 포함
- 《Attention Is All You Need》: Transformer의 설계 원점
Transformer 논문 연구 노트, 실제 Python 코드 예시 포함