#transformer
총 2개
- 《Attention Residuals》: 잔차 연결도 어텐션처럼 만들기
Kimi Team의 Attention Residuals 기술 리포트 읽기: 왜 residual connection도 attention처럼 바뀌어야 하는지, 그리고 Full AttnRes / Block AttnRes가 그 아이디어를 어떻게 학습 가능하고 배포 가능한 시스템으로 만드는지
- 《Attention Is All You Need》: Transformer의 설계 원점
Transformer 논문 연구 노트, 실제 Python 코드 예시 포함