#AI
共 11 篇
- 《Attention Residuals》:讓殘差連接也注意力化
Kimi Team 的 Attention Residuals 技術報告:為什麼殘差連接也該「注意力化」,以及 Full AttnRes / Block AttnRes 如何把這個想法做成可訓練、可部署的系統
- 《Training Compute-Optimal Large Language Models》:Chinchilla 改變了什麼
Chinchilla 論文:為什麼大多數大模型其實訓練不足,以及如何聰明地分配算力預算,附真實 Python 核心程式碼
- 《Scaling Laws for Neural Language Models》:規模的數學
規模的數學:為什麼更大的模型可預測地更好,附真實 Python 核心程式碼
- OpenClaw 架構:自託管 AI 助手的工程骨架 🦞
基於 v2026.3.8 原始碼,拆解一個自託管 AI 助手的工程骨架
- 《Language Models are Few-Shot Learners》:GPT-3 與上下文學習
更大的模型,更善於從上下文中誘發能力,附真實 Python 程式碼
- OpenClaw 生態:從開源專案到 AI 助手平台 🦞
重新看 OpenClaw:星標不是生態,能持續降低供給和使用摩擦的結構才是生態。
- 《BERT》:語言理解預訓練範式的確立
預訓練範式的確立,附真實 Python 程式碼
- 《Sequence to Sequence Learning with Neural Networks》:編碼器-解碼器範式的起點
編碼器-解碼器範式的確立,附真實 Python 程式碼
- Clawdbot:個人 AI 主權的早期樣本
從 Clawdbot 看自託管 AI Agent 的真正問題:不是模型有多聰明,而是控制權、上下文和執行權限歸誰。
- 《Neural Machine Translation by Jointly Learning to Align and Translate》:Transformer 之前的注意力
注意力機制的起源,附真實 Python 程式碼
- 《Attention Is All You Need》:Transformer 的設計原點
拆解 Transformer 論文,附真實 Python 程式碼