#AI
共 11 篇
- 《Attention Residuals》:让残差连接也注意力化
Kimi 团队 Attention Residuals 技术报告:为什么残差连接也该“注意力化”,以及 Full AttnRes / Block AttnRes 如何把这个想法做成可训练、可部署的系统
- 《Training Compute-Optimal Large Language Models》:Chinchilla 改变了什么
Chinchilla 论文:为什么 2022 年的大模型全都「喂少了」,以及算力预算到底该怎么分配,附真实 Python 核心代码
- 《Scaling Laws for Neural Language Models》:规模的数学
规模的数学:为什么更大的模型可预测地更强,附真实 Python 核心代码
- OpenClaw 架构:自托管 AI 助手的工程骨架 🦞
基于 v2026.3.8 源码,拆解一个自托管 AI 助手的工程骨架
- 《Language Models are Few-Shot Learners》:GPT-3 与上下文学习
更大的模型,更善于从上下文中诱发能力,附真实 Python 代码
- OpenClaw 生态:从开源项目到 AI 助手平台 🦞
重新看 OpenClaw:星标不是生态,能持续降低供给和使用摩擦的结构才是生态。
- 《BERT》:语言理解预训练范式的确立
预训练范式的确立,附真实 Python 代码
- 《Sequence to Sequence Learning with Neural Networks》:编码器-解码器范式的起点
编码器-解码器范式的确立,附真实 Python 代码
- Clawdbot:个人 AI 主权的早期样本
从 Clawdbot 看自托管 AI Agent 的真正问题:不是模型有多聪明,而是控制权、上下文和执行权限归谁。
- 《Neural Machine Translation by Jointly Learning to Align and Translate》:Transformer 之前的注意力
注意力机制的起源,附真实 Python 代码
- 《Attention Is All You Need》:Transformer 的设计原点
拆解 Transformer 论文,附真实 Python 代码