#AI

共 11 篇

2026-03-19
《Attention Residuals》：讓殘差連接也注意力化
Kimi Team 的 Attention Residuals 技術報告：為什麼殘差連接也該「注意力化」，以及 Full AttnRes / Block AttnRes 如何把這個想法做成可訓練、可部署的系統

#technical-report-reading #residual-connections #transformer #AI #LLM #python
2026-03-11
《Training Compute-Optimal Large Language Models》：Chinchilla 改變了什麼
Chinchilla 論文：為什麼大多數大模型其實訓練不足，以及如何聰明地分配算力預算，附真實 Python 核心程式碼

#paper-reading #chinchilla #scaling-laws #AI #LLM #python
2026-03-01
《Scaling Laws for Neural Language Models》：規模的數學
規模的數學：為什麼更大的模型可預測地更好，附真實 Python 核心程式碼

#paper-reading #scaling-laws #AI #LLM #python
2026-02-24
OpenClaw 架構：自託管 AI 助手的工程骨架 🦞
基於 v2026.3.8 原始碼，拆解一個自託管 AI 助手的工程骨架

#AI #open-source #openclaw
2026-02-11
《Language Models are Few-Shot Learners》：GPT-3 與上下文學習
更大的模型，更善於從上下文中誘發能力，附真實 Python 程式碼

#paper-reading #gpt-3 #AI #LLM #python
2026-02-03
OpenClaw 生態：從開源專案到 AI 助手平台 🦞
重新看 OpenClaw：星標不是生態，能持續降低供給和使用摩擦的結構才是生態。

#AI #open-source #openclaw
2026-01-31
《BERT》：語言理解預訓練範式的確立
預訓練範式的確立，附真實 Python 程式碼

#paper-reading #bert #AI #LLM #python
2026-01-24
《Sequence to Sequence Learning with Neural Networks》：編碼器-解碼器範式的起點
編碼器-解碼器範式的確立，附真實 Python 程式碼

#paper-reading #seq2seq #AI #LLM #python
2026-01-16
Clawdbot：個人 AI 主權的早期樣本
從 Clawdbot 看自託管 AI Agent 的真正問題：不是模型有多聰明，而是控制權、上下文和執行權限歸誰。

#AI #open-source
2026-01-11
《Neural Machine Translation by Jointly Learning to Align and Translate》：Transformer 之前的注意力
注意力機制的起源，附真實 Python 程式碼

#paper-reading #attention #AI #LLM #python
2026-01-06
《Attention Is All You Need》：Transformer 的設計原點
拆解 Transformer 論文，附真實 Python 程式碼

#paper-reading #transformer #AI #LLM #python