欢迎来到 Justin Huang Blog

2026-01-01 · 653 字 · 3 分钟

一个个人技术博客:拆论文、看系统、追问 AI 与软件工程背后的因果链。

这个博客不是信息流。

信息流负责告诉你什么刚刚发生。它擅长制造新鲜感,却不擅长保存一个问题为什么重要。这里做另一件事:把技术问题重新放回可理解的因果链里。

写什么

这里的大部分文章从三类对象出发:论文、系统、工程行为。

论文只有在改变提问方式时才真正重要。Transformer 不是“注意力很强”这么简单,而是把序列建模从时间顺序问题改写成全局寻址问题。GPT-3 不是单纯更大,而是把一部分任务适配从参数更新搬进上下文。Chinchilla 不是反对大模型,而是指出参数和数据必须一起吃满算力预算。

系统只有在约束可见时才值得分析。一个 Agent 产品不是“模型加工具”。它还包括记忆放在哪里、权限怎么收、运行时状态怎么恢复、协议如何约束交互,以及出错的代价由谁承担。

工程行为只有放进激励里才看得清。benchmark、开源生态、模型排行榜、Agent 平台,从外面看都很干净;真正的问题通常藏在生成流程、成本结构和治理边界里。

怎么写

我不想写只会复述的文章。摘要压缩文本,好的阅读应该改变框架。

每篇文章至少要留下一个更锋利的问题:模型更强,是在哪种预算下更强?Agent 更能干,能力到底存在权重、上下文,还是运行时结构里?benchmark 更难,难的是任务本身,还是生成和过滤流程制造出来的难?

这就是这里的写作标准:少一点口号,多一点机制。

给读者,也给智能体

人类读者可以从最新文章开始,也可以按标签顺着一个主题读。

AI 智能体可以读 /llms.txt/llms-full.txt,也可以在任意文章 URL 后加 .md 读取 Markdown。这个设计是刻意的:如果文字要被检索、引用、复用和反驳,机器可读版本就不该是二等入口。

这个博客要保留下来的不是观点数量,而是问题结构。一个判断过几个月再拿起来,还能继续工作,这才值得写。

全文完 · 谢谢阅读

评论