你问 AI 最新的事,它答的全是一年前的

费曼讲AI

你问过 AI「最近 XX 有什么新进展?」它答得头头是道——说的全是一年前的事。这不是 AI 坏了,是它有个秘密:AI 训练完,知识就冻住了。之后发生的事,它一概不知。你以为在问一个知道最新事的助手,其实在问一个活在过去的人。

有人想到一个解法:不让 AI 靠记忆,让它先去查。你问问题,AI 先在外部资料堆里找到最相关的几段,再结合这些段落回答——这就是 RAG,就像开卷考试。但随着 Context Window 扩到 1M Token,有人说 RAG 死了:直接把所有文档塞进去不就行了?问题是长上下文每次查询贵 1,250 倍。

所以不是二选一,是分工。固定文档可以直接读进 Context;动态更新的资料、海量知识库,交给 RAG。AI 活在过去,RAG 是它的实时快讯。