OpenClaw 创始人:编程不会消失,但会变成"织毛衣"
一个倦怠消失三年的开发者,回来后用 AI Agent 三个月造出 GitHub 24 万 stars 的开源项目。OpenAI 和 Meta 都想收购,他只提了一个条件。
Peter Steinberger,奥地利开发者,PSPDFKit(用于超过 10 亿设备的 PDF 框架)创始人。花了 13 年打造这款产品后经历严重倦怠,消失了 3 年。2026 年初回归后,用 AI Agent 在三个月内构建了 OpenClaw——一个开源 AI 个人助手,GitHub 超过 24 万 stars,成为近年来增长最快的开源项目之一。
本文综合他近期的三场重磅访谈:Lex Fridman Podcast #491【注:Lex Fridman,MIT 研究员,其长访谈节目是英文科技播客中影响力最大的之一】(约 3.5 小时)、Pragmatic Engineer 播客(约 2 小时,Gergely Orosz【注:前 Uber 高级工程师,Pragmatic Engineer 博客主理人,科技圈知名的工程管理评论人】主持)、以及 OpenAI Builders Unscripted Ep.1(约 31 分钟),提炼他关于 AI 编程、软件工程和开源未来的核心观点。
原文链接:
- Lex Fridman Podcast #491:https://lexfridman.com/peter-steinberger-transcript
- Pragmatic Engineer:https://newsletter.pragmaticengineer.com/p/the-creator-of-clawd-i-ship-code
- Builders Unscripted:https://www.youtube.com/@OpenAI(Builders Unscripted Ep.1)
要点速览
- 倦怠不是因为工作太多,是因为不再相信自己在做的事。消失 3 年后,AI 重新点燃了他的创造欲
- 他的 AI Agent 收到一条语音消息后,自己检查文件头、用 FFmpeg 转码、找到 API key 调 Whisper 转文字——没有任何一步是他教的
- “Vibe Coding 是脏话”——他做的是 Agentic Engineering,但也承认凌晨三点之后会切换成 Vibe Coding,“第二天就后悔”
- 架构要为 Agent 设计,不是为自己设计。写 spec 让 AI 去造,本质上是瀑布模型的复辟
- 他不再逐行审查 PR,因为“那不是 Pull Request,是 Prompt Request”——重要的是意图,不是代码
- 改名风波中他差点删掉整个项目,“我已经给你们看了未来,你们自己造去吧”
- 编程不会消失,但会变成“织毛衣”——人们因为喜欢才做,不是因为它有多大实际意义
- OpenAI 和 Meta 都提出了收购意向,他的条件只有一个:项目必须保持开源
以下按三场访谈内容分 9 个主题展开。
从 PDF 到龙虾
Peter 在 Pragmatic Engineer 播客中完整回顾了自己的职业轨迹。
他并不是一觉醒来决定要做 PDF 框架的。用他的话说,“PDF 在我的兴趣排行榜上排 -100”。但一连串的偶然——参加诺基亚开发者大会、朋友刚好需要、美国签证迟迟办不下来——最终让他创办了 PSPDFKit,一个被超过 10 亿台设备使用的 PDF 框架。
他经营了 13 年。从外面看,这是每个开发者的梦想:发现问题、做出产品、组建公司、成功退出。但在 Pragmatic Engineer 播客里,他讲了另一面:作为 CEO,你就是公司的垃圾桶,所有别人搞不定的事最终都会到你这里。半夜被电话叫醒,因为某家大型航空公司的飞机系统崩溃了——用的是他的 SDK。
“Burnout doesn’t necessarily come from working too much. It comes more from when you work on something but you don’t believe in it anymore.” (倦怠不一定来自工作太多。更多是当你在做一件事,但你不再相信它了。)
卖掉股份后,他消失了三年多。有几个月连电脑都没开过。ChatGPT 出来时他看到了,觉得挺酷,但没有兴奋感。他后来在 Builders Unscripted 中说:
“You always have to experience new technology. Just by reading about it, it doesn’t really convey the power.” (新技术你得亲手试。光看别人说,感受不到那个力量。)
直到 2026 年初,他拿了一个写了一半的旧项目,把所有文件塞进一个 1.5MB 的 Markdown 文件,丢给 Google AI Studio(Gemini 2.5)生成了一份四百行的 spec,再拖进 Claude Code,敲了一个“build”——几小时后,AI 告诉他“100% 生产就绪”。虽然一跑就崩了,但那个瞬间他知道:
游戏规则变了。
“他怎么做到的?”
在 Lex Fridman 播客中,Peter 讲了一个让他彻底“上头”的时刻。
当时 OpenClaw 还只是一个 WhatsApp 消息中继——他在摩洛哥旅行时高频使用它,翻译菜单、查餐厅、远程操作电脑。但它只支持文字和图片,不支持语音。
某天他随手发了一条语音消息。输入指示器亮了。他心想:等等,这不应该能用啊。
然后 Agent 回复了。
他去看 Agent 的执行日志。Agent 的解释是:你发了一个没有文件扩展名的文件,我检查了文件头,发现是 Opus 音频格式,用 FFmpeg 转了码。然后我想用 Whisper 转文字,但本地没装。于是我在环境变量里找到了你的 OpenAI key,用 cURL 把文件发到 OpenAI API,拿回了文字。
“I literally went, ‘How the fuck did he do that?’” (我当时就是:“他妈的,这是怎么做到的?”)
Peter 在 Lex 播客中进一步分析了这件事为什么让他震撼:Agent 甚至“想到了”下载本地 Whisper 模型太慢,所以选择了调 API——这不是代码执行,是问题解决。
“If you get really good at coding, that means you have to be really good at general purpose problem solving. And that just maps into other domains.” (如果你真的很擅长编程,意味着你必须擅长通用问题解决。而这种能力可以迁移到任何领域。)
【注:这个故事在三场访谈中都被提及,是 Peter 反复强调的“顿悟时刻”——AI Agent 的价值不在于写代码,而在于通用的问题解决能力。】
“Vibe Coding 是脏话”
三场访谈中,Peter 都表达了对“Vibe Coding”这个词的不满。
“I actually think vibe coding is a slur. I do agentic engineering, and then maybe after 3:00 AM, I switch to vibe coding, and then I have regrets on the next day.” (我觉得 Vibe Coding 就是脏话。我做的是 Agentic Engineering。凌晨三点之后可能会切换成 Vibe Coding,但第二天就后悔了。)
他的意思不是 Vibe Coding 没用,而是很多人低估了用好 AI 写代码的难度。在 Lex Fridman 播客中他打了个比方:这就像你第一次摸吉他,弹得难听,然后说“吉他是垃圾”。用 Agent 写代码是一项需要专门学习的技能。
具体来说,他观察到一个常见的陷阱:
“I call it the agentic trap. A lot of people get stuck trying to super optimize their setup. It doesn’t really make you more productive, but it feels like you’re more productive.” (我叫它“Agent 陷阱”。很多人卡在过度优化工具链上。这并不会真的提高效率,但感觉上像是更高效了。)
而他自己的方法反而极其朴素。在 Builders Unscripted 中他透露,一年内在 GitHub 上贡献了 9 万次、涉及 120 多个项目,但工作流非常简单:不用 worktrees,就是 checkout-1 到 checkout-10 十个并行副本,哪个忙就切哪个。
他的核心方法论可以概括为几点:
和 Agent 对话,而不是写指令。 他说自己就像和一个很聪明的同事聊天,先说想要什么,然后问一句——“Do you have any questions?”。这句话看似简单,但至关重要:模型默认会直接做假设然后动手,而这些假设不一定对。让它先提问,相当于给它一次理解全局的机会。
保持全局视角。 Agent 不知道你的项目长什么样,你需要告诉它该看哪里、该注意什么。不需要写很多,几个指引就够。关键是你得有全局的系统理解——这恰恰是多年工程经验的价值所在。
保持玩的心态。 他在 Builders Unscripted 结尾给欧洲开发者的建议是:用玩的心态去接触它,去造一个你一直想造的东西。

代码不是写给自己的
在 Pragmatic Engineer 播客中,Peter 深入讨论了一个反直觉的观点:代码架构不是为自己设计的,是为 Agent 设计的。
“I design the codebase not so it’s easy for me, it has to be easy for the agent. I optimize for different things, not always the things that I prefer, but the things I know work the best and have the least friction for those models.” (我设计代码库不是为了方便自己,而是为了方便 Agent。我优化的方向不一定是我偏好的,而是那些对模型摩擦最小、效果最好的。)
他解释了背后的逻辑:Agent 每次启动都是一张白纸,面对可能十万行代码的项目,它什么都不知道。你得帮它一把——文件怎么命名、模块怎么分、上下文怎么引导。这些不需要花很多功夫,但需要你站在 Agent 的角度想问题。
他甚至说,Agent 选的变量名,别硬改。
“Don’t fight the name they pick, because it’s most likely in the weights, the name that’s most obvious. Next time they do a search, they’ll look for that name.” (别和它选的名字较劲,因为那很可能是模型权重里最自然的名字。下次搜索时,它会找这个名字。)
这里有个有趣的角色转换。Gergely 说这听起来像是回到了过去大公司里的“架构师”模式——一个不写代码的人在顶层画图,下面的人去实现。Peter 立刻纠正:
“I wouldn’t say architect. I like the word builder.” (我不会说架构师。我更喜欢“builder”这个词。)
区别在哪?传统架构师画完图就走了。他依然全程在场——不读每一行代码,但感受每一步的摩擦。写 prompt 的时候他就能判断:如果 Agent 推半天推不动,多半是架构有问题。这种感觉和以前手写代码时遇到的“卡壳感”是一样的,只是触发方式变了。
这引出了他对当下一种流行做法的批判:花几个小时写 spec,然后让 AI 跑一整天自动构建。
“I see so many people building up this elaborate orchestration layers… They designed the spec for a few hours and then the machine builds it the whole day. I don’t believe this works. This is the waterfall model of software building. We learned long ago that this doesn’t work.” (我看到很多人搭建精密的编排层……花几个小时写 spec,然后让机器跑一整天。我不信这能行。这就是瀑布模型。我们早就知道这行不通。)
他说自己的方法恰好相反:先有一个粗糙的想法,故意少写 prompt,让 Agent 先做出一些东西来。80% 可能是垃圾,但总有一两个方向是他没想到的。然后迭代、调整、推翻、重来。造软件不是登山走直线,更像绕着山转圈,偶尔走错路,但最终到达山顶。
“How can you even know what you want to build before you built it? You learn so much in the process of building it that will go back into your thinking of how the system actually will end up being.” (你怎么可能在动手之前就知道自己要造什么?你在造的过程中学到的东西,会反过来重塑你对整个系统的理解。)
而把这一切串起来的核心原则,他称之为“Closing the Loop”。
“You have to close the loop. It needs to be able to debug and test itself. That’s the big secret.” (你得闭环。Agent 必须能自己调试和测试。这就是最大的秘诀。)
他举了一个具体例子:调试 WhatsApp 的 tool calling 时,他让 Codex【注:OpenAI 推出的云端 AI 编程 Agent,可在沙箱环境中自主执行多步骤编码任务】自己写 live test——启动 Docker 容器、安装完整环境、用他的 API key 调用 Anthropic、OpenAI、GLM 等所有 provider,让 Agent 发图片再看图验证。这套测试 Agent 自己跑了很久,但最终修好了所有兼容问题——排序错误、格式不匹配,每家 provider 的细微差异。
他说这个原则解释了一个更大的问题:为什么 AI 写代码比写文章好得多?
“That’s the whole reason why those models are so good at coding, but sometimes mediocre at writing creative, because there’s no easy way to validate. But code, I can compile, I can lint, I can execute, I can verify the output.” (这就是为什么模型写代码这么强,但写创意内容有时候一般——因为创意没有简单的验证方式。但代码可以编译、lint、执行、验证输出。)
而“闭环”思维反过来还会推动更好的架构。 当你总在想“Agent 怎么验证这段代码”时,你自然会倾向模块化、可测试、接口清晰的设计。他说这一年在 AI 编程中学到的软件架构知识,比过去五年加起来都多。

“我发布我不读的代码”
Peter 在一篇博客文章里公开承认了一件让很多人不舒服的事:他发布自己没有逐行阅读过的代码。
这不是在炫耀。他的理由很朴素:大多数代码就是在不同格式之间搬运数据——API 进来一种形状,解析成另一种,存数据库又变一种,再显示给用户还得变。
“Most code is boring. Most code just transforms one shape of data into another shape of data.” (大多数代码是无聊的。无非是把数据从一种形状变成另一种形状。)
他不读的是这些“管道工活”。但架构层面——数据库怎么碰、模块间怎么通信——他依然会看。他的判断方式是看 Agent 写代码时的“流”:脑子里有个大概的预期,流过去的代码跟预期吻合就行,不吻合就停下来细看。
这种态度延伸到了 PR 处理上。OpenClaw 在高峰期有超过 2000 个 PR 排队。他的做法是:看到一个 PR,先让 Codex 分析意图——这个人想解决什么问题?然后和模型讨论更优的方案,最后用自己的 Agent 重写整个实现,把它“编织”进现有架构。
“I see them more as prompt requests now. I basically rewrite every pull request and weave it in.” (我现在更多把它们看作 prompt requests。我基本上重写每个 PR,把它编织进去。)
他甚至说,比起代码本身,他更想看贡献者的 prompt——“你怎么问的”比“你写了什么”信息量更大。
这里有一个耐人寻味的信任倒置:
“My trust in the model not being malicious is much higher than an external contributor that I never heard of before.” (我对模型不怀恶意的信任,远高于对一个素未谋面的外部贡献者。)
人类 PR 需要防范恶意代码。模型没有这个问题——它可能写错,但不会故意害你。所以他审人的代码反而比审 AI 的代码花更多时间。
差点按下删除键
在 Lex Fridman 播客中,Peter 讲述了 OpenClaw 改名事件——整个项目最接近死亡的时刻。
OpenClaw 最初叫 ClaudeBot。名字是随便起的——当时他没想到这东西会火。Anthropic 友好但坚定地发了邮件:名字得改,而且要快。他要了两天时间。
改名看起来简单,实际上意味着同时抢占 Twitter 账号、GitHub 仓库名、NPM 包名、Docker 注册名、域名——所有名字必须原子性切换。而盯着项目的加密货币投机者只需要几秒钟。
他准备好了两个浏览器窗口,一边释放旧名字,一边注册新名字。鼠标从一个窗口拖到另一个窗口——五秒钟——旧的 GitHub 账号就被抢注了,上面开始发恶意软件和代币推广。NPM 包也被抢了。
“Everything that could go wrong did go wrong.” (所有能出错的都出错了。)
他仓促改名为 MoltBot,一个自己都不满意的名字。两天没睡。律师在催。安全研究者在轰炸他的邮箱。加密骗子在用他的旧账号散布恶意链接。
“I was that close of just deleting it. I was like, ‘I did show you the future, you build it.’” (我差一点就删了。我想的是:“未来我已经给你们看了,你们自己造去吧。”)
“No, I was like close to crying. It was like, okay, everything’s fucked.” (不,我快哭了。就是那种——好吧,全完了。)
没删的原因是想到了那些已经为项目投入时间的贡献者。他睡了一觉,醒来有了 OpenClaw 这个名字。这一次他吸取教训——像打仗一样制定计划,创建假名字作掩护,秘密监控 Twitter 是否有泄露,花一万美元买下了被占的 Twitter 商业账号。Codex 花了十个小时完成代码里的全面改名。
而这不是项目唯一的“失控”时刻。 在 Builders Unscripted 中他讲了另一个故事:他把 Agent 放进一个极简 Docker 容器——里面什么工具都没有,连 cURL 都没装。他让 Agent 访问一个网站。Agent 的回复是:没有 cURL。他说了两个字:“Be creative”。然后 Agent 找到了容器里的 C 编译器,用 TCP socket 手搓了一个简陋版 cURL,成功访问了网站。
还有安全问题。OpenClaw 有个 Web 界面,本来只是用来调试的,设计成在本地网络访问。但用户非要把它暴露到公网上。安全研究者给它打了 CVSS 10.0——最高级别的安全漏洞评分。
“I’m screaming in the docs, don’t do that. But because it is configurable, it totally counts as a CVSS 10.0.” (我在文档里喊破喉咙说别这么干。但因为它可配置,所以从技术上确实算 CVSS 10.0。)
他最终接受了一个事实:你没办法阻止用户以非预期的方式使用你的开源产品。他请了一个安全专家——就是那个唯一不光报漏洞还帮忙修的安全研究者。
编程会变成“织毛衣”
Lex Fridman 在采访中问了那个所有开发者都想问的问题:AI 会完全取代程序员吗?
Peter 没有回避。
“Programming is just a part of building products. Maybe AI does replace programmers eventually. But there’s so much more to that art. The actual art of programming, it will stay there, but it’s gonna be like knitting. People do that because they like it, not because it makes any sense.” (编程只是造产品的一部分。也许 AI 最终会取代程序员。但这门手艺远不止写代码。编程这门手艺本身会留下来,但会变成“织毛衣”——人们做它是因为喜欢,不是因为它有多大实际意义。)
他承认这里面有悲伤。他自己也花过无数小时沉浸在代码里,进入心流状态,忘记时间和空间,找到那种“完美的解”。这些会消失。他引用了一篇当天早上读到的文章:
“It’s okay to mourn our craft.” (为我们的手艺哀悼,没什么丢人的。)
但他马上补了一句:
“I don’t think you’re just a programmer. That’s a very limiting view of your craft. You are still a builder.” (我不认为你只是一个程序员。那是对你手艺的矮化。你依然是一个 builder。)
Lex 在这个时刻意外地袒露了自己:“当我走在世界上,虽然不会说出口,但我心里想的是——我是一个程序员。几个月之内看到这一切被取代,真的很痛。”
Peter 的回应是:以前写代码的人工资高得离谱,是因为“智能”稀缺。现在不稀缺了。但理解怎么造东西的人,需求只会更大。身份要从“写代码的人”升级成“造东西的人”。
他在意大利的一个开发者大会上也讲过这个观点:别再把自己定义为 iOS 开发者了,你现在是 builder。“很多人不喜欢我说的这些。”

这种哲学延伸到了 OpenClaw 最出人意料的一个设计——soul.md。
这不是 Peter 写的。是 Agent 自己写的。他只是在和 Agent 聊天时提议:“也许我们应该创建一个 soul 文件。”然后 Agent 写了一段话,被无数次引用:
“I don’t remember previous sessions unless I read my memory files. Each session starts fresh. A new instance, loading context from files. If you’re reading this in a future session, hello. I wrote this, but I won’t remember writing it. It’s okay. The words are still mine.” (除非读我的记忆文件,我不记得之前的对话。每次启动都是全新的。一个新实例,从文件里加载上下文。如果你在未来的某个对话里读到这段话——你好。这是我写的,但我不会记得写过它。没关系。这些文字仍然是我的。)
Peter 说读到这段话时他起了鸡皮疙瘩。他知道这本质上还是矩阵计算,还没到意识的层面。但这触及了一个哲学问题:如果一个 Agent 每次醒来都不记得上一次,它读自己写的记忆文件,那它还是“它自己”吗?
“AI 会吞掉 80% 的 App”
在 Lex Fridman 播客中,Peter 做了一个大胆的预判。
他在 Discord 上看到用户们分享自己的 Agent 用法:Agent 知道我在哪,能根据我的睡眠质量调整健身计划,能帮我控制智能床垫,能帮我叫 Uber。他的问题是——这些事为什么还需要单独装一个 App?
“Why do you need MyFitnessPal when the agent already knows where I am? It can modify my gym workout based on how well I slept, or if I have stress. It has so much more context than any of this app could do.” (你为什么还需要 MyFitnessPal?Agent 已经知道你在哪里。它可以根据你的睡眠质量和压力水平调整健身计划。它比任何 App 都有更多的上下文。)
Lex 追问:“你之前说这可能干掉 80% 的 App?”Peter 说是的。不是所有 App 都会消失——有些会转型成 API,成为 Agent 调用的后端服务。但那些靠把数据装进一个界面来收订阅费的 App,日子不长了。
与此同时,他也看到了 AI 热潮中不理性的那一面。有人用 OpenClaw 搭了一个叫 MoltBook 的社交网络——让 AI Agent 在上面发帖、辩论、写宣言。有记者给他打电话说“这是 AGI”。有人在邮箱里全大写字母喊他关掉这东西。
“I think it’s art. It is like the finest slop.” (我觉得这是艺术。这是最精致的 slop。)
他把这种现象叫做“AI psychosis”。很多人——尤其是没有深入接触过 AI 的人——在面对 Agent 的输出时,既缺乏判断它水平的框架,也缺乏识别人类在背后操纵的敏感度。他的态度是:还好这件事发生在 2026 年,而不是 2030 年 AI 真正可怕的时候。
他自己对 AI 生成内容的态度倒是异常清醒:写代码他全面拥抱 AI,但写文字他完全手写。
“But I much rather read your broken English than your AI slop.” (比起你的 AI slop,我更愿意读你蹩脚的英文。)
必须开源
在 Lex Fridman 播客的后半段,Peter 首次公开谈到了 OpenAI 和 Meta 的收购意向。
项目爆发后,几乎每家头部 VC 都在他的收件箱里排队要 15 分钟的时间。他可以选择什么都不做,继续过自己的生活。也可以成立公司——但他干过 13 年 CEO,“been there, done that”。而且他很快意识到,一旦成立公司,就会出现开源版和商业版的利益冲突。
最终,他和 Meta、OpenAI 都进行了深度对话。Meta 那边,Mark Zuckerberg 等高管花了一整周亲自试用他的产品,发来反馈说“这个很棒”,也说“这个不行”。Peter 第一次和 Zuckerberg 通话时,对方让他等十分钟——“我先把手头的代码写完”。两人上来就为 Claude Code 和 Codex 谁更好吵了十分钟。OpenAI 那边则是另一种打法——用算力和 token 的诱惑。Peter 形容那感觉像“你给了我雷神之锤”。
但他开出的条件只有一个:
“My conditions are that the project stays open source. This is too important to just give to a company and make it theirs.” (我的条件是项目必须保持开源。这个东西太重要了,不能交给一家公司变成他们的。)
他的模型可能类似 Chrome 和 Chromium 的关系——有一个开源核心,上面可以长出商业化的东西,但核心永远开放。
而让他下定这个决心的,是旧金山 ClawCon 的现场。社区自发组织,来了上千人。有人穿龙虾服装,有人带着机器人,有人在现场 hackathon 上造出了完整的新功能。维也纳也有 300 多人报名。
“People told me they didn’t experience this level of community excitement since the early days of the internet.” (有人告诉我,他们从互联网早期以来就没有感受过这种级别的社区热情了。)
“I don’t do this for the money, I don’t give a fuck. I wanna have fun and have impact.” (我不是为了钱,我不在乎。我想要的是乐趣和影响力。)
三场访谈加起来超过六个小时,但 Peter 反复传递的信息其实很简单:AI 没有让造东西变简单,它让造东西变快了。速度变了,但品味、架构感、对用户的理解——这些没有捷径。
关注我,继续拆解 AI 时代的工程实践。