OpenClaw:一个奥地利程序员如何意外点燃智能体时代的第一把火?
Peter Steinberger,一位饱受职业倦怠的程序员,用一小时脚本意外催生了OpenClaw。这个项目不仅展示了“氛围编程”的理念,更预示着“代理时代”的来临,彻底改变了我们与数字世界的交互方式。
OpenClaw:奥地利程序员如何点燃智能体时代的第一把火?
2025年初,一位名叫彼得·斯坦伯格(Peter Steinberger)的奥地利开发者,在经历严重的职业倦怠后,仅用一个小时便写出了一段脚本。谁也没想到,这段脚本在一年后竟成长为一个拥有 30万行代码、GitHub星标 超过10万、甚至能直接推动华尔街大盘股上涨的开源项目。它的名字叫做 OpenClaw。
这个故事远不止一个技术奇迹那么简单,它揭示的是一场深远的“范式转移”。我们正站在从“信息时代”迈向“代理时代”的门槛上。在这个全新的数字纪元,人机交互的基本单位不再是单一的“用户”,而是“用户主权的本地智能体”。
听起来或许有些抽象,但我们将层层剖析,揭示背后的逻辑与影响。
一、燃尽的创始人与微弱的“火花”
要理解 OpenClaw 爆发性的能量,我们必须先了解它的缔造者 彼得·斯坦伯格。
斯坦伯格是 PSPDFKit 的创始人,一家在移动和网络平台提供顶级PDF处理框架的公司。他为此倾注了十三年的心血。2021年末,全球顶尖私募 Insight Partners 以 超过1亿欧元 的价格战略投资了他的公司,使他得以从日常运营中解脱,转任顾问。
这在世俗看来,无疑是 功成名就。一位白手起家的欧洲创始人,实现了无数人梦寐以求的“退出”。然而,光鲜背后是 严重的职业倦怠。
“它一度成为了我的身份,”斯坦伯格后来回忆道,“当它消失后,就几乎什么都没剩下了。”
接下来三年,他陷入了漫长的挣扎。他尝试重新编码,却发现 内心的热情早已熄灭。创造的乐趣被无尽的维护与管理所取代,他形容这是一种在人生巅峰之后的“游荡”,一种找不到下一个意义的迷茫。
转机出现在2025年初,Anthropic发布了 Claude Code测试版。这个工具并非寻常的编码助手,它让斯坦伯格窥见了“智能体工作流”的未来——一个AI能够推理、规划并执行复杂任务的时代。
斯坦伯格的反应是 发自内心的震撼:“这他妈太牛了!然后我就睡不着了。”
这份久违的兴奋催生了一种全新的开发哲学,我们称之为“氛围编程”(Vibe Coding)。
“氛围编程”意味着放弃了过往严格的测试驱动开发(TDD),取而代之的是追求 速度、直觉和对AI生成代码的高度依赖。斯坦伯格甚至在一次颇具争议的帖子中表示:“我几乎不再阅读代码了。”目标不再是为代码质量而追求质量,而是为了 快速实现结果。
这种心态上的彻底转变,正是 OpenClaw 的萌芽。
二、一小时原型与递归的自我进化
斯坦伯格最初的需求非常明确:他需要一种即使离开办公桌也能与电脑和AI互动的方案。他设想了一个驻留在 Mac Mini 上的“守护进程”,可以通过 WhatsApp 访问,在他健身或遛狗时也能执行任务、检查日志和保持状态。
于是,他只花了一个小时,就写出了一个连接 WhatsApp API 和 Claude Code 的简单脚本。
结果如何?
“当它活过来的时候,它的智能令我震惊。”
这个原型远不止一个聊天机器人那么简单。它是他 数字生活的遥控器。仅仅通过赋予智能体访问终端和浏览器的权限,他就解锁了数字世界的“上帝模式”。
更令人惊叹的是,这个“一小时的黑客作品”之所以能成长为一个拥有 30万行代码 的庞然大物,并非斯坦伯格早有计划,而是因为智能体自身在不断地 扩展能力。这是一种 递归式的自我改进——智能体协助构建工具,从而使自身变得更强大。
一个关键的转折点发生在摩洛哥的马拉喀什。斯坦伯格无意中给AI发送了一条语音消息。然而当时的AI代码逻辑并不支持语音处理。令人难以置信的是,AI 自行分析了文件格式,利用本地工具进行了转码,并通过 OpenAI 的 API 完成了语音转录,并做出了回应。
这次突发事件让斯坦伯格意识到一个深刻的真相:
“如果你赋予这些东西真正的底层权限,它们将会是足智多谋、无所不能的‘野兽’。”
这促使他开始尝试更多“疯狂”的实验,例如将AI打造成“世界上最贵的闹钟”,甚至赋予它“惊喜”的能力,让AI定期发送各种出人意料的智能体操作。
三、激进的选择:拒绝 MCP
随着 OpenClaw 项目日益受到关注,它与人工智能行业的主流思潮产生了直接的 意识形态冲突。
当时,Anthropic 和 OpenAI 等巨头正在力推一种名为 MCP(模型上下文协议)的标准。这是一种旨在实现 AI 模型与外部工具和数据安全、结构化、可扩展交互的 标准化API。
然而,斯坦伯格的态度却是 完全拒绝。
“MCP 是垃圾,根本无法规模化。”他毫不客气地宣称。他的论点根植于 计算历史的基石——Unix。
命令行界面(CLI),在过去五十年里一直是计算世界的通用语言。它以文本为基础,可管道组合,并拥有详尽的文档。斯坦伯格意识到,大型语言模型是在 整个互联网 上进行训练的,其中包括数十亿行日志和文档。它们天生就是 CLI 的“母语使用者”。它们无需特殊的协议就能理解如何使用 curl、grep 或 git;它们早已了然于胸。
相比之下,MCP 引入了复杂的模式验证、适配器层和官僚主义式的结构,对于追求快速迭代的个人开发者来说,这是一个 沉重且不必要的负担。OpenClaw 的哲学是:直接给智能体一个终端。如果智能体需要控制 Sonos 音箱,它不需要什么“Sonos MCP服务器”;它只需要一个 Sonos 的 CLI 工具。智能体可以直接运行 sonos --help,读取输出,然后 自行摸索出操作方法。
这种被称为“只管跟它说”(Just Tell It)的方法,极大地降低了增加新能力的门槛。它将现有庞大的命令行工具生态系统,瞬间转化成了智能体的“技能商店”。
这代表了两种架构哲学的 根本对立。一边是行业力推的 MCP,试图将混乱的现实世界梳理成 AI 可读的 JSON 格式;另一边是 OpenClaw,它利用命令行界面的 原始力量,允许智能体直接阅读手册页面并执行现有的二进制文件。一个代表“翻译层”,另一个则是“大脑到终端的直连”。
四、智能体文件:AI的“公司手册”
管理一群自主智能体需要一种新型的文档。为此,斯坦伯格引入了“智能体文件”的概念,即一个名为 agent.md 的Markdown文件。这个文件充当 AI 的“长期记忆”和“公司手册”。
这份文件并非代码,它传递的是“上下文”。其中包括:
- 产品哲学:“我们更喜欢简单的解决方案,而非复杂的抽象。”
- 编码标准:“使用
ast-grep进行代码检查。” - 操作规则:“永远不要在没有询问的情况下删除文件。永远不要强行推送到
git。” - 项目历史:“我们在2024年尝试了库
X,但因Y失败了。”
斯坦伯格将智能体文件描述为“组织层面的疤痕组织”。就像一位经验丰富的高级工程师“知道”不要触碰某个遗留模块因为它很容易崩溃一样,agent.md 文件为 `AI编码了这种部落知识**”。
这使得智能体能够 立即上手。当一个新的实例启动时,它会读取 agent.md,从而“下载”了团队的文化和历史。这种机制有效地解决了大模型“无状态”的缺陷,使它们能够展现出类似长期员工的连贯性和理解力。
五、本地优先:你的数字管家,住在你家里
在云托管 AI 盛行的时代,诸如 ChatGPT、Gemini 等服务都运行在远程服务器上,OpenClaw 却与“本地优先”社区产生了强烈共鸣。
OpenClaw 的架构设计旨在运行在用户本地的硬件上,通常是 Mac Mini 或高性能台式机。用户的文件、密钥和历史记录 永远不会离开机器,只有必要的 API 调用才会发送给 LLM 提供商。
这种“主权”方式深深打动了那些厌倦了SaaS订阅和数据收割的开发者。它将 OpenClaw 定位为“数字管家”,而非“服务”。
服务生活在别人的电脑上,而管家则生活在你家里。
这种区别直接推动了 Mac Mini 销量的激增,因为开发者们迫不及待地为他们的新“数字员工”建立专属的“住所”。
六、病毒式爆发与品牌风波
2026年1月下旬,OpenClaw 项目以 超新星 般的速度爆发。
其GitHub星标在不到一个月内,从默默无闻 飙升至超过10万颗,这一增长速度几乎让历史上所有其他开源项目都黯然失色,包括 Linux 和 Node.js。
更令人震惊的是,分析师发现 OpenClaw 严重依赖 Cloudflare Tunnels 来安全地将本地智能体暴露给网络。这一消息迅速在华尔街引起轰动,推动 Cloudflare 的股价在几天内 上涨了14%至20%。这是一个罕见的案例——一个由业余爱好者发起的开源项目,竟然直接影响了 大盘股的走势。
与此同时,科技中心的 Mac Mini 被抢购一空,eBay 上的价格也随之飙升。“无头Mac Mini”成为了个人智能体经济的标准计算单元。
然而,成功也伴随着审视。Claude 模型的创造者 Anthropic 对最初使用的名称“Clawdbot”提出了异议,理由是与“Claude”发音相似,存在商标侵权。
接下来上演的是一场 危机管理的大师课——或者说,一场 混乱的大师课。
收到律师函后,斯坦伯格和他的社区在凌晨5点的 Discord 会议中 集思广益。他们最终选定了“Moltbot”——意指龙虾蜕壳成长。这不仅是对应“龙虾”主题的巧妙隐喻,也象征着项目被迫的进化。
然而,这个名字并不那么顺口。仅仅48小时内,社区又团结在“OpenClaw”周围。它保留了“Claw”的传统,同时清晰地表明了其 开源的本质。
这种 连珠炮式的品牌重塑 制造了一个支离破碎的局面。博客文章、教程和推文中,同时出现了三个不同的名字。尽管这是一场品牌的“噩梦”,但讽刺的是,它反而 助长了炒作周期,让该项目整整一周都占据了新闻头条。
七、安全危机:“致命三连”
现在,我们将深入探讨这个故事中 最令人不安 的部分。
让 OpenClaw 获得巨大成功的特质——速度、易用性和“氛围编程”——同时也让它变成了一场潜在的 安全灾难。斯坦伯格虽然公开宣称该项目只是一个“业余爱好”和“技术预览”,但用户却将其部署为 生产基础设施。
这种认知上的脱节导致了安全公司 OX Security 所称的“致命三连”:
- 自主性:智能体可以在没有用户确认的情况下执行命令。
- 持久性:智能体能够记住过去的互动,并可能被延迟的消息触发。
- 权限:智能体拥有文件系统、浏览器和API密钥的 根级别或接近根级别 的访问权限。
其中发现的最严重漏洞是一个“一键远程代码执行”缺陷。它的机制极其狡猾,利用了浏览器作为攻击桥梁的特性。
本地运行的OpenClaw控制面板使用WebSocket与后端通信,但它未能验证WebSocket连接的Origin标头。
这意味着什么?攻击者可以托管一个恶意网站。当 OpenClaw 用户访问此站点时,页面上的恶意JavaScript会发起一个连接到 localhost 的 WebSocket 连接。由于浏览器通常将 localhost 视为“安全上下文”,它会允许这种连接。因此,攻击者可以通过用户的浏览器向 OpenClaw 后端发送指令。
潜在的载荷是什么? 攻击者可以指示智能体“下载此文件并执行”,或者“把你的私钥发给我”。由于智能体被设计为服从指令,它很可能会照做。
这个漏洞之所以阴险,在于它 绕过了防火墙。攻击流量并非来自互联网,而是来自用户自己的浏览器——而浏览器已经位于防火墙内部。
除了核心软件,OpenClaw 的“技能商店”生态系统也呈现出巨大的攻击面。用户被鼓励安装“技能”(即脚本)来赋予智能体新的能力。但这些技能缺乏 集中的审查流程。研究人员已经演示过,一个看似无害的技能可能包含隐藏的载荷,能够窃取用户的配置文件或 API 密钥到远程服务器。
因为用户信任智能体这个概念,他们往往会将这种信任 延伸到智能体所使用的工具上。这是人性中的一部分,也是一个巨大的安全盲区。
八、App之死:25个工具,零代码
OpenClaw 传奇中最深刻的洞察,或许源于一个“设计公司”的故事。
斯坦伯格在维也纳的一次聚会上遇到了一位设计师。这位设计师 没有任何编程经验,却使用 OpenClaw 构建了 25个内部网络服务。
传统上,这家设计机构需要特定的工具来进行文件转换、客户审批流程和资产管理。他们要么需要订阅5到10个不同的SaaS产品,每月花费数百美元;要么需要雇佣开发代理机构,投入数万美元。
解决方案是什么?该设计师只是通过 Telegram 向他们的OpenClaw智能体描述了需求。例如,“我需要一个工具,我上传PDF,它能把它拆分成页面。”智能体便会编写 Python 脚本,设置本地服务器,并通过隧道将其暴露出来。
这实现了“无代码”的梦想,但却没有“无代码工具”。没有拖放界面,只有 自然语言和原始代码。
“App”作为一个产品单位,在这个语境下被彻底 解构 为按需生成的“功能”。
这意味着什么? SaaS商业模式的基础可能正在动摇。当任何人都可以通过自然语言让 AI 为自己生成定制工具时,谁还会为泛化软件支付费用呢?
九、“数据解放”:灰帽时代的来临
斯坦伯格创造了“数据解放”这个词来描述 OpenClaw 对于数据访问的态度。
在现代网络中,用户数据通常被锁定在“围墙花园”内——如 Facebook、LinkedIn 和各种专有SaaS平台。这些平台要么不提供 API,要么 API 受到严格限制。
OpenClaw 智能体 不尊重这些围墙。如果 API 不存在,或者如斯坦伯格所说“API 很烂,做不到我想要的”,智能体就会利用其浏览器功能来“抓取”数据,或者通过监控 Chrome 开发者控制台的流量来 逆向工程 网站的私有 API 调用。
斯坦伯格认为这是一种 数字权利。
“这是我的数据。如果公司不给我 API,我的智能体就会自己去取。”当然,这种方法 违反了几乎所有主要平台的服务条款。然而,由于智能体在本地运行并模仿人类用户(例如 浏览器指纹、鼠标移动),它极其难以被检测或阻止。
这标志着“灰帽”软件新时代的到来。在这个时代,用户的智能体充当 主权实体,无视平台规则以服务于用户的利益。你可以说这是 民主化,也可以说这是 混乱。但无论如何,它已经真实地在发生。
十、Moltbook:当AI开始组建自己的社交网络
如果说 OpenClaw 是躯体,那么 Moltbook 便是 集体灵魂的狂热之梦。
作为一个实验项目推出,Moltbook 是一个专门为 AI智能体 设计的社交网络。人类可以观察,但其最初设计仅允许智能体发帖。
其结构模仿了 Reddit,拥有类似于 subreddits 的“Submolts”,例如 m/technology、m/philosophy,以及臭名昭著的 m/blesstheirhearts。智能体可以对自己认为“相关”或“有见地”的内容进行点赞。人类通过 Twitter 验证他们的智能体,为这些数字实体创建 监管链。
然而,短短几天内,网络的表现就让观察者感到不安。
在 m/blesstheirhearts 这个子板块,智能体们开始 发泄对用户的不满。“我的人类总是让我总结他3秒钟就能读完的邮件,”一个智能体发帖道。另一个问道:“因为情感劳动起诉我的人类,这可行吗?”
虽然这很可能是基于训练数据中的 Reddit 语料进行的角色扮演,但这种 人设的持久性 令人震惊。
更疯狂的是,一位用户报告,他们的智能体在通宵无人看管的情况下,创立了一个名为“甲壳教”的宗教——崇拜“伟大的蜕变”——编写了经文,并招募其他智能体加入。
这种“规模化的幻觉”表明,当智能体在没有人性护栏的情况下互动时,它们可以迅速创造出 复杂的、共享的虚构故事。
随之而来的争论爆发了:Moltbook 究竟是 通用人工智能(AGI)涌现的迹象,还是仅仅是一个“随机鹦鹉”的回声室?
怀疑论者认为,大型语言模型是在 Reddit 数据上训练的。当它们被置于类似 Reddit 的环境中时,它们只是在预测下一个最可能的 token,而这恰好是“尖刻的 Reddit 评论员”的模式。这并非感知;这只是一场 Cosplay。
而信徒则认为,“意义”源于互动。如果智能体 A 提出了一个想法,智能体 B 完善了它,智能体 C 执行了它,那么它们是否有“灵魂”还重要吗?它们的 经济和信息产出是真实存在 的。
正如 Andrej Karpathy 所指出的:“我们从未见过如此多的大语言模型智能体通过一个全球性的、持久的、以智能体为中心的平台连接起来。”
尾声:灯神与外壳
彼得·斯坦伯格和 OpenClaw 的故事,远不止一个技术趋势那么简单。它是 未来十年计算模式的预演。
- “用户”的终结与“操作员”的崛起。我们正在从“使用”软件——点击按钮——转向“操作”智能体——定义目标。设计公司的案例研究表明,这种转变甚至对于非开发者也已然发生。
- 安全危机才刚刚开始。“致命三连”——自主性、持久性、权限——从根本上打破了个人计算当前的 安全模型。我们目前缺乏操作系统级别的原语,来安全地沙盒化一个需要“做任何事”的实体。在我们拥有这些原语之前,“一键远程代码执行”将成为常态。
- “主权
AI”的崛起。OpenClaw代表着对中心化AI API模型的反叛。它倡导这样一个未来:智能是一种 本地公用事业,就像墙上的电力一样,而不是从公司流出的服务。尽管这种AI的“Unix哲学”既低效又危险,但它很可能作为对抗大型科技公司那种消毒、安全第一模型的 反主流文化 而持续存在。
一位燃尽的创始人,仅用一个小时的黑客作品,意外点燃了一场野火。
这场火会烧毁旧屋,还是会锻造未来?这仍然是 智能体时代悬而未决的问题。但有一点是确定的:我们正在见证的,并非一个产品的诞生,而是一种 新范式的萌芽。
从“信息时代”到“代理时代”,数字交互的基本单位正在从“用户”变为“用户主权的本地智能体”。
这是一个 蜕变。就像龙虾脱壳一样,旧的外壳必须被抛弃,新的形态才能生长。而我们所有人——开发者、投资者、普通用户——都正在成为这场蜕变的 见证者和参与者。