软件研发的工业革命:我们已经走到哪里,还有多远

TL;DR:Block 裁员近半股价飙升,网易跟上——这不是周期性成本压缩,是软件研发生产关系的第一次结构性重组。我们已经有了执行层,正在补齐协调层,还缺组织协议。2027 年,工程师这个职业会分裂成两种,中间层会大幅压缩。

两个新闻,一个信号

Block(前身 Square)宣布大规模裁员,股价当天大幅上涨。Jack Dorsey 在公开信里说:AI 大幅提升了团队效率,未来一年大多数科技公司都会做类似的调整。

几乎同期,国内网易也开始了新一轮裁员。

大多数人读到这里的反应是:又一波裁员潮,经济不好,公司降本。

但这次不一样。

工业革命时纺织工人失业,不是因为工厂不需要人,是因为一台蒸汽织布机能做 20 个工人的活。工厂的产出没有下降,甚至在上升——只是完成同样产出需要的人变少了。

Block 的股价大幅上涨说明市场不认为这是衰退信号,而是效率信号。这是一个关键区别:裁员的同时,产出预期在上升。

这不是周期性裁员,是研发生产关系的第一次结构性重组。

我们已经具备了什么

理解这场变革,需要先看清楚我们已经站在哪里。研发能力的 AI 化,目前已经形成三个层次。

执行层:已经成熟

单个 AI Agent 写代码这件事,已经不是实验室里的玩具了。

据报道,OpenAI 内部工程团队在数月内实现了绝大多数新代码由 AI 生成,人均日均合并 PR 数达到普通团队的数倍。Stripe 的 Minions 系统据工程师公开演讲透露,每周自动处理大量 PR,覆盖真实生产代码库。这些数字的细节有待核实,但方向是清晰的。

更直观的证据是独立开发者群体。他们早就全栈了——不管前端后端、不管移动端 Web 端,一个人全包。AI 出现之前,这是少数人的特权;AI 出现之后,这是越来越多人的日常。

Claude Code、Cursor、Copilot 这类工具已经是很多工程师的标配。单 Agent 执行层,成熟了。

协调层:正在成形

执行层解决了”AI 能写代码”,协调层要解决”AI 能组团干活”。

Multi-agent 框架——让多个 AI 扮演不同角色、分工协作——已经从概念变成可操作的工具。OpenAI、Anthropic 都在这个方向发力,各种框架层出不穷。

与此同时,Harness Engineering 作为底层基础设施开始被认真对待。它的核心思路是:给 AI Agent 装上”马具”——架构约束、执行计划、跨会话状态追踪——让 AI 团队在约束下可靠执行,而不是每次都靠提示词临时管教。

部分公司已经在做 B 端项目的全栈化探索:一个工程师加上 AI 团队,交付以前需要 5-10 人才能完成的项目。这不是普遍实践,但先行者已经在跑。

基础设施层:还在建设中

执行层和协调层之下,有三个基础设施问题还没有完整的工程化答案:

  • 跨会话状态持久化:AI 每次新开会话记忆清零,复杂任务怎么跨多个会话保持进度?
  • Agent 间协调协议:多个 Agent 并行工作时,怎么交接状态、怎么处理冲突?
  • 可观测性:你根本不知道 AI 团队在干什么,哪一步做了什么决策,花了多少成本,哪里最容易出错。

这三个问题不解决,AI 团队就是一个可靠性存疑的黑盒。

还缺什么:三个关键板块

从现在到”AI 团队真正可靠地替代人类团队完成工程级任务”,还有三个缺口没有补齐。

缺口一:信任机制

当前 AI Agent 的错误率决定了人必须在关键节点频繁介入。

一个简单的数学:10 步任务,每步有 5% 的错误概率,整个任务成功完成的概率只有 60%。步骤越多,累积误差越大。这不是模型不够聪明,是概率问题。

要让 AI 真正”组成团队”,需要的不只是每个 Agent 更准确,而是 Agent 之间能互相 review、互相纠错——像人类团队的 code review 一样,不靠人工逐步盯着。

这个能力有雏形:Claude 的 extended thinking、o3 的自我验证机制。但把这些能力工程化成一套 Agent 互审协议,目前还没有成熟的解决方案。

缺口二:领域知识的机械化

AI 能写通用代码,但不知道你们公司的业务规则、历史技术债、不成文的约定、以及”为什么当年要这么设计”。

Harness Engineering 解决了一部分——把约束写进 CLAUDE.md,让 AI 在执行时自动遵守。但这只是冰山一角。

真正的问题是:怎么把一个资深工程师 10 年积累的判断力,转化成 AI Agent 可以执行的约束系统?

这不是写几条规则就能解决的。资深工程师的价值在于他知道哪些规则在什么情况下可以打破、哪些边界案例需要特殊处理、哪个历史决定留下了什么坑。这些判断是隐性知识,很难被显式化。

目前能做的最小可行路径是:把 oncall runbook 数字化、把 code review checklist 编码成 CLAUDE.md 规则、把高频错误模式记录成约束文档。这是起点,不是终点。

这是接下来 2 年最难的工程问题,也是最有价值的工程问题。

缺口三:组织协议

人类工程团队有一套运转了几十年的协作协议:Scrum、code review 文化、oncall 轮值、架构评审、事后复盘。这些协议不是偶然形成的,是经过无数次失败沉淀下来的。

AI 团队需要类似的协议,但目前几乎没有人认真设计过。

现在大多数 multi-agent 系统是最简单的拓扑:主 Agent 分配任务,子 Agent 执行。这是一个上下级结构,像流水线,不像团队。

人类团队里最有价值的协作,发生在平等的同行之间互相质疑:一个工程师说”我觉得这个设计有问题”,另一个工程师说”你说的对,但还有一个你没考虑到的边界情况”。这种对等的互相挑战,是现有 multi-agent 框架里最缺失的部分。

未来全景:畅想 2027

以下是我的判断。2027 年回来对账。

预测一:工程师这个职业会分裂成两种

中间层——执行型工程师,写 CRUD、做集成、跑流程、处理重复性需求——这部分工作会被 AI Agent 大量替代。不是消失,是大幅压缩。

剩下的会分化成两个方向:

Harness Architect(暂时没有正式名字):设计 AI 团队的工作框架,定义约束系统,管理 Agent 协议,确保 AI 团队的输出质量和一致性。这是今天”技术负责人”进化出来的角色。他的核心能力不是写代码,是设计让 AI 可靠工作的系统。

Domain Expert:提供 AI 无法自动获取的领域知识和最终判断。这是今天”资深工程师”进化出来的角色。他的核心价值是那 10 年积累的隐性判断力——知道什么情况下规则可以打破,知道这个系统的历史和边界。

这两个角色都不会被 AI 替代,因为他们的价值恰恰是 AI 最缺乏的东西:系统性设计能力和深度领域判断力。

预测二:B 端项目全栈化会成为标配

现在做 B 端项目全栈化探索的公司是先行者,2 年后这会是 B 端项目的默认工作方式。一个工程师加上 AI 团队,交付完整的 B 端产品。

C 端的全栈化不会全面铺开——用户量大、并发高、体验要求极致,这些场景对工程质量的要求不是 AI 现阶段能完全覆盖的。但在新项目、小团队、创业公司里,C 端全栈化也会有局部突破。

预测三:第一批”AI 原生”公司会出现

不是用 AI 辅助现有流程,而是从第一天就按照”10 人团队 + AI 团队”的方式设计组织架构、研发流程、产品节奏。

这类公司的单位产出会比传统公司高 5-10 倍。Block 和 Stripe 是大公司里的先行者,但真正的 AI 原生公司还没大规模出现。

它的原型,其实就是今天的独立开发者:一个人,全栈,AI 加持,做出以前需要一个小团队才能做的产品。把这个模式放大到 10 人,就是 AI 原生公司的雏形。

预测四:Harness Engineering 会成为一个正式的工程学科

就像 DevOps 从一个实践变成了一个岗位,Harness Engineering 也会走这条路。

2 年内会有专门的工具链、认证体系、最佳实践文档。而构建和治理这套工具链的,正是预测一里说的 Harness Architect——中间层压缩释放出来的工程师,一部分会进化成这个角色,去建设这个新学科的基础设施。

给你的一个问题

不说”你应该学 AI”,这是废话。

一个具体的问题:你现在做的工作,哪些是”执行型”的,哪些是”判断型”的?

执行型:有标准答案,步骤可重复,换一个人(或一个 Agent)做结果差不多。

判断型:需要领域知识、历史背景、对边界情况的直觉,换一个人做结果会有显著差异。

执行型的工作会被压缩,判断型的工作会被放大。

不管你在大公司还是小团队,这个自我评估比任何职业建议都实用。风在哪个方向吹,你自己知道。


本文是 Harness Engineering 系列的第二篇。第一篇《AI 写代码写到一半就出轨?你缺的不是更好的提示词,是 Harness》讲清楚了 Harness Engineering 是什么、为什么需要它、以及如何从零开始落地。