软件研发的工业革命：我们已经走到哪里，还有多远

发布： 2026-03-23 分类：技术阅读：

TL;DR：Block 裁员近半股价飙升，网易跟上——这不是周期性成本压缩，是软件研发生产关系的第一次结构性重组。我们已经有了执行层，正在补齐协调层，还缺组织协议。2027 年，工程师这个职业会分裂成两种，中间层会大幅压缩。

两个新闻，一个信号

Block（前身 Square）宣布大规模裁员，股价当天大幅上涨。Jack Dorsey 在公开信里说：AI 大幅提升了团队效率，未来一年大多数科技公司都会做类似的调整。

几乎同期，国内网易也开始了新一轮裁员。

大多数人读到这里的反应是：又一波裁员潮，经济不好，公司降本。

但这次不一样。

工业革命时纺织工人失业，不是因为工厂不需要人，是因为一台蒸汽织布机能做 20 个工人的活。工厂的产出没有下降，甚至在上升——只是完成同样产出需要的人变少了。

Block 的股价大幅上涨说明市场不认为这是衰退信号，而是效率信号。这是一个关键区别：裁员的同时，产出预期在上升。

这不是周期性裁员，是研发生产关系的第一次结构性重组。

我们已经具备了什么

理解这场变革，需要先看清楚我们已经站在哪里。研发能力的 AI 化，目前已经形成三个层次。

执行层：已经成熟

单个 AI Agent 写代码这件事，已经不是实验室里的玩具了。

据报道，OpenAI 内部工程团队在数月内实现了绝大多数新代码由 AI 生成，人均日均合并 PR 数达到普通团队的数倍。Stripe 的 Minions 系统据工程师公开演讲透露，每周自动处理大量 PR，覆盖真实生产代码库。这些数字的细节有待核实，但方向是清晰的。

更直观的证据是独立开发者群体。他们早就全栈了——不管前端后端、不管移动端 Web 端，一个人全包。AI 出现之前，这是少数人的特权；AI 出现之后，这是越来越多人的日常。

Claude Code、Cursor、Copilot 这类工具已经是很多工程师的标配。单 Agent 执行层，成熟了。

协调层：正在成形

执行层解决了”AI 能写代码”，协调层要解决”AI 能组团干活”。

Multi-agent 框架——让多个 AI 扮演不同角色、分工协作——已经从概念变成可操作的工具。OpenAI、Anthropic 都在这个方向发力，各种框架层出不穷。

与此同时，Harness Engineering 作为底层基础设施开始被认真对待。它的核心思路是：给 AI Agent 装上”马具”——架构约束、执行计划、跨会话状态追踪——让 AI 团队在约束下可靠执行，而不是每次都靠提示词临时管教。

部分公司已经在做 B 端项目的全栈化探索：一个工程师加上 AI 团队，交付以前需要 5-10 人才能完成的项目。这不是普遍实践，但先行者已经在跑。

基础设施层：还在建设中

执行层和协调层之下，有三个基础设施问题还没有完整的工程化答案：

跨会话状态持久化：AI 每次新开会话记忆清零，复杂任务怎么跨多个会话保持进度？
Agent 间协调协议：多个 Agent 并行工作时，怎么交接状态、怎么处理冲突？
可观测性：你根本不知道 AI 团队在干什么，哪一步做了什么决策，花了多少成本，哪里最容易出错。

这三个问题不解决，AI 团队就是一个可靠性存疑的黑盒。

还缺什么：三个关键板块

从现在到”AI 团队真正可靠地替代人类团队完成工程级任务”，还有三个缺口没有补齐。

缺口一：信任机制

当前 AI Agent 的错误率决定了人必须在关键节点频繁介入。

一个简单的数学：10 步任务，每步有 5% 的错误概率，整个任务成功完成的概率只有 60%。步骤越多，累积误差越大。这不是模型不够聪明，是概率问题。

要让 AI 真正”组成团队”，需要的不只是每个 Agent 更准确，而是 Agent 之间能互相 review、互相纠错——像人类团队的 code review 一样，不靠人工逐步盯着。

这个能力有雏形：Claude 的 extended thinking、o3 的自我验证机制。但把这些能力工程化成一套 Agent 互审协议，目前还没有成熟的解决方案。

缺口二：领域知识的机械化

AI 能写通用代码，但不知道你们公司的业务规则、历史技术债、不成文的约定、以及”为什么当年要这么设计”。

Harness Engineering 解决了一部分——把约束写进 CLAUDE.md，让 AI 在执行时自动遵守。但这只是冰山一角。

真正的问题是：怎么把一个资深工程师 10 年积累的判断力，转化成 AI Agent 可以执行的约束系统？

这不是写几条规则就能解决的。资深工程师的价值在于他知道哪些规则在什么情况下可以打破、哪些边界案例需要特殊处理、哪个历史决定留下了什么坑。这些判断是隐性知识，很难被显式化。

目前能做的最小可行路径是：把 oncall runbook 数字化、把 code review checklist 编码成 CLAUDE.md 规则、把高频错误模式记录成约束文档。这是起点，不是终点。

这是接下来 2 年最难的工程问题，也是最有价值的工程问题。

缺口三：组织协议

人类工程团队有一套运转了几十年的协作协议：Scrum、code review 文化、oncall 轮值、架构评审、事后复盘。这些协议不是偶然形成的，是经过无数次失败沉淀下来的。

AI 团队需要类似的协议，但目前几乎没有人认真设计过。

现在大多数 multi-agent 系统是最简单的拓扑：主 Agent 分配任务，子 Agent 执行。这是一个上下级结构，像流水线，不像团队。

人类团队里最有价值的协作，发生在平等的同行之间互相质疑：一个工程师说”我觉得这个设计有问题”，另一个工程师说”你说的对，但还有一个你没考虑到的边界情况”。这种对等的互相挑战，是现有 multi-agent 框架里最缺失的部分。

未来全景：畅想 2027

以下是我的判断。2027 年回来对账。

预测一：工程师这个职业会分裂成两种

中间层——执行型工程师，写 CRUD、做集成、跑流程、处理重复性需求——这部分工作会被 AI Agent 大量替代。不是消失，是大幅压缩。

剩下的会分化成两个方向：

Harness Architect（暂时没有正式名字）：设计 AI 团队的工作框架，定义约束系统，管理 Agent 协议，确保 AI 团队的输出质量和一致性。这是今天”技术负责人”进化出来的角色。他的核心能力不是写代码，是设计让 AI 可靠工作的系统。

Domain Expert：提供 AI 无法自动获取的领域知识和最终判断。这是今天”资深工程师”进化出来的角色。他的核心价值是那 10 年积累的隐性判断力——知道什么情况下规则可以打破，知道这个系统的历史和边界。

这两个角色都不会被 AI 替代，因为他们的价值恰恰是 AI 最缺乏的东西：系统性设计能力和深度领域判断力。

预测二：B 端项目全栈化会成为标配

现在做 B 端项目全栈化探索的公司是先行者，2 年后这会是 B 端项目的默认工作方式。一个工程师加上 AI 团队，交付完整的 B 端产品。

C 端的全栈化不会全面铺开——用户量大、并发高、体验要求极致，这些场景对工程质量的要求不是 AI 现阶段能完全覆盖的。但在新项目、小团队、创业公司里，C 端全栈化也会有局部突破。

预测三：第一批”AI 原生”公司会出现

不是用 AI 辅助现有流程，而是从第一天就按照”10 人团队 + AI 团队”的方式设计组织架构、研发流程、产品节奏。

这类公司的单位产出会比传统公司高 5-10 倍。Block 和 Stripe 是大公司里的先行者，但真正的 AI 原生公司还没大规模出现。

它的原型，其实就是今天的独立开发者：一个人，全栈，AI 加持，做出以前需要一个小团队才能做的产品。把这个模式放大到 10 人，就是 AI 原生公司的雏形。

预测四：Harness Engineering 会成为一个正式的工程学科

就像 DevOps 从一个实践变成了一个岗位，Harness Engineering 也会走这条路。

2 年内会有专门的工具链、认证体系、最佳实践文档。而构建和治理这套工具链的，正是预测一里说的 Harness Architect——中间层压缩释放出来的工程师，一部分会进化成这个角色，去建设这个新学科的基础设施。

给你的一个问题

不说”你应该学 AI”，这是废话。

一个具体的问题：你现在做的工作，哪些是”执行型”的，哪些是”判断型”的？

执行型：有标准答案，步骤可重复，换一个人（或一个 Agent）做结果差不多。

判断型：需要领域知识、历史背景、对边界情况的直觉，换一个人做结果会有显著差异。

执行型的工作会被压缩，判断型的工作会被放大。

不管你在大公司还是小团队，这个自我评估比任何职业建议都实用。风在哪个方向吹，你自己知道。

本文是 Harness Engineering 系列的第二篇。第一篇《AI 写代码写到一半就出轨？你缺的不是更好的提示词，是 Harness》讲清楚了 Harness Engineering 是什么、为什么需要它、以及如何从零开始落地。