Cearl's — AI 编程、软件工程与技术思考

AI 普及后的未来判断：就业、分配、教育、资产与个体策略

发布： 2026-06-24 分类： AI

这篇文章试图回答一个更具体的问题：当 AI 从工具演示走向工作流基础设施，普通白领、中产家庭、大学教育和个人资产配置会被怎样重估？

它不是投资建议，也不是基于单一叙事得出的结论。它把“AI 导致白领失业、中产危机、一人公司、资产重配”等问题放进更大的证据框架里，区分确定性、分歧点和可观察信号。

Agent 越改越烂，不一定是 context 太长

发布： 2026-06-09 分类： AI 工具

你大概见过这个场景：agent 修一个 bug，前两轮还像在接近答案，后面越改越偏；你忍不住开一个新对话，把问题重新说一遍，它反而一次改对。

很多人把这类现象叫 context rot，上下文腐烂。这个词很好记，但它把两种机制很不一样的问题塞进了一个桶里：一种是上下文太长，模型开始走神；另一种是上下文不一定长，但里面已经混进了错误前提。

Codex Goal：长期任务要先写完成条件

发布： 2026-06-01 分类：工具

Codex 的 Goal 从实验功能转成稳定功能后，我的第一反应卡在一个问题上：这玩意儿到底该怎么用？

如果只是把一个大 prompt 存起来，那我直接写在 AGENTS.md 或 docs/plan.md 里不就完了。它和 Claude Code 的 /loop、Ralph Loop 到底有什么区别？什么任务配得上开 Goal，什么任务只是我懒得拆？

让 AI 写出好看的网页，不是多写几个高级形容词

发布： 2026-05-27 分类：工具

最近我把晨笙阅读的界面又迭代了一轮，自己还挺满意。满意的点不只是“AI 帮我把页面写出来了”。更准确地说，旧版虽然能用，但视觉上还像半成品：颜色、图标和组件各说各话，阅读产品的气质没有立住。新版出来之后，它终于从“功能可用的页面”变成了“可以拿出去给人用的产品”：有统一的方向，有阅读场景的温度，也有一点精致感。

这次最大的体感是：让 AI 写出好看的网页，关键不在 prompt 里塞多少个 premium、modern、sleek。那些词当然有用，但它们太软了。真正有用的是把“好看”拆成一组 AI 能讨论、能执行、能反复检查的约束。

Codex CLI 速查手册：从交互对话到 CI 自动化的全部命令

发布： 2026-05-19 分类：工具

TL;DR：这是一份 Codex CLI 的实用命令速查手册，与博客里已有的 Claude Code 速查手册对应。如果你已经在用 Claude Code，这篇读起来会很熟悉——两个工具解决同一类问题，但设计哲学有几处明显不同。

执行层在消失，研发团队要做什么

发布： 2026-04-20 分类： AI Engineering

上周在 QCon 2026 北京 AI Coding 专场，9 场演讲，来自淘宝、蚂蚁、百度、PayPal、网易、京东。表面上讲的是各自的工具和方案，但底下在卷的是同一件事：如何让 AI 在整个研发流程里越来越自主，同时越来越可控。

这两个词放在一起是有张力的。”自主”意味着 AI 自己决策，”可控”意味着结果符合预期。各家踩的坑、交的学费，大部分都在这个张力里。

这篇文章想梳理一下：大家在做什么，做到了什么程度，以及我们自己的工作方式可能会往哪个方向变。

我是怎么把 AI 训练成一个合格的语篇规整编辑的

发布： 2026-04-19 分类： AI Engineering

8 分钟，一篇会议笔记从逐字稿变成可读文章。

这不是 AI 一开始就能做到的。这是把流程跑通、把坑踩完之后才有的结果。这篇文章想说的，就是这个流程怎么建起来的——以及为什么流程建立之前和之后，效率完全不在一个量级。

QCon 2026 北京 AI Coding 专场导读

发布： 2026-04-18 分类：会议笔记

2026-04-18，QCon 北京，首府分会场，AI Coding 专场。9 场演讲，录音转写 + 现场照片，整理成了 9 篇笔记。

这篇是导读，帮你决定看哪几篇。

QCon 2026·网易智企：从 Copilot 到 DataAgent——企业级智能数据开发治理平台的技术演进和实践

发布： 2026-04-18 分类：会议笔记

主讲：李卓豪（网易智企，数帆 EasyData 技术负责人）
时长：约 47 分钟

数据开发治理平台的 AI 演进四阶段：从单点操作到 DataAgent，以及为什么选择 CLI 而非 MCP（Token 效率差 35 倍）。重点分享了 SQL 生成的三阶段流程（问题改写→表识别→生成校验）和优先做智能运维而非数据开发的决策逻辑。

QCon 2026·PayPal：Agent in Practice——从支付迁移落地到评测驱动进化

发布： 2026-04-18 分类：会议笔记

主讲：郁丁鑫（PayPal，Senior Manager - Software Engineering）
主讲：耿树朋（PayPal，Staff Machine Learning Engineer）
时长：约 54 分钟

把 1-1.5 个月的支付迁移工作缩短到 10 分钟——PayPal MAIA 项目的完整实践。核心是 EERO 循环（执行→评估→反思→优化），以及通过 Noise Injection 构建 150+ 种噪声类型的测试数据工厂，让 Agent 在对抗性测试中持续进化。

QCon 2026·百度：构建 Coding Agent 的飞轮——Feedback Loop、Benchmark、Agent Engineers

发布： 2026-04-18 分类：会议笔记

主讲：牛万鹏（百度文心快码 Comate，研发经理）
主持：臧志（百度，Coding Agent 驱动的研发新范式专场出品人）
时长：约 53 分钟

Agent 框架的”感冒”，就是没跟上模型变化。百度 Comate 分享了如何通过 Feedback Loop（MCP 渐进式加载、智能上下文压缩、Tool 执行网络）、场景化 Benchmark（四象限异常值分析）和全员 Agent Engineers 转型，构建一个能持续适配模型演进的飞轮。

QCon 2026·蚂蚁：Vibe Coding 平台落地半年后的实践经验

发布： 2026-04-18 分类：会议笔记

主讲：彭佩乔（蚂蚁集团支付宝体验技术部，前端工程师，花名乔洋）
主持：臧志（百度，Coding Agent 驱动的研发新范式专场出品人）
时长：约 56 分钟

蚂蚁内部 Vibe Coding 平台（代号 Muse）落地半年、月活过万的真实踩坑记录。从 search & replace 到 KV Cache 的 token 优化路径，到”文件即记忆”和”一切用 git 管理”的架构理念，再到五个关于 AI 时代基建的”暴论”。

QCon 2026·京东科技：尽在上下文——JoyCode 的企业级 AI Coding 实践

发布： 2026-04-18 分类：会议笔记

主讲：徐翔（京东科技，JoyCode AI 架构师）
时长：约 47 分钟

检索得准，才是上下文工程的关键。JoyCode 分享了六类检索引擎的选型逻辑（ripgrep/向量/倒排/稀疏/RepoGraph）、RepoWiki 代码知识图谱的闲时构建方案，以及多 Agent 协同架构在 15 天紧急交付中的实战验证。

QCon 2026·MemTensor：OpenClaw 热潮下的 Agent 记忆系统工程实践

发布： 2026-04-18 分类：会议笔记

主讲：熊飞宇博士（记忆张量 MemTensor，创始人 & CEO）
时长：约 49 分钟 + 12 分钟答疑

记忆从效率工具变成了 Agent 能否正常运行的生死线。MemTensor 分享了 memOS 的三层记忆分层架构（明文/KV Cache/参数）、两条技术路径的对比选择，以及企业级多 Agent 产品 ClawForce 在部署、经验沉淀和安全治理上的实践。

QCon 2026·网易：从 Vibe Coding 到 Spec Driven 的智能化软件工厂实践

发布： 2026-04-18 分类：会议笔记

主讲：姜天意（网易智企，CodeWave & CoreAgent 技术负责人）
时长：约 50 分钟

Vibe Coding 解决了速度问题，但带来了质量和可控性问题。网易 CodeWave 通过 Spec Driven Development + Harness Engineering 的组合，把需求标准化（EARS 语法）、技术设计约束、沙箱验证串成完整流程，并用自研 NASL DSL 和代码大模型训练形成闭环。

QCon 2026·淘宝闪购：可复制的 AI Coding 全栈实战

发布： 2026-04-18 分类：会议笔记

主讲：邓立山（淘宝闪购，高级技术专家）
时长：约 50 分钟

让 AI 写出可控代码，本质是对软件工程的深刻实践。淘宝闪购分享了从”差那么点意思”到 AI 编码率 89.2% 的完整演进路径：双端约束减少幻觉、工程架构作为”宪法”、AI 自我审查闭环，以及如何把经验复制给整个团队。

QCon 2026·快猫星云：从 AIOps 到 AgentOps 的故障定位实践

发布： 2026-04-18 分类：会议笔记

主讲：裴彤（快猫星云，AI 产品研发负责人）
主持：秦晓辉（快猫星云创始人）
时长：约 54 分钟

用 Agent 来解决 Ops 的问题，而不是用 Ops 管理 Agent。快猫星云分享了可观测知识图谱 + AI Agent 做故障定位的完整实践，包括图谱自动化构建、四种 Agent 使用策略、Harness 工程和多 Agent 协作架构。

我让 Claude 逆向了自己，0.04 秒找到传说闪光卡皮巴拉

发布： 2026-04-16 分类：工具

Claude Code 有个 /buddy 命令，会根据你的账户 ID 孵化一只陪你写代码的小动物。稀有度五档，legendary shiny 的概率是万分之一。

我的默认宠物是一只 common axolotl——最低档，无闪光。我想要传说闪光卡皮巴拉。

于是我把这个系统的漏洞原理告诉了 Claude，让它去 190MB 的 Claude Code 二进制里找算法。它自己定位到了打包进去的 JS bundle，读懂了压缩混淆的代码，写了枚举脚本，还在第一版算法出错后自己设计实验修正。最终 14400 次枚举，0.04 秒，传说闪光卡皮巴拉出来了。

Skill 的整洁之道：软件架构原则在 AI 时代的新生

发布： 2026-04-15 分类： AI Engineering

软件开发领域有两本经典：《代码整洁之道》和《架构整洁之道》。前者讲怎么写好一个函数，后者讲怎么组织一个系统。

AI 时代来了，编码交给 AI 了，《代码整洁之道》的直接受益者变成了 AI——在函数命名、结构分层这个层面，AI 的输出已经相当稳定，你只需要给它提示和约束。

但《架构整洁之道》的命运不同。它没有被 AI 取代，而是在一个新的层面上重新活了一遍。

拆解一个人格测试：结果页藏着淘宝链接，"同类人"数字是随机数

发布： 2026-04-13 分类：技术

XPTI 是最近在传的另一个人格测试，20道题，16种人格类型，界面比 SBTI 精致很多——React + Framer Motion，题目切换有滑动动画，结果页有雷达图。

测完之后页面底部会出现一行字：**”全国有 X.X% 的人拥有和你一样的极品 XP。”**

把源码下载下来看了一眼，这个数字是这样生成的：

1 2	const count = Math.floor(Math.random() * 8000) + 1000; const percent = (Math.random() * 3 + 1).toFixed(1);

每次刷新都不同。没有任何统计数据支撑，纯粹是让结果看起来”稀有”的心理设计。