背景

Anthropic 工程师 Prithvi Rajasekaran 在官方博客发表了一篇 harness 设计指南,介绍他们如何用多智能体架构突破单 agent 编程的天花板。

这篇文章的核心洞察来自 GAN(生成对抗网络):把生成评估分离成两个独立的 agent,通过反复迭代驱动质量提升。这个思路先在前端设计任务上验证,再扩展到完整的全栈应用开发。

一个意外的弹窗

最近在用 gstack 的 /office-hours 功能,走完一整个 session 之后,它弹出了这样一个问题:

你会考虑申请 Y Combinator 吗?

我第一反应是:这是个广告。但仔细看了一下代码,发现它背后有一套完整的评判逻辑——它不是无差别地问所有人,而是根据整个对话过程中观察到的信号,分三个层级给出不同强度的邀请。

这套逻辑,让我想到了面试。

一个人,一天一万行代码

Garry Tan 在 X 上说他用 AI 60 天写了 60 万行代码,平均每天 1 万行。

这个数字听起来像在吹牛。但他把工具流程开源了,叫 gstack。我最近用了一次,觉得值得认真介绍一下。

TL;DR:Harness Engineering 是继 Prompt Engineering 和 Context Engineering 之后 AI 开发的第三阶段,通过把架构约束、执行计划、上下文管理机械化,让 AI Agent 可以稳定完成工程级别的任务。入门方法很简单:从一个 CLAUDE.md 文件开始,把你教过 AI 的每一件事都写进去。

TL;DR:Block 裁员近半股价飙升,网易跟上——这不是周期性成本压缩,是软件研发生产关系的第一次结构性重组。我们已经有了执行层,正在补齐协调层,还缺组织协议。2027 年,工程师这个职业会分裂成两种,中间层会大幅压缩。

传统计算机视觉(Traditional CV)就像是一门图像的炼金术,你不依赖现在的深度学习(AI),而是纯靠数学和像素的把戏来达成目的。

我们不写大段代码,只聊“这是啥”、“有啥用”、“什么时候用”以及“经典连招”。函数名以最常用的 OpenCV (Python) 为例。

准备好了吗?我们开始发车,直奔入土!

背景

作为 Windows 用户,之前命令行主要用 Git Bash 或 WSL。最近把 VS Code 的默认终端切换到 PowerShell 后,发现 PowerShell 其实也挺有可玩性的。本文记录 PowerShell 的美化配置和 Git 别名设置。

买了台阿里云 ECS 专门跑 OpenClaw(绰号”龙虾”),记录折腾过程。

为什么不跑在本机:本地跑有安全隐患(gateway 只绑 loopback,但本机环境更复杂),而且不能 24 小时开机。ECS 2vCPU / 2GB 内存 / 40GB 磁盘,99 元/年,够用。

为什么接飞书:看到一篇文章讲得很好——飞书作为办公 IM,文档、表格、知识库全是云端结构化数据,全有 API,天然是 Agent 的上下文来源;加上完备的机器人体系,顺理成章成了 OpenClaw 的首选前端。

读完丹尼尔·丹尼特的《意识的解释》后,我把书里的核心命题——“笛卡儿剧场不存在,意识只是大脑的多重草稿编辑过程”——拿去问了 AI:你觉得你自己有没有可能具有意识?

这篇文章是那次对话的记录,顺带梳理了哲学上几个相关的经典思想实验。

一、项目概述与愿景

Second-Me 是一个开源项目,旨在创建”数字第二自我”(AI Self)——一个能够学习和模拟用户个性与知识的个性化 AI,在本地训练和托管,数据 100% 自控。

原文: https://www.kaggle.com/whitepaper-agents

生成式 AI 模型可以通过训练来使用工具,以访问实时信息或建议现实世界中的行动。当模型具备推理、逻辑和外部信息获取能力时,就引出了智能体(agent)的概念——一种超越了独立生成式 AI 模型能力的程序。本文是 Google 发布的智能体白皮书中文整理。

▌核心观点: AI 智能体正迅速成为推动企业数字化转型的关键力量。Gartner 报告显示相关咨询量激增 750%,但市场同时充斥着”代理炒作”。本文整合 Gartner 最新洞察,梳理智能体的定义、价值、风险与部署策略。

深度学习在持续学习场景下有一个鲜为人知的致命缺陷:随着训练推进,网络会逐渐丧失学习新知识的能力——即”可塑性丧失”(Loss of Plasticity)。《自然》杂志发表的这项研究(Dohare et al., 2024)系统性地揭示了这一现象,并提出了”持续反向传播”算法作为解决方案。

大型语言模型(LLMs)已在众多任务中展现出惊人的通用能力。然而,如何让这些强大的模型高效地适应特定领域或动态变化的需求,仍是一个关键挑战。传统的完全微调方法成本高昂、耗时,且容易导致”灾难性遗忘”;而参数高效微调(PEFT)方法(如 LoRA)虽然降低了成本,却往往牺牲了模型的灵活性和技能的可组合性。

想象一下,一个 LLM 能够像经验丰富的专家一样,迅速分析任务需求,并实时调整自身”状态”以最优地解决问题,而不是用一套固定的模式应对所有情况。这正是自适应 LLM 的愿景。Sakana AI 提出的 Transformer² 框架朝着这一方向迈出了重要一步。

摘要

本白皮书深入分析了软件研发流程中可被 AI 替代或增强的环节,涵盖需求分析、方案设计、代码开发、测试验证、发布运维全流程,并提出具体实施路径与技术方案。

0%