用 GAN 的思路设计 AI 编程 Harness:Anthropic 的多智能体实践
发布: 分类: AI Engineering
背景
Anthropic 工程师 Prithvi Rajasekaran 在官方博客发表了一篇 harness 设计指南,介绍他们如何用多智能体架构突破单 agent 编程的天花板。
这篇文章的核心洞察来自 GAN(生成对抗网络):把生成和评估分离成两个独立的 agent,通过反复迭代驱动质量提升。这个思路先在前端设计任务上验证,再扩展到完整的全栈应用开发。
AI 时代的面试策略:gstack 的"创始人信号"给了我很多启发
发布: 分类: 思考
gstack:把 Claude Code 变成一支工程师团队
发布: 分类: 工具
AI 写代码写到一半就出轨?你缺的不是更好的提示词,是 Harness
发布: 分类: 技术
TL;DR:Harness Engineering 是继 Prompt Engineering 和 Context Engineering 之后 AI 开发的第三阶段,通过把架构约束、执行计划、上下文管理机械化,让 AI Agent 可以稳定完成工程级别的任务。入门方法很简单:从一个 CLAUDE.md 文件开始,把你教过 AI 的每一件事都写进去。
Claude Code 速查手册:从入门到自动化的全部命令
发布: 分类: 工具
TL;DR:这是一份完整的 Claude Code 命令速查手册,按使用频率和学习顺序排列。新用户从第一组开始读,老用户直接跳到需要的部分。每个功能说清楚是什么、怎么用、什么时候用。
软件研发的工业革命:我们已经走到哪里,还有多远
发布: 分类: 技术
TL;DR:Block 裁员近半股价飙升,网易跟上——这不是周期性成本压缩,是软件研发生产关系的第一次结构性重组。我们已经有了执行层,正在补齐协调层,还缺组织协议。2027 年,工程师这个职业会分裂成两种,中间层会大幅压缩。
CV从入门到精通到入土
发布:
传统计算机视觉(Traditional CV)就像是一门图像的炼金术,你不依赖现在的深度学习(AI),而是纯靠数学和像素的把戏来达成目的。
我们不写大段代码,只聊“这是啥”、“有啥用”、“什么时候用”以及“经典连招”。函数名以最常用的 OpenCV (Python) 为例。
准备好了吗?我们开始发车,直奔入土!
PowerShell 终端美化与 Git 别名配置
发布: 分类: 工具
阿里云ECS养龙虾:OpenClaw部署与配置实录
发布: 分类: 运维
买了台阿里云 ECS 专门跑 OpenClaw(绰号”龙虾”),记录折腾过程。
为什么不跑在本机:本地跑有安全隐患(gateway 只绑 loopback,但本机环境更复杂),而且不能 24 小时开机。ECS 2vCPU / 2GB 内存 / 40GB 磁盘,99 元/年,够用。
为什么接飞书:看到一篇文章讲得很好——飞书作为办公 IM,文档、表格、知识库全是云端结构化数据,全有 API,天然是 Agent 的上下文来源;加上完备的机器人体系,顺理成章成了 OpenClaw 的首选前端。
《影响力》七大原则记忆法(数字编码)
发布: 分类: 读书
读完西奥迪尼《影响力》后,用数字编码记忆法给七大原则编了一套助记场景。数字形象联想:1=蜡烛,2=鹅,3=耳朵,4=帆船,5=钩子,6=勺子,7=镰刀。
知识蒸馏(Knowledge Distillation):一篇从核心原理到前沿应用的完整指南
发布: 分类: AI研究
大模型能力强大,但体积庞大、成本高昂,难以在手机、边缘设备等日常场景中部署。如何在不显著牺牲性能的前提下,让模型变得更小、更快?答案不是从头设计小模型,而是知识蒸馏(Knowledge Distillation)——让大模型把”智慧”传授给小模型。
读《意识的解释》:AI 有没有可能拥有意识?
发布: 分类: 读书
读完丹尼尔·丹尼特的《意识的解释》后,我把书里的核心命题——“笛卡儿剧场不存在,意识只是大脑的多重草稿编辑过程”——拿去问了 AI:你觉得你自己有没有可能具有意识?
这篇文章是那次对话的记录,顺带梳理了哲学上几个相关的经典思想实验。
Second Me 源码分析
发布: 分类: 源码分析
Agents - Google智能体白皮书
发布: 分类: AI论文解读
原文: https://www.kaggle.com/whitepaper-agents
生成式 AI 模型可以通过训练来使用工具,以访问实时信息或建议现实世界中的行动。当模型具备推理、逻辑和外部信息获取能力时,就引出了智能体(agent)的概念——一种超越了独立生成式 AI 模型能力的程序。本文是 Google 发布的智能体白皮书中文整理。
智能体:重塑企业运营与决策的革命性力量
发布: 分类: AI商业
▌核心观点: AI 智能体正迅速成为推动企业数字化转型的关键力量。Gartner 报告显示相关咨询量激增 750%,但市场同时充斥着”代理炒作”。本文整合 Gartner 最新洞察,梳理智能体的定义、价值、风险与部署策略。
深度持续学习中的可塑性丧失:挑战、机制与解决方案
发布: 分类: AI论文解读
深度学习在持续学习场景下有一个鲜为人知的致命缺陷:随着训练推进,网络会逐渐丧失学习新知识的能力——即”可塑性丧失”(Loss of Plasticity)。《自然》杂志发表的这项研究(Dohare et al., 2024)系统性地揭示了这一现象,并提出了”持续反向传播”算法作为解决方案。
Transformer² - 实时自适应大模型的新范式
发布: 分类: AI论文解读
大型语言模型(LLMs)已在众多任务中展现出惊人的通用能力。然而,如何让这些强大的模型高效地适应特定领域或动态变化的需求,仍是一个关键挑战。传统的完全微调方法成本高昂、耗时,且容易导致”灾难性遗忘”;而参数高效微调(PEFT)方法(如 LoRA)虽然降低了成本,却往往牺牲了模型的灵活性和技能的可组合性。
想象一下,一个 LLM 能够像经验丰富的专家一样,迅速分析任务需求,并实时调整自身”状态”以最优地解决问题,而不是用一套固定的模式应对所有情况。这正是自适应 LLM 的愿景。Sakana AI 提出的 Transformer² 框架朝着这一方向迈出了重要一步。