软件界面是给人类操作的,但 AI 不需要,AI 需要的,是它的 Agent 伙伴们

Agent已经大规模应用在编程领域,将逐步替代人类,未来的软件编写和产品设计,需要考虑到真正的工作主力,也就是AI,让AI如何提高效率,而非人类。

n8n-workflow
n8n-workflow

最近,我玩了一个新东西,叫 Claude Code。

它有点怪。

聊聊天,说说话,一个软件完成了

没有花里胡哨的界面,就是一个黑乎乎的终端窗口,感觉像是回到了上世纪 80 年代。但诡异的是,用起来却感觉比我用过的任何工具都更接近 “未来”。

安装Claude Code
安装Claude Code
Claude Code准备接受用户指令
Claude Code准备接受用户指令

我只用键盘输入一句话,类似于:“帮我写个网站,用来讨论书籍。”

然后,屏幕上的代码就开始自己滚动、创建文件、写入内容、运行、测试、修正……

整个过程,我最多就补充几句细节,再敲几下回车。最后,一个能用的网站就真的跑起来了,打开网页就可以查看了。

那时我明白了:

我们曾经在意的软件 “界面”,变得越来越不重要。

还记得经典的写东西的软件普遍的样子吗?

写作类软件的经典界面
写作类软件的经典界面

这既可以是写小说的软件的样子,也可以是写代码软件的样子。是不是与下面这个常用的写代码的软件很像?

VS Code,一款普遍使用的编程工具
VS Code,一款普遍使用的编程工具

那些关于文件的结构,以及提供给人类手动编辑的区域,现在都变得没有存在的必要了,因为,已经不需要人上手操作了。

真正干活的,是一群 “小智”

这种魔法背后,不是什么神秘力量,而是一个叫做 Agent 的东西。

我喜欢叫它 “小智”,因为它一定会有一个中文名,也一定会简化到两个字。

你可以把每个 “小智”想象成一个能力超强的专家,但他一辈子只钻研一件事,并做到了极致。

你下达一个模糊的指令,比如 “做个网站”。

AI 大模型(比如 Claude)就像一个经验丰富的项目经理,它会把这个大任务拆解成几十上百个小任务,然后精准地派给最合适的 “小智”去执行。

“小智 A,创建项目文件夹。”
“小智 B,去网上找一个最流行的网站框架。”
“小智 C,把框架代码写进文件。”
“小智 D,运行一下,看看效果。”
“小智 E,截图给我,跟需求比对一下。”

Claude Code 之所以让人印象深刻,就是因为它内置了足够专业的一群 “小智”,并且拥有一个极其聪明的大脑来指挥它们,这直接把人类从繁琐的执行和检查环节里解放了出来。

它们之间的通信,并不像人类与软件交流那样,要通过界面去观察,他们更主要是通过数据,直接沟通。

不是孤例,而是一场席卷行业的革命

你可能会说,这些软件最终还是要靠人来检查是否合格。

但其实事情没那么简单。除了 Claude Code 之外,其他的各种软件,也在经历类似的过程。

去年以来,同样是在编程赛道,一家叫做 Cursor 的公司,最早掀开了这一页,在不到一年时间里收入和估值翻了上百倍,收入达到1亿美元年收入,估值更是达到百亿美元。

Cursor虽然基于一个对用户友好的界面来开发,但是后来,它的Agent模式出来后,也就不再需要人类过多的参与,只是让人类在不放心的时候,可以去界面里检查下代码而已。

后来的Manus助手,Fellou浏览器等,也都是集成了几十个Agent,帮助人去搜集和整理信息。

这些工具的核心逻辑出奇地一致:用一个强大的 AI 大脑,调度 N 个 “小智”来帮你干活。它们都在想尽办法减少你的鼠标点击和键盘输入。

我不好断言任何一种软件都不需要给人使用的界面,但一个软件从展示交付过程,变成直接交付结果,已经成为新的范式。

没有界面,就是最好的界面

Claude Code 选择用半个世纪前就有的 “终端”作为界面,看起来有些 “开倒车”。

但我觉得这恰恰是它虽然激进、但不失深刻的洞察,哪怕这可能只是来自研发人员过去一直的工作习惯。

它在逼你放弃对二维平面的依赖。

传统的编程软件,屏幕被分割成好几个区域:左边是文件列表,中间是代码,右边是预览,下面是输出结果。你的视线需要不断在这些色块之间来回跳跃、切换。

而终端呢?它是一维的。信息从上到下流动,像一条河。你只需要盯着光标,专注于指令和结果。过去了,就可以忘掉。

这背后是一个大胆的宣言:把不必要的界面全部干掉。

当 AI 能完美理解你的意图,并能自己验证结果时,那些为了方便人类理解和操作而设计出来的按钮、菜单、窗口,本质上都成了 “拐杖”。

而现在,是时候扔掉拐杖了。

面向 AI,而非人类

这背后,反映的是,AI 逐渐可以接管编程这种工作后,为了让AI 高效工作,流程中需要优化的重点发生了转变。

以前,因为需要人类来操作,所有的软件,都要保证面向人类的易用性,这就包括:

  • 直观的用户界面
  • 人类友好的反馈信息
  • 容错性:人类操作出错了,也有机会重试和补救
  • 可学习性: 帮助人类快速掌握软件功能
  • 美学和体验: 界面美观,操作流程流畅

而现在,需要 AI 来操作,所有的软件,于是,就开始需要面向 AI 的易用性了。这里我们做一个逐一的对比:

面向AI的软件,有何异同
面向AI的软件,有何异同

软件的设计哲学从追求 “人与计算机之间的无缝、愉快交互” 转向追求 “计算机系统之间的高效、稳定、可编程互联” 。

未来的软件将更多地是为机器而生,通过 API 接口、结构化数据、细致的报错信息和自动化流程来满足 AI 的需求。

拿配方单到小智商店,随取随用

这个趋势往下走,未来会怎样?

人类在软件开发的领域,将不再接触代码。

不是所有软件,但特指那些逻辑清晰、能被 AI 一口气完成的软件。未来,我们开发软件,可能就像在逛一个 “Agent 商店”,用一份 “配方”就能组合出想要的应用。

比如,你想做一个 “听书 + 提问”的应用,你的 “配方”可能是这样的:

# 这是一个应用的 “配方单”

- 名字: 读书小助理
- 步骤:
  - 任务 1: 去最大的线上图书馆拿书
    - 调用: agent-获取图书
  - 任务 2: 用摩根·弗里曼的声音朗读
    - 调用: agent-文字转语音
  - 任务 3: 根据内容,像苏格拉底一样提出问题,先考考我
    - 调用: agent-苏格拉底提问器

你不需要关心代码,你只需要清晰地定义每个步骤需要哪个 “小智”来完成,以及它们之间的协作方式。

把这些 “小智”像乐高积木一样拖拽、编排起来,一个应用就诞生了。

这听起来不靠谱?但其实已经有公司在做了。

一家叫 n8n 的德国公司,一经成立了5年多,就在做类似的事情。他们提供一个可视化的面板,让你把各种软件功能(节点)拖进来,用线连上,就能打造出强大的自动化流程。

而且,n8n 这种 “连接器”模式,是图灵完备的,也就意味着可以用来创造任何复杂的软件。

使用n8n生产社交媒体视频
使用n8n生产社交媒体视频

但是,不得不说,上面的n8n的这个生产视频的工作流,在平面上铺开来看的话,是复杂的,好在它有纯文本描述的版本。

其实我们更期望能通过AI,直接生成上面提到的那种 “配方单”,生成后,人类微调些细节即可,可以节省不少力气。

只是现在业界还没发展到有一个可以直接使用的 “小智商店”,也没有可以直接使用这种 “配方单”的系统,但我相信,已经不远了。

可能作为读者的你,就是下一个开发和运营“小智商店”的人。

写在最后

从写代码到 “搭”小智Agent,从设计复杂 UI 到设计简单的流程,这不仅仅是工具的进化,更是思想的变革。

对于程序员来说,价值不再是写出多少行代码,而是你能否交付性能稳定的“小智”,以便下游搭建出高效的 “小智”协作流。

而对于产品经理和决策者来说,这更是一个巨大的机会。

当 “搭”一个软件的成本和时间都大幅降低,你们的想象力将是唯一的边界。有多少过去因为开发成本太高而被搁置的想法,现在可以重新拿出来审视了?

未来的产品经理,可能不再需要画精美的原型图,而是要更加聚焦到待解决的问题上,减少关注实现方案的可行性,更多关注方案的有效性。

未来的公司,核心竞争力可能不再是拥有一支庞大的工程师团队,而是拥有一个最聪明、最高效的 “小智”仓库。

期待本文的读者你,可以基于这个理念,做出厉害的产品!


本文公众号版本,在里面找我继续交流吧

https://mp.weixin.qq.com/s/33NDXw3qpZCXK5LZ5oVkqg