AI agent思考

前言

最近这段时间,我明显感觉到自己使用 AI 的方式变了。

以前我用 AI,更多是在网页里面问问题:让它解释一个概念,帮我润色一段话,或者写一小段代码。那时候 AI 更像一个很聪明的聊天框,我问一句,它答一句,最多也就是连续对话。

但是现在不太一样了。

现在我更常用的是 Codex、Claude Code、OpenCode 这一类 Agent 工具。它们不是只回答问题,而是会进入项目目录,会读文件,会跑命令,会改代码,会看报错,会自己迭代。也就是说,AI 不再只是一个“知道很多东西的人”,而更像是一个可以和我一起坐在项目里面干活的人。

这篇文章就想随便聊聊我对 AI Agent 的一些感受,也顺便整理一下我最近使用 Codex、Claude Code、OpenCode 这些工具的体验。最后也会引出我自己搭建的一个东西:Shen AI 中转站。

Shen AI 中转站首页

一、我理解的 AI Agent

如果很简单地说,我觉得 AI Agent 和普通聊天 AI 最大的区别,不是模型本身有多强,而是它有没有“行动能力”。

普通聊天 AI 的边界大概是:

  • 你把问题发给它。
  • 它根据上下文回答。
  • 你再把回答拿去执行。

Agent 的边界就往外扩了一圈:

  • 它可以自己读项目文件。
  • 它可以调用终端和工具。
  • 它可以把一个大任务拆成几个小步骤。
  • 它可以根据报错继续修。
  • 它可以在代码、文档、浏览器、命令行之间来回切换。

这件事对我来说很关键。

因为我其实一直在做一些比较杂的项目,比如 Discord/QQ 机器人、镜室网站、珅玉定制 APP、Gemini 插件、博客、服务器部署等等。以前这些事情都需要我自己不断在代码、文档、网页、终端之间切换。AI 虽然能给建议,但最后落地还是要靠我一点点复制粘贴。

而 Agent 工具出现以后,很多工作变成了:

我说清楚我要什么,它去项目里面找路径,然后直接开干。

当然,这不代表我可以完全不管。相反,越是用 Agent,我越觉得“人”的责任不是消失了,而是从写每一行代码,变成了判断方向、定义目标、验收结果。

这一点和我前面写 Discord 机器人时的感受有点像:Discord 机器人开发历程。机器人真正变好用,不是因为它功能堆得越来越多,而是因为边界越来越清楚。Agent 也是一样,它不是万能的,但是只要边界给清楚,它就非常能干。

二、从聊天框到工作台

最开始用 AI 写代码的时候,我基本都是网页工作流。

比如我有一个 bug,就把报错复制到 ChatGPT 或者 Claude 里面,然后它给我一段修改建议。我再打开 VS Code,找到文件,手动改,重新运行。如果报错继续出现,我再复制报错回去。

这个流程的问题是,中间有很多“人工搬运”。

AI 不知道我的完整项目结构,也不知道我改完之后运行结果怎么样。它只能根据我给它的片段猜。只要我漏贴一个文件,或者项目里有另一个隐藏逻辑,它就很容易给出看起来很合理但实际跑不通的方案。

Agent 工具的体验就明显不同。

它可以直接看整个项目。比如我让它“帮我修一下这个页面移动端按钮溢出的问题”,它会先搜相关组件,再看 CSS,再改文件,然后启动本地服务,最后打开浏览器截图验证。这个过程里,人不用一直当复制粘贴机器。

我觉得这才是 AI 编程真正开始好用的地方。

不是因为它每次都一次成功,而是因为它终于能在真实项目里循环:

  1. 观察现状。
  2. 修改代码。
  3. 运行验证。
  4. 根据结果继续调整。

这个循环一旦跑起来,AI 就不只是“建议生成器”,而是“执行合作者”。

机器人命令和工具入口

三、Claude Code:很强,但也比较有性格

Claude Code 是我比较早开始认真用的 Agent 工具之一,我之前也在 AI工具使用指南 里记录过一些基本命令。

它最大的优点是代码理解能力强,尤其是在复杂项目里面,它很会读上下文。你给它一个需求,它通常会先看项目结构,再根据已有代码风格去改,不太会一上来就硬写一套完全不符合项目风格的东西。

我比较喜欢 Claude Code 的几个点:

  • 对长上下文的理解比较稳。
  • 对项目结构的归纳能力强。
  • 写代码时比较偏谨慎。
  • 适合做已有项目的维护和复杂逻辑修改。

比如我之前调机器人后台、模型配置、记忆逻辑这些东西的时候,Claude Code 的优势就比较明显。它能看出某个函数和另一个模块之间的关系,也能提醒我一些潜在问题。

但是 Claude Code 也不是没有问题。

它有时候会比较“贵”,而且国内直接使用不一定方便。另一个问题是,它有时会显得过于谨慎,做一点事要确认很多东西。这个其实不算坏事,只是当我已经很明确想让它直接改的时候,就会觉得节奏稍微慢一点。

所以我对 Claude Code 的定位是:

很适合复杂项目、长上下文、需要稳一点的代码改造。

它像一个很强的工程搭档,但前提是你要给它一个比较顺的使用环境。

四、OpenCode:开放、灵活,但需要自己折腾

OpenCode 给我的感觉是更开放,也更适合喜欢折腾的人。

它本身的思路很吸引我:可以接不同模型,可以配置不同 provider,可以做 session 管理,也可以做自定义命令和自定义 agent。我之前在 AI工具使用指南 里也记过它的一些命令,比如 /models/connect/sessions/init/compact 等等。

这类工具有一个很大的优势:自由。

你可以接 DeepSeek,可以接 Gemini,可以接 OpenRouter,也可以接自己搭的中转站。它不像某些封闭工具那样只能走固定模型,而是更像一个可以自己拼装的 AI CLI 工作台。

模型选择示例

但是自由也意味着折腾成本。

配置 provider、处理模型格式、处理 API base URL、处理上下文长度、处理工具调用兼容性,这些东西对于熟悉的人来说很好玩,但对于第一次用的人来说可能会有一点门槛。

我觉得 OpenCode 适合两类人:

  • 一类是已经熟悉 AI CLI,想要更自由地切换模型。
  • 另一类是愿意折腾配置,把它当成自己的工作流底座。

如果只是想“开箱即用”,它可能没有那么丝滑。但如果愿意调,它的上限很高。

五、Codex:目前我最喜欢的状态

最近用下来,我最想推荐的还是 Codex。

这里说的 Codex,不只是“让 AI 写代码”,而是现在这种真正的本地 coding agent 工作方式。它会在项目目录里读文件、改文件、跑测试、看截图,也会把过程解释给我听。

我喜欢 Codex 的原因主要有几个。

1. 它很像真实的项目协作

我把需求告诉它,它会先看项目,不会直接胡写。比如这次写博客,它不是直接开始编,而是先读了我以前几篇文章,看我的行文风格,再看图片目录,再打开飞书文档确认中转站说明。

这个流程就很像一个靠谱的人类协作者:先理解上下文,再动手。

2. 它和本地文件系统结合得很好

写博客、改代码、整理文档,本质上都离不开文件。

Codex 最大的好处是它就在本地工作区里。我要它改哪篇文章,它就只改哪篇文章。我要它不要动其他文件,它就会先看 git 状态,尽量控制修改范围。

这种感觉比网页 AI 舒服太多。

网页 AI 再聪明,也还是隔着一层玻璃;Codex 则是真的坐进了项目里。

3. 它的工作反馈比较自然

我很喜欢它一边做事一边告诉我“现在在读旧文”“现在在看图片”“现在准备写目标文件”。这种过程反馈很重要,因为 Agent 不是一次性问答,它有时候会跑一会儿。

如果完全没反馈,人会不知道它是在认真干活,还是卡住了。

4. 它适合我这种“项目很多但都要维护”的状态

我现在的项目比较分散,有网站,有机器人,有服务器,有博客,有插件。如果每个项目都让我重新熟悉一遍,会非常累。

Codex 的优势就在于,它可以快速进入一个陌生目录,帮我把上下文重新捡起来。

这对我来说很重要。

很多项目最难的不是从 0 到 1,而是隔了几周之后重新打开。你会忘记当初为什么这么写,忘记哪个配置在哪,忘记部署脚本怎么跑。Agent 如果能帮我把这些线重新牵起来,就已经很有价值了。

六、Agent 好不好用,模型只是其中一部分

以前我会很关注模型排行榜,今天哪个模型最强,明天哪个模型代码能力第一。

现在我还是会关注,但没那么执着了。

因为真正使用 Agent 的时候,我发现模型只是其中一部分。更重要的是整个工作流:

  • 工具能不能稳定调用。
  • 上下文能不能放得下。
  • 文件读写是否清晰。
  • 终端命令能不能顺利跑。
  • 浏览器验证是否方便。
  • API 是否稳定。
  • 模型切换是否麻烦。

如果这些东西不顺,就算模型很强,体验也会被打断。

反过来,如果工具链顺,模型稍微弱一点,有时候也能通过多轮迭代把事情做完。

这也是为什么我后来开始重视“中转站”这种基础设施。

因为 Agent 工具要真正日常使用,不能每次都卡在 API、额度、网络、模型切换上。它应该像水电一样,平时不需要想,真正需要的时候直接能用。

七、为什么我搭了 Shen AI 中转站

我搭 Shen AI 中转站的原因其实很简单:我自己需要一个稳定、低成本、适合 Codex 的模型入口。

它不是镜像站,也不是网页版 ChatGPT 的平替。它更准确的定位是:

面向 Codex 这类 Agent 工具的 OpenAI 兼容 API 中转站。

中转站是在 sub2api 的基础上搭建的,部署在我的洛杉矶服务器上。后台接的是官方账号调度,不是随便套一个别的模型假装 GPT。对我来说,最重要的就是稳定、便宜、模型对应关系清楚。

中转站地址是:

https://skill-chat.cn

OpenAI 兼容基础地址是:

1
https://skill-chat.cn/v1

具体使用说明我整理在飞书文档里:

Shen AI 中转站使用教程

Shen AI 中转站使用教程

这个文档里主要写了这些内容:

  • 中转站怎么注册和登录。
  • API Key 怎么创建。
  • Base URL 应该怎么填。
  • Codex 怎么使用。
  • ccswitch 怎么导入配置。
  • cockpit tools 怎么配置。
  • 充值和常见问题。

一般来说,接入 OpenAI 兼容客户端时,可以按这个思路填写:

1
2
3
4
Provider / 提供商: OpenAI Compatible
Base URL / 基础地址: https://skill-chat.cn/v1
API Key: 你在站内创建的 sk- 开头密钥
Model: 按账户可用模型填写

如果报 401,大概率是 API Key 填错了。

如果报 404,优先检查 Base URL 有没有少写 /v1

如果报 413 Payload Too Large,说明单次上下文太长,可以开新对话或者缩短输入。

这些问题看起来很小,但 Agent 工具一旦跑起来,对稳定性要求其实很高。因为它不是只发一条消息,而是会连续读文件、分析、调用工具、生成修改。如果中间 API 不稳定,整个体验就会断。

八、我为什么说 Codex 很适合配中转站

Codex 本身已经很好用,但如果 API 入口不顺,体验还是会打折。

所以我觉得现在比较舒服的组合是:

Codex + Shen AI 中转站 + ccswitch/cockpit tools

其中 Codex 负责真正干活,中转站负责模型入口,ccswitch 或 cockpit tools 负责配置管理。

这样有几个好处:

  1. 不用到处手改配置。
  2. 可以快速切换基础地址和模型。
  3. 适合多个 AI CLI 一起用,比如 Claude Code、Codex、OpenCode。
  4. 出问题时更容易定位是工具问题、模型问题,还是 API 地址问题。

我现在越来越觉得,AI Agent 的体验不是某一个点决定的,而是“整条链路”决定的。

模型强是一方面,工具顺也是一方面,稳定的 API 入口也是一方面。只有这些东西连起来,才会从“偶尔玩一下”变成“真的每天用”。

九、Agent 工具对我的影响

这段时间用下来,我最大的感受是:AI Agent 让我更敢开新项目,也更愿意维护旧项目。

以前我开一个项目会有心理负担,因为我知道后面会有很多琐碎工作:配置、报错、部署、文档、样式、兼容性。现在这些东西还是存在,但没那么吓人了。

比如我做镜室网站的时候,前后端、支付、技能系统、后台管理、部署,每一步都很麻烦。以前我可能做到一半就累了。但有 Agent 以后,我可以把很多“脏活累活”交给它,让自己更多关注产品逻辑和体验。

镜室网站首页

再比如写博客。

以前写一篇技术记录,我要自己翻旧文、找截图、整理链接、检查格式。现在我可以让 Agent 帮我把这些上下文先铺好,然后我再把观点讲清楚。

这不代表我不写了。

恰恰相反,它让我更容易开始写。

因为最难的不是打字,而是从一团乱麻里整理出一条线。Agent 很擅长帮我把线头找出来。

十、一些冷静的判断

当然,我也不觉得 Agent 已经完美了。

现在使用 Agent 还是有一些问题:

  • 有时候会误判需求。
  • 有时候会过度修改。
  • 有时候会因为上下文太长而变笨。
  • 有时候工具调用会失败。
  • 有时候它会很自信地走错方向。

所以我现在用 Agent,会尽量遵循几个原则:

  1. 任务要说清楚,尤其是不要改哪些东西。
  2. 大改之前先让它读项目和说明。
  3. 能跑测试就跑测试。
  4. 涉及线上数据和配置时要谨慎。
  5. 最后一定要自己验收。

Agent 不是替代判断的人,而是放大执行力的工具。

如果方向是错的,它只会更快地跑向错误;如果方向是清楚的,它就真的很强。

十一、总结

现在回头看,我觉得 AI Agent 是一个很自然的进化。

从最早的网页问答,到代码补全,再到现在能进入项目目录工作的 Agent,AI 的位置一直在往真实工作流里靠近。

对我来说,Codex 是目前最接近“日常可用”的那一个。它不像单纯聊天框那样隔着项目,也不像纯命令行工具那样只会执行单点任务,而是能在一个完整工作流里持续推进。

Claude Code 很强,OpenCode 很自由,但 Codex 目前给我的综合体验最好。

所以我也专门搭了 Shen AI 中转站,让这个工作流更稳定一点。它部署在我的洛杉矶服务器上,基于 sub2api 搭建,主要面向 Codex 这类 Agent 工具使用。

如果你也想试试,可以看这个教程:

Shen AI 中转站使用教程

我现在越来越相信,未来真正好用的 AI,不只是模型本身变聪明,而是它能不能进入我们的真实生活和真实项目里,把事情一点点做完。

而 Agent,已经开始有这种味道了。


AI agent思考
http://example.com/2026/05/19/agent思考/
作者
Leo shen
发布于
2026年5月19日
许可协议