AI agent思考
前言
最近这段时间,我明显感觉到自己使用 AI 的方式变了。
以前我用 AI,更多是在网页里面问问题:让它解释一个概念,帮我润色一段话,或者写一小段代码。那时候 AI 更像一个很聪明的聊天框,我问一句,它答一句,最多也就是连续对话。
但是现在不太一样了。
现在我更常用的是 Codex、Claude Code、OpenCode 这一类 Agent 工具。它们不是只回答问题,而是会进入项目目录,会读文件,会跑命令,会改代码,会看报错,会自己迭代。也就是说,AI 不再只是一个“知道很多东西的人”,而更像是一个可以和我一起坐在项目里面干活的人。
这篇文章就想随便聊聊我对 AI Agent 的一些感受,也顺便整理一下我最近使用 Codex、Claude Code、OpenCode 这些工具的体验。最后也会引出我自己搭建的一个东西:Shen AI 中转站。

一、我理解的 AI Agent
如果很简单地说,我觉得 AI Agent 和普通聊天 AI 最大的区别,不是模型本身有多强,而是它有没有“行动能力”。
普通聊天 AI 的边界大概是:
- 你把问题发给它。
- 它根据上下文回答。
- 你再把回答拿去执行。
Agent 的边界就往外扩了一圈:
- 它可以自己读项目文件。
- 它可以调用终端和工具。
- 它可以把一个大任务拆成几个小步骤。
- 它可以根据报错继续修。
- 它可以在代码、文档、浏览器、命令行之间来回切换。
这件事对我来说很关键。
因为我其实一直在做一些比较杂的项目,比如 Discord/QQ 机器人、镜室网站、珅玉定制 APP、Gemini 插件、博客、服务器部署等等。以前这些事情都需要我自己不断在代码、文档、网页、终端之间切换。AI 虽然能给建议,但最后落地还是要靠我一点点复制粘贴。
而 Agent 工具出现以后,很多工作变成了:
我说清楚我要什么,它去项目里面找路径,然后直接开干。
当然,这不代表我可以完全不管。相反,越是用 Agent,我越觉得“人”的责任不是消失了,而是从写每一行代码,变成了判断方向、定义目标、验收结果。
这一点和我前面写 Discord 机器人时的感受有点像:Discord 机器人开发历程。机器人真正变好用,不是因为它功能堆得越来越多,而是因为边界越来越清楚。Agent 也是一样,它不是万能的,但是只要边界给清楚,它就非常能干。
二、从聊天框到工作台
最开始用 AI 写代码的时候,我基本都是网页工作流。
比如我有一个 bug,就把报错复制到 ChatGPT 或者 Claude 里面,然后它给我一段修改建议。我再打开 VS Code,找到文件,手动改,重新运行。如果报错继续出现,我再复制报错回去。
这个流程的问题是,中间有很多“人工搬运”。
AI 不知道我的完整项目结构,也不知道我改完之后运行结果怎么样。它只能根据我给它的片段猜。只要我漏贴一个文件,或者项目里有另一个隐藏逻辑,它就很容易给出看起来很合理但实际跑不通的方案。
Agent 工具的体验就明显不同。
它可以直接看整个项目。比如我让它“帮我修一下这个页面移动端按钮溢出的问题”,它会先搜相关组件,再看 CSS,再改文件,然后启动本地服务,最后打开浏览器截图验证。这个过程里,人不用一直当复制粘贴机器。
我觉得这才是 AI 编程真正开始好用的地方。
不是因为它每次都一次成功,而是因为它终于能在真实项目里循环:
- 观察现状。
- 修改代码。
- 运行验证。
- 根据结果继续调整。
这个循环一旦跑起来,AI 就不只是“建议生成器”,而是“执行合作者”。

三、Claude Code:很强,但也比较有性格
Claude Code 是我比较早开始认真用的 Agent 工具之一,我之前也在 AI工具使用指南 里记录过一些基本命令。
它最大的优点是代码理解能力强,尤其是在复杂项目里面,它很会读上下文。你给它一个需求,它通常会先看项目结构,再根据已有代码风格去改,不太会一上来就硬写一套完全不符合项目风格的东西。
我比较喜欢 Claude Code 的几个点:
- 对长上下文的理解比较稳。
- 对项目结构的归纳能力强。
- 写代码时比较偏谨慎。
- 适合做已有项目的维护和复杂逻辑修改。
比如我之前调机器人后台、模型配置、记忆逻辑这些东西的时候,Claude Code 的优势就比较明显。它能看出某个函数和另一个模块之间的关系,也能提醒我一些潜在问题。
但是 Claude Code 也不是没有问题。
它有时候会比较“贵”,而且国内直接使用不一定方便。另一个问题是,它有时会显得过于谨慎,做一点事要确认很多东西。这个其实不算坏事,只是当我已经很明确想让它直接改的时候,就会觉得节奏稍微慢一点。
所以我对 Claude Code 的定位是:
很适合复杂项目、长上下文、需要稳一点的代码改造。
它像一个很强的工程搭档,但前提是你要给它一个比较顺的使用环境。
四、OpenCode:开放、灵活,但需要自己折腾
OpenCode 给我的感觉是更开放,也更适合喜欢折腾的人。
它本身的思路很吸引我:可以接不同模型,可以配置不同 provider,可以做 session 管理,也可以做自定义命令和自定义 agent。我之前在 AI工具使用指南 里也记过它的一些命令,比如 /models、/connect、/sessions、/init、/compact 等等。
这类工具有一个很大的优势:自由。
你可以接 DeepSeek,可以接 Gemini,可以接 OpenRouter,也可以接自己搭的中转站。它不像某些封闭工具那样只能走固定模型,而是更像一个可以自己拼装的 AI CLI 工作台。

但是自由也意味着折腾成本。
配置 provider、处理模型格式、处理 API base URL、处理上下文长度、处理工具调用兼容性,这些东西对于熟悉的人来说很好玩,但对于第一次用的人来说可能会有一点门槛。
我觉得 OpenCode 适合两类人:
- 一类是已经熟悉 AI CLI,想要更自由地切换模型。
- 另一类是愿意折腾配置,把它当成自己的工作流底座。
如果只是想“开箱即用”,它可能没有那么丝滑。但如果愿意调,它的上限很高。
五、Codex:目前我最喜欢的状态
最近用下来,我最想推荐的还是 Codex。
这里说的 Codex,不只是“让 AI 写代码”,而是现在这种真正的本地 coding agent 工作方式。它会在项目目录里读文件、改文件、跑测试、看截图,也会把过程解释给我听。
我喜欢 Codex 的原因主要有几个。
1. 它很像真实的项目协作
我把需求告诉它,它会先看项目,不会直接胡写。比如这次写博客,它不是直接开始编,而是先读了我以前几篇文章,看我的行文风格,再看图片目录,再打开飞书文档确认中转站说明。
这个流程就很像一个靠谱的人类协作者:先理解上下文,再动手。
2. 它和本地文件系统结合得很好
写博客、改代码、整理文档,本质上都离不开文件。
Codex 最大的好处是它就在本地工作区里。我要它改哪篇文章,它就只改哪篇文章。我要它不要动其他文件,它就会先看 git 状态,尽量控制修改范围。
这种感觉比网页 AI 舒服太多。
网页 AI 再聪明,也还是隔着一层玻璃;Codex 则是真的坐进了项目里。
3. 它的工作反馈比较自然
我很喜欢它一边做事一边告诉我“现在在读旧文”“现在在看图片”“现在准备写目标文件”。这种过程反馈很重要,因为 Agent 不是一次性问答,它有时候会跑一会儿。
如果完全没反馈,人会不知道它是在认真干活,还是卡住了。
4. 它适合我这种“项目很多但都要维护”的状态
我现在的项目比较分散,有网站,有机器人,有服务器,有博客,有插件。如果每个项目都让我重新熟悉一遍,会非常累。
Codex 的优势就在于,它可以快速进入一个陌生目录,帮我把上下文重新捡起来。
这对我来说很重要。
很多项目最难的不是从 0 到 1,而是隔了几周之后重新打开。你会忘记当初为什么这么写,忘记哪个配置在哪,忘记部署脚本怎么跑。Agent 如果能帮我把这些线重新牵起来,就已经很有价值了。
六、Agent 好不好用,模型只是其中一部分
以前我会很关注模型排行榜,今天哪个模型最强,明天哪个模型代码能力第一。
现在我还是会关注,但没那么执着了。
因为真正使用 Agent 的时候,我发现模型只是其中一部分。更重要的是整个工作流:
- 工具能不能稳定调用。
- 上下文能不能放得下。
- 文件读写是否清晰。
- 终端命令能不能顺利跑。
- 浏览器验证是否方便。
- API 是否稳定。
- 模型切换是否麻烦。
如果这些东西不顺,就算模型很强,体验也会被打断。
反过来,如果工具链顺,模型稍微弱一点,有时候也能通过多轮迭代把事情做完。
这也是为什么我后来开始重视“中转站”这种基础设施。
因为 Agent 工具要真正日常使用,不能每次都卡在 API、额度、网络、模型切换上。它应该像水电一样,平时不需要想,真正需要的时候直接能用。
七、为什么我搭了 Shen AI 中转站
我搭 Shen AI 中转站的原因其实很简单:我自己需要一个稳定、低成本、适合 Codex 的模型入口。
它不是镜像站,也不是网页版 ChatGPT 的平替。它更准确的定位是:
面向 Codex 这类 Agent 工具的 OpenAI 兼容 API 中转站。
中转站是在 sub2api 的基础上搭建的,部署在我的洛杉矶服务器上。后台接的是官方账号调度,不是随便套一个别的模型假装 GPT。对我来说,最重要的就是稳定、便宜、模型对应关系清楚。
中转站地址是:
OpenAI 兼容基础地址是:
1 | |
具体使用说明我整理在飞书文档里:

这个文档里主要写了这些内容:
- 中转站怎么注册和登录。
- API Key 怎么创建。
- Base URL 应该怎么填。
- Codex 怎么使用。
ccswitch怎么导入配置。cockpit tools怎么配置。- 充值和常见问题。
一般来说,接入 OpenAI 兼容客户端时,可以按这个思路填写:
1 | |
如果报 401,大概率是 API Key 填错了。
如果报 404,优先检查 Base URL 有没有少写 /v1。
如果报 413 Payload Too Large,说明单次上下文太长,可以开新对话或者缩短输入。
这些问题看起来很小,但 Agent 工具一旦跑起来,对稳定性要求其实很高。因为它不是只发一条消息,而是会连续读文件、分析、调用工具、生成修改。如果中间 API 不稳定,整个体验就会断。
八、我为什么说 Codex 很适合配中转站
Codex 本身已经很好用,但如果 API 入口不顺,体验还是会打折。
所以我觉得现在比较舒服的组合是:
Codex + Shen AI 中转站 + ccswitch/cockpit tools
其中 Codex 负责真正干活,中转站负责模型入口,ccswitch 或 cockpit tools 负责配置管理。
这样有几个好处:
- 不用到处手改配置。
- 可以快速切换基础地址和模型。
- 适合多个 AI CLI 一起用,比如 Claude Code、Codex、OpenCode。
- 出问题时更容易定位是工具问题、模型问题,还是 API 地址问题。
我现在越来越觉得,AI Agent 的体验不是某一个点决定的,而是“整条链路”决定的。
模型强是一方面,工具顺也是一方面,稳定的 API 入口也是一方面。只有这些东西连起来,才会从“偶尔玩一下”变成“真的每天用”。
九、Agent 工具对我的影响
这段时间用下来,我最大的感受是:AI Agent 让我更敢开新项目,也更愿意维护旧项目。
以前我开一个项目会有心理负担,因为我知道后面会有很多琐碎工作:配置、报错、部署、文档、样式、兼容性。现在这些东西还是存在,但没那么吓人了。
比如我做镜室网站的时候,前后端、支付、技能系统、后台管理、部署,每一步都很麻烦。以前我可能做到一半就累了。但有 Agent 以后,我可以把很多“脏活累活”交给它,让自己更多关注产品逻辑和体验。

再比如写博客。
以前写一篇技术记录,我要自己翻旧文、找截图、整理链接、检查格式。现在我可以让 Agent 帮我把这些上下文先铺好,然后我再把观点讲清楚。
这不代表我不写了。
恰恰相反,它让我更容易开始写。
因为最难的不是打字,而是从一团乱麻里整理出一条线。Agent 很擅长帮我把线头找出来。
十、一些冷静的判断
当然,我也不觉得 Agent 已经完美了。
现在使用 Agent 还是有一些问题:
- 有时候会误判需求。
- 有时候会过度修改。
- 有时候会因为上下文太长而变笨。
- 有时候工具调用会失败。
- 有时候它会很自信地走错方向。
所以我现在用 Agent,会尽量遵循几个原则:
- 任务要说清楚,尤其是不要改哪些东西。
- 大改之前先让它读项目和说明。
- 能跑测试就跑测试。
- 涉及线上数据和配置时要谨慎。
- 最后一定要自己验收。
Agent 不是替代判断的人,而是放大执行力的工具。
如果方向是错的,它只会更快地跑向错误;如果方向是清楚的,它就真的很强。
十一、总结
现在回头看,我觉得 AI Agent 是一个很自然的进化。
从最早的网页问答,到代码补全,再到现在能进入项目目录工作的 Agent,AI 的位置一直在往真实工作流里靠近。
对我来说,Codex 是目前最接近“日常可用”的那一个。它不像单纯聊天框那样隔着项目,也不像纯命令行工具那样只会执行单点任务,而是能在一个完整工作流里持续推进。
Claude Code 很强,OpenCode 很自由,但 Codex 目前给我的综合体验最好。
所以我也专门搭了 Shen AI 中转站,让这个工作流更稳定一点。它部署在我的洛杉矶服务器上,基于 sub2api 搭建,主要面向 Codex 这类 Agent 工具使用。
如果你也想试试,可以看这个教程:
我现在越来越相信,未来真正好用的 AI,不只是模型本身变聪明,而是它能不能进入我们的真实生活和真实项目里,把事情一点点做完。
而 Agent,已经开始有这种味道了。