AI agent思考

前言

最近这段时间，我明显感觉到自己使用 AI 的方式变了。

以前我用 AI，更多是在网页里面问问题：让它解释一个概念，帮我润色一段话，或者写一小段代码。那时候 AI 更像一个很聪明的聊天框，我问一句，它答一句，最多也就是连续对话。

但是现在不太一样了。

现在我更常用的是 Codex、Claude Code、OpenCode 这一类 Agent 工具。它们不是只回答问题，而是会进入项目目录，会读文件，会跑命令，会改代码，会看报错，会自己迭代。也就是说，AI 不再只是一个“知道很多东西的人”，而更像是一个可以和我一起坐在项目里面干活的人。

这篇文章就想随便聊聊我对 AI Agent 的一些感受，也顺便整理一下我最近使用 Codex、Claude Code、OpenCode 这些工具的体验。最后也会引出我自己搭建的一个东西：Shen AI 中转站。

Shen AI 中转站首页

一、我理解的 AI Agent

如果很简单地说，我觉得 AI Agent 和普通聊天 AI 最大的区别，不是模型本身有多强，而是它有没有“行动能力”。

普通聊天 AI 的边界大概是：

你把问题发给它。
它根据上下文回答。
你再把回答拿去执行。

Agent 的边界就往外扩了一圈：

它可以自己读项目文件。
它可以调用终端和工具。
它可以把一个大任务拆成几个小步骤。
它可以根据报错继续修。
它可以在代码、文档、浏览器、命令行之间来回切换。

这件事对我来说很关键。

因为我其实一直在做一些比较杂的项目，比如 Discord/QQ 机器人、镜室网站、珅玉定制 APP、Gemini 插件、博客、服务器部署等等。以前这些事情都需要我自己不断在代码、文档、网页、终端之间切换。AI 虽然能给建议，但最后落地还是要靠我一点点复制粘贴。

而 Agent 工具出现以后，很多工作变成了：

我说清楚我要什么，它去项目里面找路径，然后直接开干。

当然，这不代表我可以完全不管。相反，越是用 Agent，我越觉得“人”的责任不是消失了，而是从写每一行代码，变成了判断方向、定义目标、验收结果。

这一点和我前面写 Discord 机器人时的感受有点像：Discord 机器人开发历程。机器人真正变好用，不是因为它功能堆得越来越多，而是因为边界越来越清楚。Agent 也是一样，它不是万能的，但是只要边界给清楚，它就非常能干。

二、从聊天框到工作台

最开始用 AI 写代码的时候，我基本都是网页工作流。

比如我有一个 bug，就把报错复制到 ChatGPT 或者 Claude 里面，然后它给我一段修改建议。我再打开 VS Code，找到文件，手动改，重新运行。如果报错继续出现，我再复制报错回去。

这个流程的问题是，中间有很多“人工搬运”。

AI 不知道我的完整项目结构，也不知道我改完之后运行结果怎么样。它只能根据我给它的片段猜。只要我漏贴一个文件，或者项目里有另一个隐藏逻辑，它就很容易给出看起来很合理但实际跑不通的方案。

Agent 工具的体验就明显不同。

它可以直接看整个项目。比如我让它“帮我修一下这个页面移动端按钮溢出的问题”，它会先搜相关组件，再看 CSS，再改文件，然后启动本地服务，最后打开浏览器截图验证。这个过程里，人不用一直当复制粘贴机器。

我觉得这才是 AI 编程真正开始好用的地方。

不是因为它每次都一次成功，而是因为它终于能在真实项目里循环：

观察现状。
修改代码。
运行验证。
根据结果继续调整。

这个循环一旦跑起来，AI 就不只是“建议生成器”，而是“执行合作者”。

机器人命令和工具入口

三、Claude Code：很强，但也比较有性格

Claude Code 是我比较早开始认真用的 Agent 工具之一，我之前也在 AI工具使用指南里记录过一些基本命令。

它最大的优点是代码理解能力强，尤其是在复杂项目里面，它很会读上下文。你给它一个需求，它通常会先看项目结构，再根据已有代码风格去改，不太会一上来就硬写一套完全不符合项目风格的东西。

我比较喜欢 Claude Code 的几个点：

对长上下文的理解比较稳。
对项目结构的归纳能力强。
写代码时比较偏谨慎。
适合做已有项目的维护和复杂逻辑修改。

比如我之前调机器人后台、模型配置、记忆逻辑这些东西的时候，Claude Code 的优势就比较明显。它能看出某个函数和另一个模块之间的关系，也能提醒我一些潜在问题。

但是 Claude Code 也不是没有问题。

它有时候会比较“贵”，而且国内直接使用不一定方便。另一个问题是，它有时会显得过于谨慎，做一点事要确认很多东西。这个其实不算坏事，只是当我已经很明确想让它直接改的时候，就会觉得节奏稍微慢一点。

所以我对 Claude Code 的定位是：

很适合复杂项目、长上下文、需要稳一点的代码改造。

它像一个很强的工程搭档，但前提是你要给它一个比较顺的使用环境。

四、OpenCode：开放、灵活，但需要自己折腾

OpenCode 给我的感觉是更开放，也更适合喜欢折腾的人。

它本身的思路很吸引我：可以接不同模型，可以配置不同 provider，可以做 session 管理，也可以做自定义命令和自定义 agent。我之前在 AI工具使用指南里也记过它的一些命令，比如 /models、/connect、/sessions、/init、/compact 等等。

这类工具有一个很大的优势：自由。

你可以接 DeepSeek，可以接 Gemini，可以接 OpenRouter，也可以接自己搭的中转站。它不像某些封闭工具那样只能走固定模型，而是更像一个可以自己拼装的 AI CLI 工作台。

模型选择示例

但是自由也意味着折腾成本。

配置 provider、处理模型格式、处理 API base URL、处理上下文长度、处理工具调用兼容性，这些东西对于熟悉的人来说很好玩，但对于第一次用的人来说可能会有一点门槛。

我觉得 OpenCode 适合两类人：

一类是已经熟悉 AI CLI，想要更自由地切换模型。
另一类是愿意折腾配置，把它当成自己的工作流底座。

如果只是想“开箱即用”，它可能没有那么丝滑。但如果愿意调，它的上限很高。

五、Codex：目前我最喜欢的状态

最近用下来，我最想推荐的还是 Codex。

这里说的 Codex，不只是“让 AI 写代码”，而是现在这种真正的本地 coding agent 工作方式。它会在项目目录里读文件、改文件、跑测试、看截图，也会把过程解释给我听。

我喜欢 Codex 的原因主要有几个。

1. 它很像真实的项目协作

我把需求告诉它，它会先看项目，不会直接胡写。比如这次写博客，它不是直接开始编，而是先读了我以前几篇文章，看我的行文风格，再看图片目录，再打开飞书文档确认中转站说明。

这个流程就很像一个靠谱的人类协作者：先理解上下文，再动手。

2. 它和本地文件系统结合得很好

写博客、改代码、整理文档，本质上都离不开文件。

Codex 最大的好处是它就在本地工作区里。我要它改哪篇文章，它就只改哪篇文章。我要它不要动其他文件，它就会先看 git 状态，尽量控制修改范围。

这种感觉比网页 AI 舒服太多。

网页 AI 再聪明，也还是隔着一层玻璃；Codex 则是真的坐进了项目里。

3. 它的工作反馈比较自然

我很喜欢它一边做事一边告诉我“现在在读旧文”“现在在看图片”“现在准备写目标文件”。这种过程反馈很重要，因为 Agent 不是一次性问答，它有时候会跑一会儿。

如果完全没反馈，人会不知道它是在认真干活，还是卡住了。

4. 它适合我这种“项目很多但都要维护”的状态

我现在的项目比较分散，有网站，有机器人，有服务器，有博客，有插件。如果每个项目都让我重新熟悉一遍，会非常累。

Codex 的优势就在于，它可以快速进入一个陌生目录，帮我把上下文重新捡起来。

这对我来说很重要。

很多项目最难的不是从 0 到 1，而是隔了几周之后重新打开。你会忘记当初为什么这么写，忘记哪个配置在哪，忘记部署脚本怎么跑。Agent 如果能帮我把这些线重新牵起来，就已经很有价值了。

六、Agent 好不好用，模型只是其中一部分

以前我会很关注模型排行榜，今天哪个模型最强，明天哪个模型代码能力第一。

现在我还是会关注，但没那么执着了。

因为真正使用 Agent 的时候，我发现模型只是其中一部分。更重要的是整个工作流：

工具能不能稳定调用。
上下文能不能放得下。
文件读写是否清晰。
终端命令能不能顺利跑。
浏览器验证是否方便。
API 是否稳定。
模型切换是否麻烦。

如果这些东西不顺，就算模型很强，体验也会被打断。

反过来，如果工具链顺，模型稍微弱一点，有时候也能通过多轮迭代把事情做完。

这也是为什么我后来开始重视“中转站”这种基础设施。

因为 Agent 工具要真正日常使用，不能每次都卡在 API、额度、网络、模型切换上。它应该像水电一样，平时不需要想，真正需要的时候直接能用。

七、为什么我搭了 Shen AI 中转站

我搭 Shen AI 中转站的原因其实很简单：我自己需要一个稳定、低成本、适合 Codex 的模型入口。

它不是镜像站，也不是网页版 ChatGPT 的平替。它更准确的定位是：

面向 Codex 这类 Agent 工具的 OpenAI 兼容 API 中转站。

中转站是在 sub2api 的基础上搭建的，部署在我的洛杉矶服务器上。后台接的是官方账号调度，不是随便套一个别的模型假装 GPT。对我来说，最重要的就是稳定、便宜、模型对应关系清楚。

中转站地址是：

https://skill-chat.cn

OpenAI 兼容基础地址是：

1	`https://skill-chat.cn/v1`

具体使用说明我整理在飞书文档里：

Shen AI 中转站使用教程

这个文档里主要写了这些内容：

中转站怎么注册和登录。
API Key 怎么创建。
Base URL 应该怎么填。
Codex 怎么使用。
ccswitch 怎么导入配置。
cockpit tools 怎么配置。
充值和常见问题。

一般来说，接入 OpenAI 兼容客户端时，可以按这个思路填写：

Provider / 提供商: OpenAI Compatible
Base URL / 基础地址: https://skill-chat.cn/v1
API Key: 你在站内创建的 sk- 开头密钥
Model: 按账户可用模型填写

如果报 401，大概率是 API Key 填错了。

如果报 404，优先检查 Base URL 有没有少写 /v1。

如果报 413 Payload Too Large，说明单次上下文太长，可以开新对话或者缩短输入。

这些问题看起来很小，但 Agent 工具一旦跑起来，对稳定性要求其实很高。因为它不是只发一条消息，而是会连续读文件、分析、调用工具、生成修改。如果中间 API 不稳定，整个体验就会断。

八、我为什么说 Codex 很适合配中转站

Codex 本身已经很好用，但如果 API 入口不顺，体验还是会打折。

所以我觉得现在比较舒服的组合是：

Codex + Shen AI 中转站 + ccswitch/cockpit tools

其中 Codex 负责真正干活，中转站负责模型入口，ccswitch 或 cockpit tools 负责配置管理。

这样有几个好处：

不用到处手改配置。
可以快速切换基础地址和模型。
适合多个 AI CLI 一起用，比如 Claude Code、Codex、OpenCode。
出问题时更容易定位是工具问题、模型问题，还是 API 地址问题。

我现在越来越觉得，AI Agent 的体验不是某一个点决定的，而是“整条链路”决定的。

模型强是一方面，工具顺也是一方面，稳定的 API 入口也是一方面。只有这些东西连起来，才会从“偶尔玩一下”变成“真的每天用”。

九、Agent 工具对我的影响

这段时间用下来，我最大的感受是：AI Agent 让我更敢开新项目，也更愿意维护旧项目。

以前我开一个项目会有心理负担，因为我知道后面会有很多琐碎工作：配置、报错、部署、文档、样式、兼容性。现在这些东西还是存在，但没那么吓人了。

比如我做镜室网站的时候，前后端、支付、技能系统、后台管理、部署，每一步都很麻烦。以前我可能做到一半就累了。但有 Agent 以后，我可以把很多“脏活累活”交给它，让自己更多关注产品逻辑和体验。

镜室网站首页

再比如写博客。

以前写一篇技术记录，我要自己翻旧文、找截图、整理链接、检查格式。现在我可以让 Agent 帮我把这些上下文先铺好，然后我再把观点讲清楚。

这不代表我不写了。

恰恰相反，它让我更容易开始写。

因为最难的不是打字，而是从一团乱麻里整理出一条线。Agent 很擅长帮我把线头找出来。

十、一些冷静的判断

当然，我也不觉得 Agent 已经完美了。

现在使用 Agent 还是有一些问题：

有时候会误判需求。
有时候会过度修改。
有时候会因为上下文太长而变笨。
有时候工具调用会失败。
有时候它会很自信地走错方向。

所以我现在用 Agent，会尽量遵循几个原则：

任务要说清楚，尤其是不要改哪些东西。
大改之前先让它读项目和说明。
能跑测试就跑测试。
涉及线上数据和配置时要谨慎。
最后一定要自己验收。

Agent 不是替代判断的人，而是放大执行力的工具。

如果方向是错的，它只会更快地跑向错误；如果方向是清楚的，它就真的很强。

十一、总结

现在回头看，我觉得 AI Agent 是一个很自然的进化。

从最早的网页问答，到代码补全，再到现在能进入项目目录工作的 Agent，AI 的位置一直在往真实工作流里靠近。

对我来说，Codex 是目前最接近“日常可用”的那一个。它不像单纯聊天框那样隔着项目，也不像纯命令行工具那样只会执行单点任务，而是能在一个完整工作流里持续推进。

Claude Code 很强，OpenCode 很自由，但 Codex 目前给我的综合体验最好。

所以我也专门搭了 Shen AI 中转站，让这个工作流更稳定一点。它部署在我的洛杉矶服务器上，基于 sub2api 搭建，主要面向 Codex 这类 Agent 工具使用。

如果你也想试试，可以看这个教程：

Shen AI 中转站使用教程

我现在越来越相信，未来真正好用的 AI，不只是模型本身变聪明，而是它能不能进入我们的真实生活和真实项目里，把事情一点点做完。

而 Agent，已经开始有这种味道了。

随笔

#公用

AI agent思考

http://example.com/2026/05/19/agent思考/

作者

Leo shen

发布于

2026年5月19日

许可协议

软著申请全流程下一篇