最近Codex的热度,真的感觉直线飙升。
社群里一直有人问,什么时候出新的教程。

我其实在二月份的时候,写过一篇Codex的教程。
但说实话,那时候的Codex热度很低,而且几个月过去,那时候跟现在开启了爆更模式的Codex比,几乎是两个产品了。
所以我觉得,是时候重新给大家写一篇更加全面的Codex教程了。
带大家全面的了解一下这个我现在觉得最牛逼的Agent产品之一。
我也准备用两个比较有手就行的例子,用一个网页和一个App,来串起这一整篇教程。
跟着做,相信你们也能实现。

好,废话不多说,我们直接开始。
一. 安装Codex
一切的前提,当然就是有魔法和ChatGPT账号了,这个我们就不管了,大家只能自己去想办法解决。
然后,我们可以直接去OpenAI的Codex官网下载安装。
链接在此:https://chatgpt.com/zh-Hans-CN/codex/
Mac和Windows都有。
我来用Mac做个演示。
点击下载安装。

然后正常打开,进行登录。
Codex的额度是跟你的ChatGPT会员相关的,我自己一般是100美刀的会员,200刀的在Claude那边,如果你比较轻度的话,20美刀的其实也勉强能用。

也可以使用其他方式使用Codex,比如API key,这个就看大家自己了。

登录之后,这里根据你的情况随便选一个,或者跳过也行。

接下来,最骚的来了,你可以从Claude Code和Cowork直接导入所有的内容。

Codex不光天天重置额度喊你来用,还能帮你搬家,一键继承之前的全部配置。
之前Claude支持导入记忆来挖ChatGPT用户,现在Codex直接反手一刀挖你Claude Code用户,你就说爽不爽吧。
我都想给它鞠个躬。
根据你的需求进行选择后,你就能进入到界面里面了。
二. 认识界面
进来后,界面长这样。
我先带大家快速认识一下各个区域。

中间这一大块,就是我们平时的对话区,跟平时用的AI聊天差不多。
左边栏是来管理你的所有对话和项目。
这里分两个目录,一个叫对话,一个叫项目。

对话适合不需要绑定到特定文件夹的任务,比如做做调研、做做规划,这些零碎的小任务里。

项目才是Codex真正的主战场。
选一个本地文件夹作为项目目录,Codex就会以这个文件夹为工作区间,所有生成的文件都会自动存进去。
一个项目里可以开好几个对话,每条对话就是一条独立的任务线,它们共享同一个文件夹里的文件,但记录互相隔离。

如果你所有事情都堆在同一个对话里,记录越来越长,上下文污染会很严重。
所以*的是,同一个方向的任务放同一个项目,具体的每件事开一条新对话去推进。
说到这我真心建议一句,前期的分类我是真的觉得挺重要的,不然到后期,真的会很抓狂。。。
我们可以在左侧项目这边点击这个加号新建文件夹,或者使用一个现有的。

然后,你就进入到了一个具体的项目里,也能看到对话框有变化了。
然后在对话框左下角有三档权限选择。

保守一点就选默认权限,就是动个啥都需要你审批。
自动审查适合日常开发,碰到有风险的操作会拦一下,比如删除大量文件、访问敏感目录等这些。
然后像我一般是选完全访问权限,因为这样就不会每次都征求同意了,全部直接自动运行。
毕竟我又不是开发出身,弹出来的东西我也看不懂,你问我,我能懂个啥。那不如直接全部放开,让它自己搞就完事了。
对话框右下角可以切换模型和推理等级。
模型直接不用管,无脑选目前最强的GPT-5.5。

推理等级日常用高就够了,遇到真正的硬活大活再开超高就行。
速度有快速和标准,快速是1.5倍的速度2倍的token消耗量,还挺烧token的,不过说实话,标准跟快速的速度也没差特别多,在你token不是那种可以无限烧的情况下,我还是推荐大家使用标准。

右下角还有一个小麦克风,就是Codex自带的语音输入,不过使用体验还是挺烂的,录完以后要等好几秒才能转写出来,不是特别推荐大家用,相比起来,你直接用豆包的语音输入法更香。

当然,用着用着,你可能会好奇自己还剩多少额度。

点左下角的设置,找到剩余额度,就能看到你5小时内还剩多少、这周还剩多少、啥时候刷新。

像我这周太忙了,白花花的额度都没空用,真的佛了。
三. 修改设置
我知道你看到这儿已经急得抓耳挠腮,恨不得当场造个玩意出来。
但我还是建议大家,先跟着我,改一下设置,有些东西稍微搞一下,这一步,不!能!跳!
打开左下角的设置。

常规设置设置里面的这三个,都打开。

往下滑,跟进行为改成引导,这样你发现中途你想修改的时候就可以直接插入,而不是必须等着那个任务做完才能进行新一轮的对话。

如果在刚才开头那一步忘了导入Claude Code的内容,也没关系,在这里也可以补导入。

接下来,设置AGENTS.md。
这是从上往下分层穿透的约束体系,也就是你给codex设置的家法。
*层全局生效的AGENTS.md。
在个性化设置的自义定指令里修改。
他是你为codex提供的全局通用的规则。
这个设好了,不管你以后开多少个新对话,他都会记得。

这块就不给大家推荐我自己的了,我自己的太自定义了,我也给大家推荐一个我觉得不错的来自大神卡帕西的模板,可以直接复制粘贴使用。
Behavioral guidelines to reduce common LLM coding mistakes. Merge with project-specific instructions as needed.**Tradeoff:** These guidelines bias toward caution over speed. For trivial tasks, use judgment.## 1. Think Before Coding**Don't assume. Don't hide confusion. Surface tradeoffs.**Before implementing:- State your assumptions explicitly. If uncertain, ask.- If multiple interpretations exist, present them - don't pick silently.- If a simpler approach exists, say so. Push back when warranted.- If something is unclear, stop. Name what's confusing. Ask.## 2. Simplicity First**Minimum code that solves the problem. Nothing speculative.**- No features beyond what was asked.- No abstractions for single-use code.- No "flexibility" or "configurability" that wasn't requested.- No error handling for impossible scenarios.- If you write 200 lines and it could be 50, rewrite it.Ask yourself: "Would a senior engineer say this is overcomplicated?" If yes, simplify.## 3. Surgical Changes**Touch only what you must. Clean up only your own mess.**When editing existing code:- Don't "improve" adjacent code, comments, or formatting.- Don't refactor things that aren't broken.- Match existing style, even if you'd do it differently.- If you notice unrelated dead code, mention it - don't delete it.When your changes create orphans:- Remove imports/variables/functions that YOUR changes made unused.- Don't remove pre-existing dead code unless asked.The test: Every changed line should trace directly to the user's request.## 4. Goal-Driven Execution**Define success criteria. Loop until verified.**Transform tasks into verifiable goals:- "Add validation" → "Write tests for invalid inputs, then make them pass"- "Fix the bug" → "Write a test that reproduces it, then make it pass"- "Refactor X" → "Ensure tests pass before and after"For multi-step tasks, state a brief plan:1. [Step] → verify: [check]2. [Step] → verify: [check]3. [Step] → verify: [check]Strong success criteria let you loop independently. Weak criteria ("make it work") require constant clarification.---**These guidelines are working if:** fewer unnecessary changes in diffs, fewer rewrites due to overcomplication, and clarifying questions come before implementation rather than after mistakes.
然后记忆的两个功能,我推荐都可以在设置下的个性化中打开。

打开以后,它会在你结束对话或者闲置了一段时间之后,自动把之前的对话总结成记忆片段保存下来,以后遇到相关的场景会自动调出来用。
在设置的外观里往下翻,*下有个宠物的区域,有经典的Codex形象,也有各种各样其他的,就跟Claude code的那个一样,大家想养,可以自己去养着玩玩。

四. skills与插件
然后,我们再来介绍一下插件和技能。
在codex里,都是从插件这个tab点进去。

然后顶部就有tab可以切换插件和技能。

技能这个东西,就是Skills,字面意思,给Agent用的技能。
我相信大家对这个东西已经非常了解了,但是如果你确实还不知道的话,可以去看我之前写的那篇《一文带你看懂,火爆全网的Skills到底是个啥。》
插件就是把一组技能、工具、配置打包起来的安装包,你可以理解为比技能更牛逼更成熟的东西。
Codex的好处是,都做了可视化UI界面。

你可以直接点击右上角的管理,进入管理界面,批量管理你的插件和skills。

同时也自带了Skill创建器和插件创建器,你想做个啥,都可以直接右上角点创建。

然后大白话告诉他你要做什么样的技能和插件就行。

如果要下载除了官方之外的skill或者插件,直接把链接甩给他就可以。

其他的都跟别的Agent,没有特别大的区别。
五. 开发一个网页
现在,你终于可以大展身手了。
先带大家,直接开发一个小网页,走一遍流程。
当你建好一个项目文件夹之后。

按一下左边的加号,打开计划模式的开关。

计划模式就是只规划不动手,先帮你把方案理清楚,你确认了再开始做。
每个稍微复杂一点的项目,我都推荐你先用这个模式过一遍。
打开以后对话框左边会出现一个小图标,说明你现在在计划模式下。

接下来,咱们跟他说,帮我做一个Codex功能介绍的网页,要好看,要有设计感,把所有功能按层级分类展示出来。

它会先问你几个问题。

你直接点选回答就行,回答完以后,它会给你一份比较完整的方案计划。

当你确认没毛病之后,就可以开始实施。
中间的开发过程我就不截图了,反正全自动的。
这种小网页,基本就是一遍成,做完之后,他就会给你提示,你可以直接用Codex的内置浏览器打开看看效果。

打开之后会看到一个预览页面,中间有一条线可以左右拖动来对比。

右上角有几个按钮。

*个是截图,点一下就能截取当前页面,效果就像下面这样。

第二个是批注,这个是我用得最多的功能之一,真的很香。
点开批注之后,你可以直接在页面上圈选任何元素,写上你的修改意见。
比如说我想让他改成官方的logo,直接在页面上选中它,手动输入文字说明就行了,不用再截图或者用嘴去描述一大堆

而且最近刚上的一个新功能是,像字体、字号、颜色这些参数,选中之后可以直接调,改完实时就能看到效果。

注释完,点右上角发送。

修改后的效果就是这样的。

当然,现在做出来的网页是跑在你本地的,只有你自己能看到。
如果你想发给别人看,就需要把它部署到服务器上。
我们公司内部人员部署网站,用的是一个我专门给公司同事搓的Skill,安装好之后直接让Codex调用就行了,非常方便。

输入/,就可以调用skill。

具体怎么部署到自己的服务器,每个人的情况不一样,这里就不展开了,相信大家自己能够搞定。
六. 开发一个APP
接下来呢,我们再来个更进阶一点的,同时更好玩的,就是,做一个APP。
我用一个自己的真实需求来演示。
就比如说最近刚体检完,结果确实不太好,去了医院看了一下,医生给我开了三种药,一天吃两到三次,有的饭前半小时吃,有的饭后吃,搞得我头都大了。
而且我经常搞混,刚刚到底吃了没有???
所以我就想,要不要做一个手机上的用药提醒App,来通知提醒我吃药。
就这么个特别临时特别小的东西,正好拿来当演示case了。
同样,开启计划模式,说出我的需求,Codex会问一些问题,然后你老样子回答一下。

最后,给一份方案,确认实施计划。

过程同样不截图了,反正我干别的事情没管了,全是自动跑,大概二十分钟后做出来了。

它给了一堆乱七八糟的文件,看不懂没关系,不知道怎么安装到手机上也没关系。
你就直接说,我现在想传到我的手机上。

Codex会告诉你,得先安装Xcode。
因为开发一个APP跟开发网页不一样。
你可以简单的理解为,网页用浏览器就能跑,但APP需要一个专门的本地化开发工具,苹果这边叫Xcode,只有装了这个东西,才能把APP编译出来装到手机上。

你其实也不用管什么事Xcode,我觉得绝大多数人电脑上大概率也没有提前安装Xcode,所以呢,你就可以用一个Codex的很屌的邪修方法,直接@Computer Use,让他来帮我搜索、下载和安装。
这里的@,是用来点名插件的。

Computer Use是我平时经常使用的插件之一,也是Codex上最棒的能力之一,全世界能视觉化的操控你电脑的就没几家,Codex做的非常好了。
如果要使用,需要先去设置里把Computer Use的开关打开。

另一个常用的就是Codex for Chrome,想要使用同样需要开启开关。
这个能沿用你Chrome里已经登录的账号状态,操控浏览器。

并且在这个过程中,用Tab Group来隔离工作区,不会抢你的标签页,你该干嘛干嘛。

软件下载完之后,你都不用打开Xcode,你也不用管,你可以直接让Computer Use来帮你操作后面所有的编译步骤。

用的过程中,电脑上方还会显示一个操控状态的提示条。

不过,碰到需要输入密码或者登录账号这种涉及安全的步骤,它会停下来,让你自己来操作。

剩下的交给他一点一点自己操作就行。

到手机端的步骤,就只能自己来了,比如用数据线连接两台设备,开启开发者模式,重启手机,确认信任,这些跟着Codex的指引一步一步来就行。

不一会App就装到手机上了,虽然我忘记做AppIcon了,不过这不重要。

里面的雏形也做好了。

做到这里,如果你希望继续远程继续开发的话,你还可以,就掏出手机继续操作。
这里就要介绍一个非常非常非常爽的功能是,在手机上操作codex。
目前只能在mac上连接,iOS/Android手机都可以。
这是前两天刚上线的新功能,我还专门写过一篇文章。《Codex更新远程控制,你也终于可以在手机上随时随地Vibe Coding了。》

最后做出来也没啥问题,非常方便。

到时间了,也会跳出弹窗来提醒我。

就很简单,也很有意思。
当然,如果你要上架AppStore的话,那就是另一码事了,我就不在文章里面详细说了,你可以让Codex继续给你操作。
写在最后
最后,有一个东西,我确实还是得单独说一下。
就是,让Windows用户破防的事情。
Mac用户目前是Codex里的高贵VIP,Windows用户只是。。。站票。
我整理了一张表,列了一下Mac支持但Windows不支持的功能。

前面用过的Computer Use、远程手机连接就不说了。
Appshots,双击Command键就能把你当前前台窗口的截图和文字一起发给Codex,不用再截图粘贴或者用嘴描述半天,它直接就能看到你屏幕上的东西。
Locked Computer Use,锁屏后Codex还能继续操控你的Mac。
Chronicle,屏幕上下文记忆,Codex会在后台观察你的屏幕,把你最近在干什么自动记下来。
Goal Mode,给Codex定一个目标,它就会自己持续跑下去,直到完成。
这些,全是Mac专属。
Windows的朋友们,只能再等等吧。
这也是为啥,我给公司里的同时,除了财务HR法务这种特殊群体之外,几乎全员配Mac的原因。。。
最后。
希望大家coding愉快。
【本文由投资界合作伙伴微信公众号:数字生命卡兹克授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。




