从0到1带你速通Codex，我整理的终极保姆教程来了

最近Codex的热度，真的感觉直线飙升。

社群里一直有人问，什么时候出新的教程。

我其实在二月份的时候，写过一篇Codex的教程。

但说实话，那时候的Codex热度很低，而且几个月过去，那时候跟现在开启了爆更模式的Codex比，几乎是两个产品了。

所以我觉得，是时候重新给大家写一篇更加全面的Codex教程了。

带大家全面的了解一下这个我现在觉得最牛逼的Agent产品之一。

我也准备用两个比较有手就行的例子，用一个网页和一个App，来串起这一整篇教程。

跟着做，相信你们也能实现。

好，废话不多说，我们直接开始。

一. 安装Codex

一切的前提，当然就是有魔法和ChatGPT账号了，这个我们就不管了，大家只能自己去想办法解决。

然后，我们可以直接去OpenAI的Codex官网下载安装。

链接在此：https://chatgpt.com/zh-Hans-CN/codex/

Mac和Windows都有。

我来用Mac做个演示。

点击下载安装。

然后正常打开，进行登录。

Codex的额度是跟你的ChatGPT会员相关的，我自己一般是100美刀的会员，200刀的在Claude那边，如果你比较轻度的话，20美刀的其实也勉强能用。

也可以使用其他方式使用Codex，比如API key，这个就看大家自己了。

登录之后，这里根据你的情况随便选一个，或者跳过也行。

接下来，最骚的来了，你可以从Claude Code和Cowork直接导入所有的内容。

Codex不光天天重置额度喊你来用，还能帮你搬家，一键继承之前的全部配置。

之前Claude支持导入记忆来挖ChatGPT用户，现在Codex直接反手一刀挖你Claude Code用户，你就说爽不爽吧。

我都想给它鞠个躬。

根据你的需求进行选择后，你就能进入到界面里面了。

二. 认识界面

进来后，界面长这样。

我先带大家快速认识一下各个区域。

中间这一大块，就是我们平时的对话区，跟平时用的AI聊天差不多。

左边栏是来管理你的所有对话和项目。

这里分两个目录，一个叫对话，一个叫项目。

对话适合不需要绑定到特定文件夹的任务，比如做做调研、做做规划，这些零碎的小任务里。

项目才是Codex真正的主战场。

选一个本地文件夹作为项目目录，Codex就会以这个文件夹为工作区间，所有生成的文件都会自动存进去。

一个项目里可以开好几个对话，每条对话就是一条独立的任务线，它们共享同一个文件夹里的文件，但记录互相隔离。

如果你所有事情都堆在同一个对话里，记录越来越长，上下文污染会很严重。

所以*的是，同一个方向的任务放同一个项目，具体的每件事开一条新对话去推进。

说到这我真心建议一句，前期的分类我是真的觉得挺重要的，不然到后期，真的会很抓狂。。。

我们可以在左侧项目这边点击这个加号新建文件夹，或者使用一个现有的。

然后，你就进入到了一个具体的项目里，也能看到对话框有变化了。

然后在对话框左下角有三档权限选择。

保守一点就选默认权限，就是动个啥都需要你审批。

自动审查适合日常开发，碰到有风险的操作会拦一下，比如删除大量文件、访问敏感目录等这些。

然后像我一般是选完全访问权限，因为这样就不会每次都征求同意了，全部直接自动运行。

毕竟我又不是开发出身，弹出来的东西我也看不懂，你问我，我能懂个啥。那不如直接全部放开，让它自己搞就完事了。

对话框右下角可以切换模型和推理等级。

模型直接不用管，无脑选目前最强的GPT-5.5。

推理等级日常用高就够了，遇到真正的硬活大活再开超高就行。

速度有快速和标准，快速是1.5倍的速度2倍的token消耗量，还挺烧token的，不过说实话，标准跟快速的速度也没差特别多，在你token不是那种可以无限烧的情况下，我还是推荐大家使用标准。

右下角还有一个小麦克风，就是Codex自带的语音输入，不过使用体验还是挺烂的，录完以后要等好几秒才能转写出来，不是特别推荐大家用，相比起来，你直接用豆包的语音输入法更香。

当然，用着用着，你可能会好奇自己还剩多少额度。

点左下角的设置，找到剩余额度，就能看到你5小时内还剩多少、这周还剩多少、啥时候刷新。

像我这周太忙了，白花花的额度都没空用，真的佛了。

三. 修改设置

我知道你看到这儿已经急得抓耳挠腮，恨不得当场造个玩意出来。

但我还是建议大家，先跟着我，改一下设置，有些东西稍微搞一下，这一步，不！能！跳！

打开左下角的设置。

常规设置设置里面的这三个，都打开。

往下滑，跟进行为改成引导，这样你发现中途你想修改的时候就可以直接插入，而不是必须等着那个任务做完才能进行新一轮的对话。

如果在刚才开头那一步忘了导入Claude Code的内容，也没关系，在这里也可以补导入。

接下来，设置AGENTS.md。

这是从上往下分层穿透的约束体系，也就是你给codex设置的家法。

*层全局生效的AGENTS.md。

在个性化设置的自义定指令里修改。

他是你为codex提供的全局通用的规则。

这个设好了，不管你以后开多少个新对话，他都会记得。

这块就不给大家推荐我自己的了，我自己的太自定义了，我也给大家推荐一个我觉得不错的来自大神卡帕西的模板，可以直接复制粘贴使用。

Behavioral guidelines to reduce common LLM coding mistakes. Merge with project-specific instructions as needed.**Tradeoff:** These guidelines bias toward caution over speed. For trivial tasks, use judgment.## 1. Think Before Coding**Don't assume. Don't hide confusion. Surface tradeoffs.**Before implementing:- State your assumptions explicitly. If uncertain, ask.- If multiple interpretations exist, present them - don't pick silently.- If a simpler approach exists, say so. Push back when warranted.- If something is unclear, stop. Name what's confusing. Ask.## 2. Simplicity First**Minimum code that solves the problem. Nothing speculative.**- No features beyond what was asked.- No abstractions for single-use code.- No "flexibility" or "configurability" that wasn't requested.- No error handling for impossible scenarios.- If you write 200 lines and it could be 50, rewrite it.Ask yourself: "Would a senior engineer say this is overcomplicated?" If yes, simplify.## 3. Surgical Changes**Touch only what you must. Clean up only your own mess.**When editing existing code:- Don't "improve" adjacent code, comments, or formatting.- Don't refactor things that aren't broken.- Match existing style, even if you'd do it differently.- If you notice unrelated dead code, mention it - don't delete it.When your changes create orphans:- Remove imports/variables/functions that YOUR changes made unused.- Don't remove pre-existing dead code unless asked.The test: Every changed line should trace directly to the user's request.## 4. Goal-Driven Execution**Define success criteria. Loop until verified.**Transform tasks into verifiable goals:- "Add validation" → "Write tests for invalid inputs, then make them pass"- "Fix the bug" → "Write a test that reproduces it, then make it pass"- "Refactor X" → "Ensure tests pass before and after"For multi-step tasks, state a brief plan:1. [Step] → verify: [check]2. [Step] → verify: [check]3. [Step] → verify: [check]Strong success criteria let you loop independently. Weak criteria ("make it work") require constant clarification.---**These guidelines are working if:** fewer unnecessary changes in diffs, fewer rewrites due to overcomplication, and clarifying questions come before implementation rather than after mistakes.

然后记忆的两个功能，我推荐都可以在设置下的个性化中打开。

打开以后，它会在你结束对话或者闲置了一段时间之后，自动把之前的对话总结成记忆片段保存下来，以后遇到相关的场景会自动调出来用。

在设置的外观里往下翻，*下有个宠物的区域，有经典的Codex形象，也有各种各样其他的，就跟Claude code的那个一样，大家想养，可以自己去养着玩玩。

四. skills与插件

然后，我们再来介绍一下插件和技能。

在codex里，都是从插件这个tab点进去。

然后顶部就有tab可以切换插件和技能。

技能这个东西，就是Skills，字面意思，给Agent用的技能。

我相信大家对这个东西已经非常了解了，但是如果你确实还不知道的话，可以去看我之前写的那篇《一文带你看懂，火爆全网的Skills到底是个啥。》

插件就是把一组技能、工具、配置打包起来的安装包，你可以理解为比技能更牛逼更成熟的东西。

Codex的好处是，都做了可视化UI界面。

你可以直接点击右上角的管理，进入管理界面，批量管理你的插件和skills。

同时也自带了Skill创建器和插件创建器，你想做个啥，都可以直接右上角点创建。

然后大白话告诉他你要做什么样的技能和插件就行。

如果要下载除了官方之外的skill或者插件，直接把链接甩给他就可以。

其他的都跟别的Agent，没有特别大的区别。

五. 开发一个网页

现在，你终于可以大展身手了。

先带大家，直接开发一个小网页，走一遍流程。

当你建好一个项目文件夹之后。

按一下左边的加号，打开计划模式的开关。

计划模式就是只规划不动手，先帮你把方案理清楚，你确认了再开始做。

每个稍微复杂一点的项目，我都推荐你先用这个模式过一遍。

打开以后对话框左边会出现一个小图标，说明你现在在计划模式下。

接下来，咱们跟他说，帮我做一个Codex功能介绍的网页，要好看，要有设计感，把所有功能按层级分类展示出来。

它会先问你几个问题。

你直接点选回答就行，回答完以后，它会给你一份比较完整的方案计划。

当你确认没毛病之后，就可以开始实施。

中间的开发过程我就不截图了，反正全自动的。

这种小网页，基本就是一遍成，做完之后，他就会给你提示，你可以直接用Codex的内置浏览器打开看看效果。

打开之后会看到一个预览页面，中间有一条线可以左右拖动来对比。

右上角有几个按钮。

*个是截图，点一下就能截取当前页面，效果就像下面这样。

第二个是批注，这个是我用得最多的功能之一，真的很香。

点开批注之后，你可以直接在页面上圈选任何元素，写上你的修改意见。

比如说我想让他改成官方的logo，直接在页面上选中它，手动输入文字说明就行了，不用再截图或者用嘴去描述一大堆

而且最近刚上的一个新功能是，像字体、字号、颜色这些参数，选中之后可以直接调，改完实时就能看到效果。

注释完，点右上角发送。

修改后的效果就是这样的。

当然，现在做出来的网页是跑在你本地的，只有你自己能看到。

如果你想发给别人看，就需要把它部署到服务器上。

我们公司内部人员部署网站，用的是一个我专门给公司同事搓的Skill，安装好之后直接让Codex调用就行了，非常方便。

输入/，就可以调用skill。

具体怎么部署到自己的服务器，每个人的情况不一样，这里就不展开了，相信大家自己能够搞定。

六. 开发一个APP

接下来呢，我们再来个更进阶一点的，同时更好玩的，就是，做一个APP。

我用一个自己的真实需求来演示。

就比如说最近刚体检完，结果确实不太好，去了医院看了一下，医生给我开了三种药，一天吃两到三次，有的饭前半小时吃，有的饭后吃，搞得我头都大了。

而且我经常搞混，刚刚到底吃了没有？？？

所以我就想，要不要做一个手机上的用药提醒App，来通知提醒我吃药。

就这么个特别临时特别小的东西，正好拿来当演示case了。

同样，开启计划模式，说出我的需求，Codex会问一些问题，然后你老样子回答一下。

最后，给一份方案，确认实施计划。

过程同样不截图了，反正我干别的事情没管了，全是自动跑，大概二十分钟后做出来了。

它给了一堆乱七八糟的文件，看不懂没关系，不知道怎么安装到手机上也没关系。

你就直接说，我现在想传到我的手机上。

Codex会告诉你，得先安装Xcode。

因为开发一个APP跟开发网页不一样。

你可以简单的理解为，网页用浏览器就能跑，但APP需要一个专门的本地化开发工具，苹果这边叫Xcode，只有装了这个东西，才能把APP编译出来装到手机上。

你其实也不用管什么事Xcode，我觉得绝大多数人电脑上大概率也没有提前安装Xcode，所以呢，你就可以用一个Codex的很屌的邪修方法，直接@Computer Use，让他来帮我搜索、下载和安装。

这里的@，是用来点名插件的。

Computer Use是我平时经常使用的插件之一，也是Codex上最棒的能力之一，全世界能视觉化的操控你电脑的就没几家，Codex做的非常好了。

如果要使用，需要先去设置里把Computer Use的开关打开。

另一个常用的就是Codex for Chrome，想要使用同样需要开启开关。

这个能沿用你Chrome里已经登录的账号状态，操控浏览器。

并且在这个过程中，用Tab Group来隔离工作区，不会抢你的标签页，你该干嘛干嘛。

软件下载完之后，你都不用打开Xcode，你也不用管，你可以直接让Computer Use来帮你操作后面所有的编译步骤。

用的过程中，电脑上方还会显示一个操控状态的提示条。

不过，碰到需要输入密码或者登录账号这种涉及安全的步骤，它会停下来，让你自己来操作。

剩下的交给他一点一点自己操作就行。

到手机端的步骤，就只能自己来了，比如用数据线连接两台设备，开启开发者模式，重启手机，确认信任，这些跟着Codex的指引一步一步来就行。

不一会App就装到手机上了，虽然我忘记做AppIcon了，不过这不重要。

里面的雏形也做好了。

做到这里，如果你希望继续远程继续开发的话，你还可以，就掏出手机继续操作。

这里就要介绍一个非常非常非常爽的功能是，在手机上操作codex。

目前只能在mac上连接，iOS/Android手机都可以。

这是前两天刚上线的新功能，我还专门写过一篇文章。《Codex更新远程控制，你也终于可以在手机上随时随地Vibe Coding了。》

最后做出来也没啥问题，非常方便。

到时间了，也会跳出弹窗来提醒我。

就很简单，也很有意思。

当然，如果你要上架AppStore的话，那就是另一码事了，我就不在文章里面详细说了，你可以让Codex继续给你操作。

写在最后

最后，有一个东西，我确实还是得单独说一下。

就是，让Windows用户破防的事情。

Mac用户目前是Codex里的高贵VIP，Windows用户只是。。。站票。

我整理了一张表，列了一下Mac支持但Windows不支持的功能。

前面用过的Computer Use、远程手机连接就不说了。

Appshots，双击Command键就能把你当前前台窗口的截图和文字一起发给Codex，不用再截图粘贴或者用嘴描述半天，它直接就能看到你屏幕上的东西。

Locked Computer Use，锁屏后Codex还能继续操控你的Mac。

Chronicle，屏幕上下文记忆，Codex会在后台观察你的屏幕，把你最近在干什么自动记下来。

Goal Mode，给Codex定一个目标，它就会自己持续跑下去，直到完成。

这些，全是Mac专属。

Windows的朋友们，只能再等等吧。

这也是为啥，我给公司里的同时，除了财务HR法务这种特殊群体之外，几乎全员配Mac的原因。。。

最后。

希望大家coding愉快。

【本文由投资界合作伙伴微信公众号：数字生命卡兹克授权发布，本平台仅提供信息存储服务。】如有任何疑问，请联系（editor@zero2ipo.com.cn）投资界处理。

从0到1带你速通Codex，我整理的终极保姆教程来了

AI投资人解读

本文涉及

相关资讯

卡帕西Anthropic最新头衔：技术员工（MTS）

Codex自我蒸馏玩法火了！

活过来的Codex，扛起了OpenAI上市的希望

谷歌不急，OpenAI很急

广西人工智能产业投资基金合伙企业（有限合伙）拟合作子基金公示

SpaceX和OpenAI抢着上市，华尔街准备好了吗？

关于我们

对外合作

投稿邮箱

联系我们

投资界微信

投资界APP