旗下矩阵

  • 投资界
  • 天天IPO
  • 解码LP
  • 并购
  • 前哨
  • 投资界AI

一手实测:三位深度用户告诉你,豆包收费值不值

上周豆包专业版上线,邀请三位用户实测。其有亮点,如录音转写好用,但也有问题,如额度使用快、干活易出bug,整体性价比待提升。
·微信公众号:数智前线 周享玥 丸子 肖客 周享玥 丸子 肖客

AI投资人解读

· 豆包专业版有三个付费挡位,为复杂工作和生产力场景推出全新服务,实测发现其录音转写好用,尤其对英文和专业名词的处理能力强,单一产品点有可能吸引重度用户付费。
· 办公模式干活能力存在不少bug,处理复杂行研分析仍存在幻觉,识图分析不准,定时任务易出现时间对齐问题。
总结:豆包专业版在特定功能上有亮点,但整体执行能力待提升,存在较多问题,付费性价比不高,投资价值有限,需关注其后续改进情况及能否解决现有问题。

上周,传了很久的豆包付费终于落地了——豆包专业版正式上线,包括连续包月68元、200元和500元三个挡位,分别对应标准、加强和高级套餐。

按官方说法,豆包专业版基于最新的豆包2.1系列大模型,为复杂工作、生产力场景推出全新服务,将提供更高的生产力场景使用额度,并接入豆包2.1Pro模型办公任务模式。

那么,豆包专业版实际体验如何?到底值不值得为它掏钱?

我们邀请了三位来自不同行业、使用习惯各异的用户分别进行实测。他们的需求截然不同。但测完之后,我们发现了一些不错的地方,也看到了一些共性问题。

先说几个结论:

第 一,也是最重要的,额度用得太快了!而且像开盲盒,完全不知道这个任务做完,额度会不会突然爆表。

第二,办公模式不错,分析规划做得好,但干活中容易出现bug,“嘴替”能力尚可,“手替”能力还不太行,需要反复调试,对普通用户来说仍有门槛。

第三,涉及到复杂行研分析等仍然存在幻觉,识图分析仍不准,编码能力可用,整体处在及格偏上一点水平。

第四,录音转写确实好用,尤其对英文和专业名词的处理,比很多专用工具都强,单一产品点有可能吸引重度用户付费。

01、标准版|68元/月:光配置任务,我已耗掉大部分额度

测试者:豆包用户,以搜集资料、写作、生图等任务为主

作为豆包用户,我之前工作中主要用它做搜索、写作、生图等任务。在这些场景中,付费版和免费版的效果差别大吗?实测显示,在生图任务中,两种模式下豆包都能准确理解需求,交出一份基本没什么差错的图片,但付费版出来的效果,在细节上更稳定,版本清晰度更高,无水印可商用。

不过,豆包办公版能不能做一些我之前畅想过但没有实现的刚需任务?

场景一:分析并清理亮红灯的C盘

豆包专业版的办公任务模式下,有一个功能是支持本地电脑和浏览器操作,这让我想到我的C盘经常亮红灯的问题。如果能让豆包先帮我深度分析空间占用,明确区分哪些文件可以安全删除、哪些需要确认、哪些绝 对不能碰,然后再逐步协助清理,那就太好了。

说干就干。收到指令后,豆包立刻开始扫描分析我的C盘,经过大约20分钟、30多个步骤的思考和执行后,最终输出了一份“C盘空间分析报告”。

整体来看,效果十分不错,报告中除了我要求的内容,它还给出了清理优先级和预期效果。它还帮我揪出了4个占用10G空间、隐藏近三年的录屏视频。

但当任务从总结分析来到清理执行环节,问题开始显现。

豆包在处理“无脑可删”文件时表现尚可。但当任务进行到删除四个录屏文件时,却提示由于文件被程序占用无法删除,后续的其他清理任务也就此中断,还提前做了最终的清理总结。

更诡异的是,此时C盘空间不减反增,从原来剩余3个多G,变成了只剩2个多G。它建议重启电脑,几经折腾后,最终只能靠我手动清理才腾出了空间。在执行可被删除的安装包时,再次出现bug——告知我已删除,内存占用却未见变化。截图给它看时,它甚至将“红色”误认为“蓝色”,和我说红灯问题已经解决。

总结下来,豆包的办公模式,确实能够操作电脑,但干活能力上,仍然存在不少bug,还不如我自己手动操作来得快。

场景二:播客和视频转写

第二个任务,源于我日常没有太多时间看视频或听长播客。豆包能否通过链接直接生成逐字稿和纪要?

实测发现,豆包提取的内容,比播客文字介绍要详实一点点,但比起整个播客内容,又极为简单。所以,不知道它是否真的解析了播客链接,解析到了什么程度。下面两张图分别是我的要求和它的反馈:

不过,豆包的实时录音转写功能效果很好。纪要清晰,排版美观,且附带金句总结、逐字稿、关键决策等。

最关键的是英文和专业名词转写,基本不出错。要知道,我花了上千元买的讯飞录音笔,最 大痛点就是如“ChatGPT”、“Agent”、“具身智能”等专业热门词汇常常无法正确转写,每次我还需要再花时间去对一遍。但豆包基本没有太多需要修改的地方。

一位同行在体验后也深有同感,甚至开始考虑要不要放弃积累了几年素材的讯飞账号,转而为豆包付费。

根据豆包的录音转写额度规则,免费版每日累计时长上限为90分钟,单次最长30分钟,轻度使用用户,免费版已经够用。但如果是重度用户,就更适合专业版:录音纪要等高级功能总额度为免费版5倍(折算每日可用450分钟)。不过,实际使用中,并非“1分钟录音=扣1分钟额度”,每个环节都有消耗,实时转写、人声分离、时间戳标注、全文语义理解......每一步都会调用大模型推理,实际长度达不到450分钟。

场景三:定时新闻早报

第三个刚需场景,是AI早报。我能不能让豆包每天早上9点自动搜集过去12小时的AI领域全球热点,并保存为桌面Word文档呢?

收到指令后,豆包真的帮我在桌面创建了一个“AI早报”文件夹。但第二天早上,它并没有推送给我任何早报,直到我主动询问,才发现它在时间对齐上出了点问题——认为时间还在前一天的下午,任务处在等待触发状态。

在我纠正大约7、8分钟后,豆包输出了一份质量不错的AI日报,查证后信息也基本无误。同时,豆包告诉我,从明天开始,这项任务将每天执行。然而,第二天,定时推送仍然没能自动触发,问题同样出在时间对齐上。

为了解决这个问题,我直接改用豆包“技能”板块中的“创建技能”功能,让它帮我创建一个“每日自动运行的AI早报Skill”,再三确认“定时推送“。但结果依旧没有触发。难道它本身就支持不了定时任务?我求助了开通500元版本的朋友,发现对方确实能准时收到推送。

不过,有趣的是,在7月1日,也是我暂时放弃调试的第二天,AI早报又罕见地自动触发了,来来回回折腾了多次后,这个定时任务现在已能成功运转了。

小结:

几个场景试用下来,我的整体感受是:豆包专业版在信息抓取、总结分析等“思考型”任务上表现不错,但执行能力还有待提升。更关键的是,标准版的额度实在有点不够用——光是配置任务,就已经耗掉了绝大多数额度。我原本计划测试的PPT生成、自动抓取招标数据并入表格等任务还没来得及跑,额度就已见底,只能等下一个周期,也就是一周后才能解锁新额度。

至于愿不愿意为它付费?从现阶段来看,它还没有十分打动我。我依然会用免费版,尤其在已经用得比较成熟的场景中,免费版已经够用。而对于一些更复杂的任务来说,专业版的“性价比”暂时还没有达到我的标准。

02、加强版|200元/月:从“它能做什么”到“我是不是不会用”

测试者: 前企业文化工作者,曾每天高强度使用豆包

我之前主要做企业文化工作,活非常杂,可以说每天高强度使用AI特别是豆包,采访、写大大小小的文案、策划方案、统筹、复盘,小到群消息文案,大到项目方案、OKR填写,都会用AI帮忙,离开AI真不知道这个职场怎么活。

公司也非常鼓励使用AI,在我离职前一个月,我们组收到任务要在公司做AI文化氛围,当时我的组长很激动,他说:“我们的目的是让所有目前还没有用上虾的同事,感到自己会被时代抛弃。”当时正是虾火热的时候,我的组长第 一时间体验了虾,每天都焦虑怕自己被AI替代。说实话,我当时的心情是,幸好我要走了,这个新项目不用我来做。

不上班之后,我搬到了云南,我还是会习惯使用豆包,但更多是生活上的琐事。就在前两天,我遛狗的时候一个没注意,小狗舔了蚂蚁,几分钟之后它腿软、舌头发白,状态类似休克,我一边打车去宠物医院,一边问豆包怎么办。它立刻告诉我怎么处理,我按照它的建议给小狗冲了嘴。后续我发现让狗狗过敏的蚂蚁是红火蚁,这种外来入侵物种对狗甚至人都有引发过敏的概率,我也把相关信息同步给小区物业,还把豆包的治理建议一并发给了他们。

场景一:小红书笔记和vlog生成与发布

开通豆包专业版之后,我正是无业状态,想让它帮我做小红书账号运营。为了记录小狗的成长,我在半年多以前为它专门开了一个小红书账号。一直以来都是佛系更新,没有定位没有人设,半年多就只有90个粉丝。

我希望专业版豆包能根据我提供给它的图片和视频,每天定时帮我发布小红书笔记,让这个账号实现常态化运营,解放双手的同时,让账号定位明晰,妄想能做大做强。

我给它布置了几个任务,首先帮我做一个账号运营的方案策划,其次定时发布一篇笔记,第三根据我给到的图片和视频素材剪一个小狗的vlog。

第 一个任务,它完成得特别好,毕竟写方案是老本行,定位、内容方向、更新节奏写得头头是道。很可惜,后两个任务它都没有完成。

先是自动发布。我折腾了一下午才发现,它根本登不上我的小红书账号 —— 反爬机制在那摆着,它总不能帮我过验证码吧?最让我无语的是,它做不到也不主动说,就假装在执行,等我发现怎么一直没发出去去问它,它才告诉我不行。来来回回折腾了十来次,我最后放弃了:与其跟它掰扯怎么登录,我自己点一下发布不就完了?

然后是剪 vlog。定好脚本之后,我给了它 60 张照片、9 个视频,让它根据文案选镜头剪。结果剪出来的东西根本没法看:要么画面突然从竖屏变成横屏,要么中间插好几秒黑屏,说好了剪 25 秒,导出来要么 20 秒要么 14 秒,来来回回改了11次,没一次能用的。反反复复,我感觉与其跟它浪费时间,不如自己手搓。

在这个过程里,我也反思了自己。也许我提供更细致的脚本,包括每个镜头用哪个画面,反馈时精确到第几秒怎么改,它也许能做到。我想,所有伟大的视频背后,都有一群手搓的匠人,即使是AI视频也是如此,像我这样吝于付出的人,得不到一个合格视频也在情理之中。

场景二:微信读书读书卡制作和更新

我还让它帮整理我的微信读书阅读历史、笔记,建立系统化的个人阅读库——因为我读完书总记不住读了什么,而且老觉得自己读书的类别比较固定,想有一个可沉淀的系统。

虽然一开始我提出需求时,豆包说它做不到,甚至教我如何用Claude实现。但在我的坚持下,它还是整理了我过去读书的偏好,根据我的痛点,帮我做了读书卡。

这个读书卡一方面会将我读过的书做整理,包括划线内容和笔记,另一方面也会将与这本书相关联的书做一个联系,还会将我们讨论过的内容整理上去。

我还让它帮我做了本地化,这样以后即使我不付费豆包了,只要双击就能同步更新我微信读书的划线和笔记。

然而,就在我以为一切大功告成的时候,突然发现它并没有自动更新书的笔记,在我指出后又信誓旦旦更新后会自动弹出网页。最终,它仍然失败,并且在我再次提问时,显示额度已经用完,再次使用要等到7月4日。这个时候距离我体验加强版豆包刚刚过去两天半的时间。

我对这个微信读书读书卡的执念仍有,于是向豆包免费版提问为什么自动化程序无效,它帮我排查了一顿,坚持认为程序OK,是我的node环境没有了。也是在这个时候,我求助了程序员男朋友。他看了我跟豆包的对话后,首先震惊于我为什么会把cookie给它,这是跟账号安全性有关的东西。

虽然我是个无知的用户,但豆包也在那个时候没有起到提醒和告知义务。

而且在回看豆包给我写的所谓的自动化整理读书卡的程序,在男朋友检查下发现,其实根本不是自动化,而是生成了几个静态网页而已。

同步我也体验了免费的——用腾讯官方出的IMA上安装了微信读书官方skill。它也同样能帮我分析阅读偏好和数据,但是当我让它帮我整理读过书的笔记时,它就显示算力不足了。

而在认识到豆包也失败后,我在男朋友的帮助下又尝试了免费版WorkBuddy(腾讯的Agent),在上面安装了微信读书skill,让它帮我整理读书笔记还有自动化任务,目前看也能完成我预期的百分之六七十。

小结:

是否愿意一直为它付费?我是不愿意付费的。

用付费版,首先是你真的有那么多场景和任务需要它帮你做。对我来说免费版的文案润色、常识问答其实已经足够。定时提醒、自动发布,好像也是被创造出来的需求,仔细想想我尝试的这些功能,用免费版豆包自己一步步操作也能实现。为了达到自动化,结果花了更多时间设置,有种本末倒置的感觉。

第二,用付费版其实是有门槛和学习成本的。不是说你打开对话框说两句话,它就能乖乖把活干好。你得会写提示词,得会设计工作流,得知道它能做什么不能做什么。我之所以那么快用完额度,也跟不会使用有关。我这几天用下来甚至有点焦虑:没事就搜“豆包专业版还能做什么”,遇到它做不好的时候,我第 一反应不是“这个功能不行”,而是“是不是我提示词写得不对?是不是我不会用?”

最后最重要的是安全问题。使用豆包Agent时,它无法完成的任务也不提示安全风险,而是想了一个让我给cookie的方案。而普通用户大部分时候无法辨别它要的东西到底该不该给。

当然这只是我个人的感受。如果你每天上班真的有大量重复的文案、方案、数据处理工作,那专业版也许真的能省很多时间。

03、高级版|500元/月:和20美元的Codex比,谁胜?

测试者:前大厂人士,目前OPC,每日重度使用AI

对比AI工具:豆包专业版(500元/月,Pro 2.1)vs Codex (20美元/月,GPT-5.5)

从去年底开始,我就在为AI付费了,现在每天都会用ChatGPT和Codex。二者分工明确:Codex负责项目型任务,比如做软件、深度调研、股票分析;ChatGPT除了日常搜索问答,也会用来写小说,语言能力更强。

目前最高频的使用场景是股市复盘。我设了一个自动化项目,每天晚上生成当天的复盘——数据、涨跌、资金流向、赛道热度,包括持仓建议。看新闻也是,Codex每天定时推给我一份美国大公司的新闻简报,我基本不再自己去一个个网站翻了。

我也在做一些探索性的任务。比如把营销工作拆解成可复用的Skill;用AI做图片类自媒体账号,结合热点出图;尝试让AI写风格化的小说。还有一个想法是,很多家长想让孩子参加课外体育培训,但不清楚孩子适合什么,市场上的机构也没有类似大众点评的评价体系,能否用AI做信息搜集整理,给家长和孩子提供建议——这件事也值得试。

另外,我平时也会配合用一些免费产品,比如DeepSeek,它的中文能力不错。偶尔碰一下智谱,但用得很少。豆包之前用得少,因为早期版本幻觉太严重,给你的答案不知道是真是假,还得自己去核实,那不如不用。

这次豆包推专业版,从介绍看是往生产力工具方向演进了。这已经是全球搞大模型公司的共识了,纯To C问答不挣钱,大家都在往办公、编程等生产力工具方向转。

怎么测它的能力?我选了三道题,分别考验三个方面的能力,同时给豆包专业版和Codex跑了一遍,看看结果怎么样。

先说结论。

豆包专业版整体表现在60-65分之间——能用,但还谈不上好用。Codex(还不是最 高级版本,用的GPT5.5)得分在75分-90分之间,差距仍然是客观存在的。

场景一:行业研究简报——信息多了,精度丢了

第 一道题,是生成一份有关《2026年中国AI办公Agent市场机会》的行业研究简报。这是日常办公任务中最通用的场景之一,主要考验AI工具信息搜集、整理、提炼、归纳的能力。

豆包的表现:内容看起来很多很全,但经不起细看。归纳提炼能力明显不足,信息堆砌感强,里面还混了不少错误信息。尤其当把这份报告给回到豆包核实哪些地方存在错误或失真时,它列出了至少六大类问题。显然,从严肃的行业研究角度看,豆包的表现还不够严谨——如果拿到的报告还需要逐条核实,那我很难会为这样一个“办公生产力”工具付费。

Codex的表现:胜在严谨,提炼归纳能力强。不过问题也很明显——海外模型对中文资料的抓取依然有缺陷。

评分:豆包专业版60分 vs Codex 75分

场景二:产品原型图识别与优化——看得见,但看不清

豆包这一次特别介绍了它的多模态能力,所以第二道题,我选了一张复杂的产品原型截图,让它做视觉识别、理解,然后进行迭代优化设计,主要考两个东西:多模态理解能力准不准,以及产品设计能力行不行。

豆包我给65分,它的视觉模型解析力不够细,有几处明显错误,幻觉仍然存在;比如客户总数的增长率,它读成了3.6%,实际根本不是;Top5渠道的数据也对不上,微信公众号被标成26.6%,也是错的。而在它的分析中显示“已经结束15天的‘618大促活动’”实际上刚结束5天。

不过豆包有一个优点:产品设计思路比较清晰。因为我给它的要求中提到这是一个企业AI营销工作台,而原来那张产品截图中,AI的产品感不明显,但豆包在迭代时主动把AI元素做得更突出了,用户的感知会更强。这一点是有想法的。

codex我给80分,它的视觉识别强,准确率明显更高,基本没有什么数据错误;但产品设计偏保守,只做了局部优化,不如豆包新颖。

后来我又让它们各自输出一版改进后的产品原型图,豆包的明显突出了AI元素。

Codex的,区别很小,局部优化了。

评分:豆包Pro 65分 vs Codex 80分

场景三:电梯调度游戏——不只是“能不能动”,而是“能不能好好动”

第三道题是一道编码题,我做一个电梯调度游戏,在120秒内尽量运送更多乘客,并减少乘客等待时间。这个任务的特点在于综合性——它不只是写代码,还涉及视觉呈现、交互逻辑、调度算法、软件工程的可测试性。而且这个游戏,不像贪吃蛇或数独那种网上到处都是源代码的游戏编码题,是需要模型有一些自己的分析和判断的。

都是第 一版直出的情况下,豆包专业版的表现,我给到60分。一些基础功能实现了,电梯能动,但问题不少。比如乘客应该在对应楼层,结果豆包给分开了,逻辑不大对。

右侧乘客列表的状态显示过于粗糙,没有明确显示“等待中 / 已分配 / 电梯中”的文字状态;等待中、电梯中样式类名错误,导致状态色不稳定。得分动画有写,但没有绑定具体楼层或乘客,反馈感较弱。

还有一个容易被忽视的点:软件工程的可测试性。而豆包的调试模式基本不可用。而且在一些细节问题上也不够精细,比如暂停后重新开始有遮罩残留。

Codex的表现,远胜豆包,可以给到90分。调度逻辑通顺,交互流畅,调试模式可用。扣分项主要在个别细节问题上。比如电梯上下客的节拍略显机械;移动端的适配不如PC端做得好(窄屏下单栏改成了单列,按钮宽度和字号也调整得不够顺眼,核心区域需要滚动才能看全,影响操作连续性)。

总体来看,豆包做一个“会动的电梯”没问题,但在调度逻辑、状态管理、交互反馈、可测试性这些考验工程能力的地方,还有所欠缺。Codex赢在基本功扎实,从算法到交互到可测试性都考虑到了。当然,豆包专业版这才是第 一个版本,指望第 一版就追平迭代了无数版本的Codex,本来也不现实。

评分:豆包Pro 60分 vs Codex 90分

小结:

一个AI工具,什么时候值得我为它掏钱?我觉得有三个判断标准。

首先,幻觉率要低,这是底线。我最怕的就是它把真的假的掺在一起说,还得我自己一条一条去核实,等于没有用。这个东西作为你去付费使用它,你一定是希望买的是一个你可以信任的一个结果,豆包这一点我觉得还得继续努力。如果达不到我觉得可用的一个标准,光凭这一点我就不会用它。这个事情得解决。

其次,是理解意图的能力要强。 以前用AI,提示词必须写得专业、完整、方方面面都照顾到。现在好的模型,不需要你提供复杂的提示词,可能一两句话,他就能清晰的理解你的意图,这个是模型强大的一个标准。

再就是一次成功率高,不需要反复迭代修改。

另外,我也比较看重几个复杂能力的协同,比如说这个是视觉的视频的多模态的。

从这几个标准看,这次测下来,豆包专业版给我的感觉是:方向对了,但能力还没完全跟上。500块一个月,60-65分的水平,肯定不够。

【本文由投资界合作伙伴微信公众号:数智前线授权发布,本平台仅提供信息存储服务。】
【免责声明】:本文不构成任何投资建议。市场有风险,投资需谨慎。
如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。