字节跳动,极致Token效率工厂的诞生

lnradio.com 5 0

来源:@中国企业家杂志微博

字节跳动,极致Token效率工厂的诞生

Token竞争焦点正在从规模化消耗,转向高质量消耗。Agent能否支撑起企业级服务的能力边界,也面临考验。

文|《中国企业家》记者 闫俊文

见习编辑|李原 编辑|何伊凡

头图来源|视觉中国

过去,字节跳动曾被称为“App工厂”。现在,它正把自己打造为极致效率的“Token工厂”。

4月2日,在“2026年AI创新巡展”上,火山引擎总裁谭待说:截至今年3月,豆包大模型日均Token使用量已突破120万亿,在过去三个月内增长一倍。从规模上看,Token使用量仅次于谷歌与OpenAI。

火山引擎将核心增量归功于两大产品的强势拉动:Seedance2.0的领先优势以及OpenClaw(龙虾)的爆火。Seedance2.0的SOTA能力让AI创作产业化和商业化成为可能。过去,生产AI漫剧每分钟的成本动辄超过一万元,在Seedance帮助下,成本降低了50%。龙虾则完成了一次Agent全民启蒙教育,也让Token成为行业公认的“AI货币”。

“我们两年前就提出了Token的相关概念,当时行业里还不太认可。觉得Token粘性差、毛利低,都是赔钱赚吆喝。”谭待在会后对《中国企业家》等媒体说。

直到2025年下半年,行业围绕Token的计费和统计口径,争论还十分激烈。其中,火山引擎更强调外部客户产生的真实Token消耗;阿里云则更强调有效的API调用,双方据此也发生了“究竟谁是云厂商第一”的争论。

今年初,一切有了答案。Token被视为衡量大模型使用效率和企业AI转型的核心指标。3月16日,阿里成立ATH(Alibaba Token Hub)事业群,由阿里巴巴集团CEO吴泳铭直接负责,将“创造Token、输送Token、应用Token”视为核心目标。

火山引擎也由此赢下了第一场MaaS的胜利——虽然很难说,未来的仗是否也变得更难了。

字节跳动,极致Token效率工厂的诞生

随着MaaS与Token成为行业共识,头部厂商悉数重兵入场,赛道全面升温。竞争焦点也从规模化消耗Token,转向高质量、高效率、高价值消耗Token。与此同时,Agent能否真正支撑起企业级服务的能力边界,也面临考验。

一方面,各家都需要强化Agent的技术能力和服务效率,提升长文本理解与多源信息调取能力。另一方面,火山也将越来越离不开豆包大模型、飞书等生态体系的深度协同。

字节自己,也在积极求变。一方面,Seed团队持续攻坚技术极限,打造视频生成、图像创作、代码编程、文本理解等全领域SOTA标杆模型,不断刷新模型能力上限;另一方面,火山引擎也将技术能力加速工具化、产品化,高效推向市场。

4月2日,火山引擎宣布Seedance2.0正式面向企业用户开放公测,同时推出自己的龙虾产品“ArkClaw”。同时,火山引擎也在用几大举措,拥抱Token浪潮。

第一,要提升Token能力,并确保定价优势。谭待表示,新一代模型会分不同尺寸,比如Pro、Lite、Mini。同时,Token价格必须与模型能力、产出价值绑定,即使单Token理论成本可能更高,但创造的经济价值要同步提升。

第二,产品和工具要可“Skill化”和插件化,方便龙虾集成。围绕企业高频场景,火山引擎推出了营销视频、数据处理、联网搜索、市场洞察、ClawSentry安全防护等多元化Skill。同时,字节也上线了ClawHub中国镜像站,精选优质Skill,供开发者一键下载安装。

第三,要深度协同抖音等超级App。一位抖音电商商家对《中国企业家》透露,目前,抖音已经对商家发布的带货、营销视频提出原创要求,不能是混剪或者二创。但对AI原生视频,抖音非常宽容,“AI生成视频标原创是完全没问题的”。

Token涨价潮,字节不跟

Token资源消耗量的急剧增加,既带来了算力资源紧张、供需失衡,也让不少大模型厂商开启了涨价。

其中,腾讯混元部分模型输入、输出价格均上涨了超5倍。阿里云对AI算力、存储等产品也进行调价,其中,采用自研芯片的“平头哥真武810E”等算力卡产品,价格上涨了5%~34%。百度智能云则宣布,AI算力相关产品服务上调5%~30%;并行文件存储等上调约30%,两家新价格均从4月18日起生效。

面对涨价潮,谭待的逻辑是:看Token价格,不能抛开模型能力,否则没有任何意义。“就像买手机、芯片要看单算力成本一样,to B也是这个逻辑。模型智力水平提升自然会涨价,也能创造更大价值。”

谭待建议,要回归第一性原理。在同等级模型中,通过工程和调度优化,做到成本最低。

他以近期被频频吐槽的龙虾耗费Token费用过高举例。“不是Token本身贵,而是无效Token消耗太多。其中一大半是无谓的探索,这都可以通过优化Skill配合、压缩等方法来优化。”

为鼓励员工更多使用龙虾/Coding等AI工具,近期各大公司纷纷加大了Token补贴。一些科技公司甚至发出通知,使用Token少的公司,有被末位淘汰的风险。

由此也引发了一个关键命题:当员工借助龙虾、Claude Code等AI工具,实现个人能力提升后,企业整体的组织生产力是否可以同步跃升?

“我们强烈建议,对于企业管理者,一定要建立企业专属的Token看板。每天看一看,企业对内和对外,都使用了多少Token,鼓励员工通过AI提升效率。”谭待在演讲中说。

同时,他也提出了一个颇具启发性的洞察:企业构建Agent体系,分为敏态和稳态两种思路,可以同步进行。

敏态Agent更强调探索,重点是解决个人生产力的问题,是企业的“创新试验场”。比如帮助HR优化招聘、辅助市场人员做深度分析、支持员工提升专业效率等,这些都可以大胆尝试、快速迭代。

稳态Agent,则是要探索出“最佳实践”后,将AI能力流程化,管理好Token的成本、效率和风险。比如合同交易、流程生产等,就需要固化Agent流程,降低幻觉,做好规模化服务,重点解决组织生产力的问题。

龙虾竞赛,将产品和工具Skill化

虽然字节已经凭借领先的Token消耗规模领跑,但科技公司围绕龙虾,还在拉开更激烈的竞赛。其中,腾讯上线的龙虾系产品,主打直连微信和QQ,抢占用户心智。火山引擎则以技术和生态为矛,推出字节版ArkClaw,以及各类Skill、插件适配。

火山引擎云基础产品负责人田涛涛表示:如果一件事情重复做3次,就应该写成一个Skill。他解释说,Skill是最小可复用的Agent能力单元,它将“人会做的事情”转化为“Agent会做的事情”。

一个标准的Skill包括三个方面:第一,能力定义,精准描述业务能力;第二,调用方式,提供具体的技术执行路径和参数约束,比如API或者CLI(命令行界面)等;第三,安全管控,确保能力调用的合规和安全,比如API Key等。

火山引擎正在把过往的能力和产品Skill化。比如,将视频内容理解、分辨率调整以及视频修复打包成Skill,方便用户将其安装到龙虾中,特点是开箱即用。

在生态建设上,字节跳动不仅上线了ClawHub中国镜像站,解决国内开发者访问延迟问题,还打造了企业级SkillHub平台,提供Skill开发、审核、发布、运营、下架全生命周期管理。相关负责人透露,未来Skill将实现资产化,第三方企业可将自研Skill上架至平台,火山引擎将提供完整商业化路径。

谭待在接受采访时也表示:在Skill技能层面,一是坚持开放,二是整合自身已有的能力和资源。“不用太担心竞争问题,目前中国龙虾类产品的用户量大概只有百万量级,而中国的工作人员数量庞大,若人人手里有一两只龙虾,市场潜力非常大。”

《中国企业家》观察到,火山引擎也试图将龙虾能力装进硬件,它们委托第三方公司做了一款硬件产品“显眼包”,帮助ArkClaw的龙虾能力落地。其试用的场景包括个人助手、养娃陪伴以及飞书办公等。

字节跳动,极致Token效率工厂的诞生

2025年年底,火山引擎曾推出玩具AI框架、音频AI框架等开发套件。如今,为了释放龙虾能力,火山引擎也将“AI音视频互动”作为插件供龙虾调用,让龙虾“开口说话”。

一家AI影视公司在演讲中说,他们正在使用火山的AI应用开发工具“AI MediaKit”打造“视听数字员工”。MediaKit内置了多个原子能力的Skill,比如剪辑工具、音频工具、AI处理工具等,配合本地部署的ArkClaw,可覆盖制片、剪辑、宣发等环节,显著提升全流程效率。

大厂追赶,字节不惧怕竞争

全力推进自身布局的同时,火山引擎面临的外部竞争愈发激烈。

科技企业围绕Token的争夺,已从业务层面的布局比拼,深入渗透至组织架构、产品体系、生态协同等核心维度。一场关乎未来算力分配、生态主导权与商业化制高点的行业竞速,已然全面打响。

字节跳动,极致Token效率工厂的诞生