比同行低99% 字节挑起大模型价格战

在AI上“迟钝”了的字节，凭借价格“逃逸了一波平庸”。主力模型0.0008元/千tokens，较行业价格便宜99.3%的水平，让外界直呼字节跳动开启了大模型的“价格战”。对行业来说，门槛的下降意味着生态繁荣进程的再度提速，而对字节跳动来说，这场“迟到”的发布会，或许也意味着庞大的字节正在理顺自己做AI的逻辑。

“价格力”

AI也开始讲“价格力”了。5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布，目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等9款模型。

豆包大模型原名“云雀”，是国内首批通过算法备案的大模型之一。但比起首次集体亮相的豆包大模型家族，价格才是这场发布会最大的意外和惊喜。

“豆包通用模型Pro 32k模型，正式定价是0.8厘/千tokens，比行业价格降低99.3%。”发布会上，火山引擎总裁谭待公布这一数字的话音一落，现场就响起了一阵惊呼和掌声。以至于让谭待重复，“对，没有听错，是降低99.3%”。

相比起来，市面上同规格模型的定价一般为0.12元/千tokens，是豆包模型价格的150倍。火山引擎公布的价格计算显示，一元钱能买到豆包主力模型的125万tokens，大约是200万个汉字，相当于三本《三国演义》。

什么支撑了豆包大模型的定价，这可能是定价消息一出，最先跳出来的问题。在发布会后的群采中，谭待解释称，团队在技术上有非常多优化手段，包括通过模型结构的优化调整，把成本做低、效果做好，通过分布式推理、混合调度大幅度降低部署成本等。

调用量给了豆包低价的底气，而低价则是为了撬动更大的市场。据悉，经过一年的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿tokens文本，生成3000万张图片。谭待认为，降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

“豆包的低价使得更多企业和个人能够负担得起大模型的使用费用，从而降低了大模型技术的使用门槛，这将有助于大模型在更多行业和场景中的落地应用。”北京市社会科学院副研究员王鹏对北京商报记者进一步分析称，低价策略有助于吸引更多的潜在客户，扩大市场份额。随着用户基数的增加，大模型的商业化前景也将更加广阔。

输不起的竞赛

在时间节点上，AI的“价格力”故事也有巧合。两天前，OpenAI用GPT-4o炸场，在API使用方面，相比GPT-4-turbo，GPT-4o价格降低一半，速度提升两倍。

同一天，智谱大模型开放平台上线了新的价格体系。其中入门级产品GLM-3 Turbo模型调用价格下调80%，从5元/百万tokens降至1元/百万tokens。

“从全球范围看，大模型的推理成本，特别是非顶尖大模型推理成本的下降，比之前预估的进度要快得多。”在接受北京商报记者采访时，互联网投资人庄明浩如此说道。

而从国内情况来看，低价可能也是一个必然之举。庄明浩称，相比起国外屈指可数的几家大模型企业，国内大模型的竞争环境更为复杂，头部企业、明星创业公司林立。但与之相对的是，应用层的爆发却慢于预期。因此在技术能力已经进入相对瓶颈的阶段时，尽可能地拓展应用生态，也是商业惯例。

而在头部大模型企业中，大洋彼岸的战况同样激烈。北京时间5月15日凌晨，谷歌正式反击OpenAI，不仅带来了轻量化的模型Gemini 1.5 Flash、AI通用智能体Project Astra等重量级发布，还推出了OpenAI“跳票”了的AI搜索，捍卫了自己在搜索市场上的地位。

对于如今字节跳动是否会引发降价连锁反应的问题，王鹏认为，当一家企业采取低价策略时，其他竞争对手为了保持或扩大市场份额，往往也会采取相应的降价措施。因此，豆包的低价策略很可能触发大模型行业的价格战。

有人甚至戏称，可能要不了多久，企业调用大模型将不再需要成本，甚至企业调用大模型，相应的大模型企业应该提供补贴。这种玩笑反映了两个层面的焦虑，一个在于应用生态，另一个在于市场竞争。

谭待也提到，对企业来说，在AI转型上充满太多不确定性，必须要让试错成本尽量低。

“大模型发展至今，基础技术到达瓶颈，人们迫切想要知道大模型能够做什么，是否真的能实现飞轮效应，这些都需要时间，也需要钱。在这场没人输得起的竞赛中，是否会走向一种极端的价格战，谁也说不清。”庄明浩说道。

而对于烧钱的大模型来说，低价是否会压缩盈利空间，也成为核心议题之一。对此，王鹏认为，降价无疑会在短期内对企业的盈利空间造成一定压力。然而，这种压力可以通过扩大市场份额和提高使用率来缓解。

从长期看，王鹏认为，随着用户数量的增加和使用频率的提高，企业可以实现规模经济，降低单位成本，从而在一定程度上抵消降价带来的影响。此外，企业还可以通过提供增值服务、定制化服务等方式来增加收入来源，以应对降价带来的盈利压力。

“我们不是以亏损为代价做这件事的，亏损是接受不了的。”群采中，谭待也提到，定价的基础是对技术的信心。

迟到的发布会

2024年初的年度全员会上，字节跳动CEO梁汝波给字节跳动2024年定下的关键词是“始终创业，逃逸平庸的重力”。那场演讲中，梁汝波多次提及“危机感”，比如组织平庸化的危机感、迟钝的危机感。

AI也是危机感的来源之一。梁汝波说，公司层面的半年度技术回顾，直到2023年才开始讨论GPT，而业内做得比较好的大模型创业公司都是在2018—2021年创立的。

这样的评价其实与外界对字节跳动AI线条过于低调甚至“慢了”的印象不谋而合——此前包括豆包、扣子等产品发布的消息，大多是以“网传”的形式而被外界接收，火山引擎原动力大会可能是字节第一场真正意义上聚焦AI的发布会。

而慢了的字节跳动，也需要找回自己的节奏，无论是产品的发布，还是“舞台”上的聚光。

“从传播角度看，字节跳动过去的AI动作其实非常低调，虽然豆包和扣子的数据不错，但可能只有最关心这个行业的人才会知道，声量上远不如智谱、MiniMax等企业。从这个意义上看，字节跳动需要这样一场发布会，让事情回到应有的状态里。”庄明浩说。

事实上，在长达一个小时的群采期间，豆包准备的时长与现在才发布的时间点也被多次提及。谭待给出的回应是，“我们的风格就是不准备好不要说出来”。

在庄明浩看来，字节跳动的“慢”和“低调”，可能都要归结于组织架构的庞大，“大模型一路发展下来，对这些体量超级大、业务超级复杂的公司而言，梳理好自身的AI战略本来就是一件非常困难的事”。

庄明浩举例称，字节跳动有各种各样的产品，也很擅长开发，造成如今的情况，更大可能是内部没有理清楚，到底是以火山引擎还是字节跳动的名义、是以豆包还是扣子的名义，是以to B还是to C的名义讲，这些可能都在字节跳动内部经历了一番博弈，划分清楚之后，才有了这样一场发布会。

巧合的是，群采期间，当被问及字节跳动在AI和大模型业务上的整体战略思考时，现场也有解释提到，谭待主要负责火山引擎的部分，“可以聊聊火山引擎的战略，字节跳动的战略可以回头再聊”。

北京商报记者杨月涵

比同行低99% 字节挑起大模型价格战

创业板指涨1.14%，房地产板块持续爆发丨早市热点

V观财报丨创意信息收年报问询函

高瓴一季度大幅买入半导体科技股：建仓AMD、英伟达、台积电

国际资管巨头持仓曝光桥水基金大幅增持苹果

新型城镇化概念异动拉升，诚邦股份涨停

工业富联董事长郑弘孟：预计今年AI服务器全球市占达40%

V观财报丨创意信息收年报问询函

V观财报｜吴旭杭内幕交易“通润装备”被罚没超1亿

国内商品期市午盘多数上涨

创业板指涨1.14%，房地产板块持续爆发丨早市热点

胖东来能否拯救传统商超

旅游板块震荡走强