百度千帆:从词元经济到价值经济

2026-05-16 117 0
百度千帆:从词元经济到价值经济

当词元成为“新石油”,大厂开始从“烧钱换流量”转向“按词元计费”,竞争焦点也从参数竞赛转向了词元经济体系构建。


文|王雅迪

ID | BMR2004

随着OpenClaw(小龙虾)等智能体掀起的热潮,词元(Token)消耗从人机对话升级为机器自循环,其角色从模型训练的技术副产品,一跃成为可计量、可交易的战略资产。词元被业界比作AI时代的“新石油”和“新集装箱”,大厂开始从“烧钱换流量”转向“按词元计费”,竞争焦点也从参数竞赛转向了词元经济体系构建。


截至2026年2月,百度千帆最新成绩单显示,其已累计支持企业构建超130万个智能体,工具日均调用次数达到数千万级,沉淀出获客营销、错题批改等100多个高频场景,支撑智能硬件、制造、交通、能源等主流行业创新。


百度千帆的解题思路比较务实,其平台上主流模型的价格已降至每百万词元几毛钱的水平,1块钱可以让AI写大约1000篇800字作文。同时,百度千帆通过主动Cache模式等技术创新,为企业降低高达80%的推理成本。百度千帆平台产品负责人张婷用乐高积木形象地比喻词元,她认为,大模型的训练,本质上就是在学习:什么样的词元序列,在什么样的上下文里,应该接什么样的下一个词元。这是一个极其庞大的“乐高拼法手册”。


01

词元如何定价?


对价格最敏感的是高频调用的ToC产品团队,词元成本直接决定了他们的商业模式能否跑通;而大企业则更关注稳定性、安全性和合规性。


从定义上看,词元是大模型处理语言时最小的处理单位,但它既不完全等于一个字,也不完全等于一个词,而是介于两者之间的一种“语言碎片”。


张婷举例表示,汉字“我”是一个词元,“今天”可能是一个词元,但“标记化”这个词可能被拆成“标记”和“化”两个词元。英文就更直观了,“Tokenization”这个单词可能被拆成“Token”+“ization”两部分,大模型面对的语言是全球性的,不可能给每一种语言单独设计一套处理规则。词元是一种通用的“最大公约数”,让模型可以用统一的方式处理所有语言和符号。


之所以拆词元是由计算机处理语言的底层原理决定的,计算机本质上只能处理数字,它并不认识“字”,为了让AI理解,大模型会先给每个词元分配一个数字编号,再将这个编号转化为一组数字坐标(向量),这决定了AI如何“理解”这个词。词元计量的是生成答案所需的全部计算资源。


据张婷介绍,百度千帆平台服务了大量企业客户,他们的数据里有行业术语、专有名词,词元机制的灵活性让模型可以“见到新词也不慌”,这一点在工业、金融、医疗等垂直领域尤为重要。


那么企业要为词元付多少钱呢?收费模式是怎样的?


黄仁勋曾在演讲中首次公开了词元的分层定价体系。免费层:高吞吐量、低速度,用于吸引用户;基础层:每百万词元3美元,服务普通用户;进阶层:每百万词元6美元,更大模型、更快速度;高速层:每百万词元45美元,支持长上下文、深度推理;顶级层:每百万词元150美元,面向超长研究任务、关键路径实时响应。


词元是一种持续性消耗,只要AI还在跑,词元就在烧。对价格最敏感的是高频调用的To C产品团队,词元成本直接决定了他们的商业模式能否跑通;而大企业则更关注稳定性、安全性和合规性。


张婷表示,定价是一道多元方程,变量很多。首先是硬件成本,GPU芯片是大模型推理最核心的成本,一张高端GPU动辄几十万元,运行一个大模型需要几十甚至几百张GPU同时工作。电费也是实打实的开销,一个大型推理集群一年的电费就是天文数字;其次是研发摊销,服务好一个大模型的推理服务,需要投入大量的工程师、数据、算力,这些研发成本需要通过产品收入来回收;最后还有运维和安全,保证服务99.99%可用、做内容安全过滤、防止滥用,这些都需要成本。


目前百度千帆平台上主流模型的价格,便宜的已经到了每百万词元几毛钱的水平。而在3年前,词元的价格大概是现在的几十倍甚至上百倍。这一成本优势源于百度千帆积累的技术能力,百度对推理引擎的极致优化、自研的昆仑芯片以及文心大模型的持续优化,使其推理效率在业内处于领先水平。


02

成本优势从何而来?


“硬件+系统”的组合拳,让百度千帆在同样的单位成本下能够跑出更多的词元,从底层为词元的持续降价提供了结构性支撑。


词元价格持续走低的背后,不是简单的“降价促销”,而是技术创新的系统性突破。百度千帆依托百度智能云的全栈自研能力,构建了从昆仑芯片到百舸平台,再到文心大模型及应用的一体化闭环。这种“芯片—框架—模型—应用”的四层架构,每一层都为下一层做极致优化,避免了跨厂商适配带来的效率损耗。


百度对推理引擎的极致优化、自研昆仑芯片以及文心大模型的持续优化,让同样的钱能跑出更多的词元。这个效率优势不是靠压缩利润得来的,而是从底层架构中“省”出来的。


硬件层是词元成本的第一道关卡,算力的核心是芯片。在硬件层面,百度在超节点领域的布局颇具前瞻性,在2025百度世界大会上,百度发布了新一代昆仑芯M100和M300,同步推出天池256超节点与天池512超节点,计划于今年正式上市,其中单个天池512超节点就能完成万亿参数模型训练。2025年,昆仑芯已累计完成数万卡部署,百度已点亮昆仑芯三万卡集群,可同时支撑多个千亿参数大模型训练。


这意味着处理同样数量的词元,需要的硬件更少、能耗更低、散热成本更小。对于日均调用量动辄万亿级别的平台来说,这些数字直接体现在词元单价的下行曲线上。


在系统层面,百舸大规模推理加速系统通过大规模分布式推理的PD分离、MOE模型专家并行优化等技术创新,使推理吞吐提升20倍,推理速度提升50%以上,推理成本进一步降低。例如,MOE专家并行针对混合专家模型的特点,让不同的专家模型并行工作,避免了算力闲置。这些技术听起来复杂,但落到客户账上就是一句话:同样的一块钱,能买到的词元数量翻了几十倍。


这种“硬件+系统”的组合拳,让百度千帆在同样的单位成本下能够跑出更多的词元,从底层为词元的持续降价提供了结构性支撑。


技术优势最终需要转化为客户价值。在模型层面,百度千帆进一步扩大开放模型生态。除支持文心5.0等150余个精选SOTA模型外,近期还将密集上线Kimi K2.5、GLM 4.7、MiniMax M2.1等多款开源SOTA模型,确保企业和开发者能够第一时间调用行业最优质的模型资源。


更关键的是,百度千帆在推理效率上做了大量精细化的优化。针对智能体应用中常见的长对话、多轮调用场景,平台推出了“主动Cache模式”,通过创新的分布式KVCache技术,可为企业降低高达80%的推理成本。同时,平台首创的思维链精细化控制能力,能够智能判断任务复杂度,为简单问题匹配短路径思考,为复杂问题调用多步推理,在保障效果的同时有效控制词元消耗。


张婷表示,对价格最敏感的,To C产品团队,比如做AI写作工具、智能客服、教育辅导App的创业公司,他们的商业模式是“低价或免费给用户用”,词元成本直接决定他们能不能活下去。一旦日活用户增长,词元消耗会指数级放大,价格差一点点,算下来一个月就是几十万元的差距。


让她印象比较深的是一家做法律科技的公司。他们的产品需要分析海量合同文本,每份合同动辄几万字,词元消耗量极大。早期他们用某家海外API,一个月的词元费用是主要成本支出。切换到千帆平台之后,一方面价格更低,另一方面百度针对长文本推理做了专项优化,处理效率提升了30%以上,他们的产品体验和成本结构同时得到了改善。


目前,百度千帆平台纳管了全球超过150个SOTA模型,工具组件日均调用量达亿级;数据服务实现处理提效6倍、计算降本30%。截至目前,基于千帆平台开发的智能体数量已突破130万个,平台客户数量达46万以上。


03

从词元经济到价值经济


当词元价格不再是门槛,竞争的焦点转向了模型能力、响应速度、定制化程度以及对特定行业的理解深度。


张婷做了一个预判:5年后,“词元”这个词可能从普通用户的视野里消失,但它的价值会以另一种形式存在。计费方式可能从“按词元数”演变成“按任务结果”,就像打滴滴不需要关心汽油消耗了多少升,用AI写一份报告你也不用关心消耗了多少词元,直接为“成果”付费。


这个判断并非空想。在百度千帆的客户实践中,已经有企业不再盯着词元单价,而是关注“完成一个商业任务需要多少钱”。例如,某电商客户使用千帆的智能客服智能体,不关心每次对话消耗了多少词元,只关心“解决了多少客诉、节省了多少人工成本”。当AI从工具变为“数字员工”,计费逻辑自然要从“资源消耗”转向“产出价值”。


同时,随着多模态AI的发展——文字、图片、视频、音频都成为模型的输入输出,“词元”的定义本身也会扩展。图像词元、音频词元、视频词元等等,计量单位可能会更复杂,但对用户的呈现会更简单。


2025年,百度千帆的品牌战略已从“百度智能云千帆”升级为“百度千帆”,更加聚焦企业生产场景,提供涵盖模型服务、智能体开发服务、数据服务在内的一站式服务。


例如,词元映射帮助全球钻石画龙头“蒂彩工艺”实现生产力重构。通过在业务流中引入千帆智能体节点,将原本需要设计师耗时3小时的钻石画底图生产工作缩减至30秒,打通了从修图到生产排版的全流程自动化,极大地释放了企业产能。在这个案例中,客户付费的依据不再是消耗了多少词元,而是“30秒完成3小时的工作”——效率提升了360倍,这是真正的价值锚点。


根据IDC报告,2025上半年,中国MaaS市场规模达12.9亿元,同比增长421.2%;AI大模型解决方案市场规模达30.7亿元,同比增长122.1%。在这两个市场,百度智能云均处于领先地位,在AI大模型解决方案市场以16.6%的份额领跑,在大模型中标市场以48个中标项目和5.1亿元中标金额居“双第一”。


这个数据说明,百度千帆已经跨过了“技术验证”阶段,进入了“规模化商用”阶段。当词元价格不再是门槛,竞争的焦点转向了模型能力、响应速度、定制化程度以及对特定行业的理解深度——而这些恰恰是百度千帆通过服务数十万家企业积累起来的“护城河”。


张婷指出:“在百度千帆,我们现在已经在布局这个方向。MaaS只是起点,最终我们希望提供的是端到端的AI能力,让企业客户不用关心底层是哪个模型、消耗了多少词元,只需要关注:AI帮我解决了什么问题,带来了多少价值。这才是我们认为的AI商业化的终局形态。”


实际上,基于智能体Infra底座,百度千帆已在体育智能、工业制造、知识服务等多个行业深度落地,将智能体从辅助工具升级为真正的决策伙伴。


例如,在体育智能领域,匠体体育科技基于千帆搭建“足球分析大脑Agent”多智能体系统。利用4000多场高水平比赛、超过400万条数据,训练出70多个针对特定技战术场景的小模型,构建球员个人评估、战术效能评估、训练设计等多个Agent,让智能体从辅助工具演变成能融入教练决策链的虚拟助教团队。


在工业制造领域,一脉云数基于百度千帆解决数据孤岛、技术复杂、集成难度等工业智能体落地的行业痛点,深耕重型装备、工业机器人、新能源汽车等工业领域智能化转型。在帮助某制造企业进行供应链管理优化的过程中,实现了物流效率提高25%、库存周转加速18%的显著成效。


张婷预测,词元的价格还会继续下降,而且还有很大的下降空间。驱动降价的底层逻辑没有变:芯片算力在增长、模型效率在提升、基础设施的规模效应在累积。这三条曲线都指向同一个方向——词元越来越便宜。一个标志性的节点是,词元的价格会便宜到让普通个人开发者“不用在意”的程度,就像现在没人会为发一条微信消耗的流量而心疼一样。估计这个节点在3—5年内会到来。


来源 | 《商学院》杂志5月刊

我也说一句

已经有条评论

全部评论

    上一篇:数字时代的商业“良知”

    下一篇:月之暗面给出新答案,把更多词元转化为有效智能

    QQ空间 新浪微博 豆瓣网 微信

    请先来登录吧

    没有经营者账号?立即注册
    忘记密码?

    请先来注册吧

    已有经营者账号?立即登录

      报名成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了

      加入班级成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了