一夜之间态度转变,百度为何从闭源走向开源

2025-04-21 125 0

一夜之间态度转变,百度为何从闭源走向开源


开源、闭源,再开源,百度如何跑通AI商业生态?


文|钱丽娜

ID | BMR2004


2025年3月16日,文心大模型4.5和文心大模型X1正式发布。两款模型已在文心一言官网上线,免费向用户开放。


曾经百度将开源视为“智商税”,理由是当用户考虑大模型带来的价值时,闭源大模型比开源大模型更强大。但在今年DeepSeek以开源策略登顶用户榜后,百度迅速作出回应。2月13日,百度宣布4月1日起文心一言全部免费,上线深度搜索功能。一天后,百度宣布在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。文小言也已经接入DeepSeek-R1模型。


01

百度转向


很长一段时间,百度创始人李彦宏一直是闭源大模型的坚定拥护者。在Create2024百度AI开发者大会上,他谈到,在大模型领域,开源实际上是成本最高的,并且开源模型会变得越来越落后。它需要更大的参数规模才能追平闭源模型的能力,这将导致更高的推理成本和更慢的反应速度。因此,百度选择闭源以降低开发成本并保持技术领先性。当时他认为开源模型的价值仅局限在科研领域、学术研究或者高校学生拿来练手。


采用闭源模式的文心大模型4.0,算法训练效率比上一版提升5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理成本降到原来的1%。这些技术进步使得百度能够根据不同场景的需求,定制出更小尺寸、效率更高的AI模型。例如,开发者通过文心大模型4.0降维裁剪出来的更小尺寸模型,同等尺寸下效果优于直接采用开源模型调试出的模型;而在达到同等效果时,其成本明显降低。


在一次对话中,李彦宏曾表示,“当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低,这时,商业化的闭源模型是最能打的。”这也意味着,百度想通过闭源来走通大模型的商业模式。


今年2月18日,在百度2024年Q4及全年财报电话会上,李彦宏透露,文心大模型4.5将开源。


李彦宏表示,“从DeepSeek身上,我们学到了一件事,那就是开源最佳模型能大大促进人们使用或采纳这个模型。当一个模型开源时,人们自然会出于好奇想尝试,这有助于更广泛地采用。这也是基于我们对技术领先的深度自信。”


2025年以来,百度在大模型领域积极布局,动作频繁,涵盖发布计划、免费策略、模型升级和开源计划等方面。2月13日起,文心一言上线深度搜索功能,该功能具备思考规划和工具调用能力,能提供专家级内容回复,支持多场景任务和多模态输入与输出,从4月1日起免费开放使用。


02

开源还是闭源


在国内众多AI企业中,百度是少数几家拥有全场景布局的企业之一,因为它拥有自己的平台和生态系统逻辑,并占据着独特的生态位,这些优势决定了其对大模型技术的态度。


百度拥有庞大的移动生态和丰富的应用矩阵,包括百度App、百度贴吧、百度文库、好看视频等,这些应用为大模型的训练和迭代提供了充足的语料支持和用户数据。例如,百度的语料库包含了百度百科、百度搜索、百度知道等内容。此外,百度App作为核心应用,通过搜索、信息流和智能小程序等功能,将用户意图与长尾内容连接起来,进一步提升了大模型的应用场景和商业价值。


生态矩阵孕育了庞大的用户基础。百度app月活跃用户达7.03亿,百度网盘服务超8亿用户,百度地图智能语音助手累计用户数突破5亿,好看视频全域日活用户1.1亿,贴吧全域日活跃用户8000万。数据的生成与回流,帮助百度有效触达不同需求的用户群体,为内容传播、商业推广等创造广阔空间。


百度大模型的开源历史可以追溯到其早期的技术积累和战略调整。百度在AI领域的探索始于2011年,当时成立了硅谷办公室,并逐步在中国建立深度学习研究院。2015年至2016年,百度开始发布一系列AI产品和技术,包括语音助手DuerOS、自动驾驶Apollo以及深度学习框架PaddlePaddle,并逐步实现开源。


在大模型领域,百度于2019年开源了文心ERNIE1.0,标志着其在自然语言处理和跨模态领域的技术突破。该模型基于飞桨深度学习平台打造,通过将数据与知识融合,提升了大模型的学习效率及学习效果,这为后续文心一言的发展奠定了重要基础。但是,2023年3月文心大模型3.0推出后,百度开始走向闭源路线。同年5月发布的文心大模型3.5和10月推出的文心大模型4.0,均未开源。


2023年10月17日,在百度世界2023大会上,李彦宏宣布文心大模型4.0正式发布并开启邀请测试。文心大模型4.0实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升。


2023年11月1日,文心一言开始向用户收费,成为中国首个采用会员模式面向C端收费的大模型产品,这一系列动作也表明其闭源策略,旨在通过限制技术访问来获取商业利益。2024年6月28日,百度首席技术官王海峰在WAVESUMMIT深度学习开发者大会2024上宣布,文心一言累计用户规模已达3亿,日调用次数达到5亿,并正式发布文心大模型4.0Turbo。


文心一言采取基础版免费、专业版收费模式,其中专业版定价59.9元/月,连续包月优惠价49.9元/月。此外,文心一言和文心一格的联合会员价格为99元/月。但这一收费模式也于4月开始全面免费,届时PC端和APP端用户均可体验文心系列最新模型,免费开放后所有用户能无门槛体验超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。


文心大模型4.5已在百度智能云千帆大模型平台上线,目前的输入价格为0.004元/千tokens,输出0.016元/千tokens,约为GPT4.5价格的1%。文心大模型X1为深度思考模型,性能对标DeepSeek-R1,定价为输入0.002元/千tokens,输出0.008元/千tokens,即将在千帆平台上线。此前,文心大模型4.0Turbo面向企业客户全面开放时,输入输出价格分别为0.03元/千tokens和0.06元/千tokens。


显然,大模型使用成本的降低,将为2025年这一产业应用大年做好基础建设。李彦宏在2023百度世界大会中曾说,大模型的能力是一切AI原生应用赖以生存的基础。同样,没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。因而,百度将大模型视为构建AI生态的重要组成部分,强调“生态雨林”的理念,即通过技术与应用的结合,形成一个共生的生态系统。百度不仅提供先进的大模型,还打造一个开放的平台,吸引用户、客户和合作伙伴共同参与生态建设。百度宣布文心大模型4.5系列开源,表明其在开源领域的态度逐渐开放,并希望通过开源加速技术传播。


如今,百度已通过大模型技术对产品进行重构,推出了百度文库、新搜索等AI原生应用。这些应用不仅提升了用户体验,还拓展了产品的功能边界,从内容工具向生产力工具进化。例如,百度文库从传统的文档分享工具演进为一站式智能文档创作平台,体现了大模型在现有产品创新中的作用。百度还推出多个工具和平台(如AgentBuilder、ModelBuilder等),降低AI原生应用的开发门槛。通过文心大模型和千帆平台,为企业提供从基础模型到应用开发的全套服务。同时,百度也在探索MaaS(ModelasaService)模式,进一步降低AI应用的成本。


面对开源模型的竞争,百度采取了灵活的策略,宣布引入DeepSeek等开源模型以提升搜索服务的智能化。这种策略显示了百度在保持自身技术优势的同时,愿意通过合作和开放来应对市场变化。


据2024年财报显示,百度智能云AI相关收入同比增长近3倍。受AI驱动,百度智能云业务在四季度增长强劲,季度营收同比增长26%。目前,百度智能云为超60%央企和大量民营企业提供AI服务。在财报电话会上,百度管理层透露,百度正在成为中腰部客户的首选。


来源 | 2025年4月刊


我也说一句

已经有条评论

全部评论

    上一篇:腾讯混元:以开源构建生态矩阵

    下一篇:全面开源的阿里云,为AI应用大爆发做准备

    QQ空间 新浪微博 豆瓣网 微信

    请先来登录吧

    没有经营者账号?立即注册
    忘记密码?

    请先来注册吧

    已有经营者账号?立即登录

      报名成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了

      加入班级成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了