腾讯混元:以开源构建生态矩阵

2025-04-22 100 0

腾讯混元:以开源构建生态矩阵


腾讯混元大模型遵循了腾讯一贯的“先普惠技术,再构建生态矩阵,最终实现商业化闭环”的理念。


文|胡嘉琦

ID | BMR2004


近日,腾讯公布了2024年第四季度及全年财报,其2024年的研发支出创下707亿元的历史新高。


腾讯雄厚的资金投入正在加速其AI战略进程。通过利用“自研+开源 ”的混元大模型策略,这家科技巨头正在推动整个业务的变革性改进。


腾讯董事会主席兼首席执行官马化腾表示:“几个月前,我们重组了人工智能团队,专注于快速产品创新和深度模型开发。通过增加与人工智能相关的资本支出,并加大力度开发和营销人工智能原生产品,我们正在为实现可持续增长做好准备。这些投资有望提高广告效率,延长我们游戏产品的生命周期,而人工智能服务的不断普及也将创造持久价值。”


腾讯方面向《商学院》记者表示,腾讯混元大模型已在 700 多个内部场景中部署,促进了多个业务领域的增长。同时,腾讯积极整合前沿开源生态系统,腾讯混元大模型全面开源。


01

自主研发的通用大模型


中国大模型技术首次在多模态领域实现完整开源布局。


腾讯方面向记者表示,腾讯混元大模型是腾讯自主研发的通用大模型,作为国内首个采用MoE架构的万亿参数大模型,通过动态路由机制实现计算资源优化;通用任务调用3—5个专家模块,专业任务激活“15+”模块;推理效率较密集架构提升3倍,训练成本降低40%。


腾讯混元大模型在云上提供Turbo、Pro、Standard、Lite、Vision等多个版本,同时在专属模型上开放代码生成、角色扮演、Functioncall(功能调用)等功能,使企业客户与个人开发者能够通过腾讯云实现API(应用程序接口)直接调用,实现便捷的智能化升级,目前已接入700余个腾讯业务和场景(如腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等)及腾讯旗下协作 SaaS (软件即服务)产品。


自2024年全面开源以来,混元大模型覆盖文本、图像、视频和3D生成等多模态。在GitHub上总Stars数超2.3w,多次登顶趋势榜,其中混元视频生成模型2024年12月在Hugging Face登顶且GitHub Stars超8.5k,社区开发者自发改进衍生版本逾900个,而混元DiT文生图模型的衍生模型数量更达1600余个。


记者了解到,近日,腾讯混元大模型旗下最新发布的Hunyuan3D-2.0系列开源模型,迎来了五款产品(Turbo、Pro、Standard、Lite、Vision)的全系列开源,构建起完整的工具链体系,标志着中国大模型技术首次在多模态领域实现完整开源布局。从30秒生成高精度3D资产的开源框架,到覆盖文本、图像、视频的全模态开源体系,腾讯混元大模型正以开放姿态引领一场全球范围内的数字创作革命。


这一突破得益于腾讯自主研发的3D生成加速框架FlashVDM,它打破了传统3D生成模型的效率瓶颈,将大规模3D模型的生成时间压缩至秒级,为开源社区与工业界的应用部署提供了可能。


Hunyuan3D-2.0推出了多种模型版本,以适应不同应用需求。例如,多视图版本Hunyuan3D-2-MV能够结合2—4张标准视角图片,捕捉丰富的细节,优化3D生成模型产生的效果。与此同时,mini系列模型通过架构优化与算力提升,降低了硬件要求,可在NVIDIA 4080显卡甚至苹果M1 Pro芯片上运行,使3D模型的应用更为广泛。


腾讯自2024年11月发布第一代3D生成大模型以来,持续推动行业创新。如今Hunyuan3D-2.0在文本一致性、几何精度和画面质量等多项评测中超越业内顶级大模型。伴随模型升级,面向创作者的腾讯混元3D AI创作引擎同步优化,为游戏制作、3D UGC创作等提供更高效的生产工具。


02

打造生态矩阵


腾讯混元大模型实现了开源生态的商业模式创新,通过基础模型开源吸引开发者。


随着模型参数规模的增长进入瓶颈期,掌控开发者生态成为模型的新“护城河”。混元开源模型覆盖文本、图像、视频、3D四大模态,构建了一个难以复制的生态矩阵。


Hunyuan3D-2.0的发布,腾讯正加速推动3D内容生成技术的应用落地,为创作者与行业用户带来更加智能高效的3D生产工具。


目前,腾讯混元3D生成模型已在多个业务场景落地,包括用户生成内容(UGC)、商品素材合成、游戏3D资产生成等。在游戏领域,Hunyuan3D-2.0生成的3D模型已达到行业标准,具备合理的几何布线、精准的贴图及骨骼蒙皮适配能力,为3D资产生产提供了高效、低成本的新方案。


当下,腾讯混元大模型实现了开源生态的商业模式创新,通过基础模型开源吸引开发者,云端API按调用量收费,实现分层变现;与英伟达合作优化Hunyuan3D在A100显卡上的性能,带动云服务销售,实现硬件协同;开发者贡献的改进代码经审核后整合进商业版本,形成技术升级闭环,从而实现数据反哺。


以腾讯元宝为例,这款应用的日活跃用户在2025年2月至3月期间激增了20多倍。自2023年首次推出以来,腾讯混元大模型经历了快速迭代升级。最新版本被称为“腾讯混元大模型 Turbo S”,可将初始响应延迟降低44%,目前已在腾讯元宝等多个内部产品中使用。


开源意味着要持续不断的更新迭代。比如腾讯元宝自上线以来,已经历了多次更新。腾讯方面向记者表示,2月13日,腾讯元宝集成了完整版的DeepSeek-R1,支持腾讯混元和DeepSeek模型;2月19日,腾讯元宝逐步引入并全面部署混元T1深度思维模型;2月21日,DeepSeek和混元模型升级,可理解图像内容;2月25日,腾讯元宝发布一键导出长图功能;3月1日,腾讯元宝桌面版正式发布,同时发布的还有混元Turbo S模型的测试版。3月7日到3月13日期间,腾讯元宝推出更多增强功能,包括传输对话链接、大字体模式、拖拽上传文件、发布并支持腾讯文档等;3月18日,腾讯元宝此次更新整合了这些改进,增加了截图请求、拖拽上传文件、可调字体和暗色模式。腾讯表示将继续改进元宝的功能,并计划在不久的将来推出更多人性化功能。


此外,腾讯云服务、腾讯会议、腾讯文档等生产力工具也正在经历一场人工智能驱动的重大变革。腾讯会议的人工智能助理、智能录音、实时多语言翻译等新功能已吸引了1500万月活跃用户。


目前,腾讯云通过“腾讯混元大数据+开源模式”的双轮驱动策略,已构建覆盖政务、教育、医疗、金融、媒体、移动、文旅等30多个行业的多模态解决方案体系。这一举措为深圳宝安区政府、深圳医保、上海徐汇城市运营中心、上海文广新闻传媒集团、深圳大学、瑞金医院、上海医药、荣誉、重庆农村商业银行等客户带来了创新和效率的提升。


例如,深圳宝安政务大模型率先整合“腾讯混元+DeepSeek”双模型能力与私有化部署的宝安区专属知识库,构建了“1+1+1>3”的应用效果。


如今,宝安政务知识库现已覆盖 14 个区和 20 个行业,拥有超过 30000 条政府服务记录。此外,知识库还包含 60 余项人工智能基础能力,可快速部署公共服务查询、企业支持、行政工作流、社会管理等 31 个业务场景的智能应用。


在医疗领域,腾讯与明德医疗合作开发了全球首个针对重症监护病房的人工智能医疗模型,名为启元重症大模型,目前已在国内部分医院进行临床试验。


腾讯混元大模型全系开源备受业内关注。科方得智库研究负责人张新原在接受《商学院》记者采访时,以辩证视角肯定了该模型的开源策略,认为其凭借强大的语言理解与生成能力、对海量文本数据的处理能力以及广泛的应用场景,在自然语言处理、机器学习、人工智能等领域表现出色;此外,其万亿级参数规模不仅提升了模型的计算和泛化能力,还赋予了极高的灵活性和可扩展性,使其能够针对不同需求进行优化。与此同时,该模型在训练和部署上存在成本高、调试优化难度大以及潜在缺陷等问题,需要更多测试和验证来保障稳定性。


中关村物联网产业联盟副秘书长袁帅认为,腾讯混元在中文创作、逻辑推理和任务执行方面有优势,并强调通过开源可以降低技术门槛,促进企业和开发者的二次开发与技术合作,从而进一步推动技术进步和行业发展。


腾讯混元大模型遵循了腾讯一贯的“先普惠技术,再构建生态矩阵,最终实现商业化闭环”的理念,对于腾讯未来能否实现商业化落地,《商学院》记者将持续关注。


来源 | 2025年4月刊


我也说一句

已经有条评论

全部评论

    上一篇:DeepSeek出世,开放的东方力量重塑生态格局

    下一篇:一夜之间态度转变,百度为何从闭源走向开源

    QQ空间 新浪微博 豆瓣网 微信

    请先来登录吧

    没有经营者账号?立即注册
    忘记密码?

    请先来注册吧

    已有经营者账号?立即登录

      报名成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了

      加入班级成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了