国产大模型“混战”:科技互联网巨头纷纷入局,商业场景出现“分流”

2023-05-17 697 0


守住底线与创作自由根本不矛盾。某种意义上,守住了底线,才能更自由地进行创作。


文 | 刘青青 石丹

ID | BMR2004


大模型“诸神之战”正在来临。在ChatGPT爆火之后,各大科技互联网巨头纷纷“下场”,不同大模型产品纷纷面世。


值得一提的是,大模型并非定义清晰的学术名词。深度科技研究院院长张孝荣指出,大模型不是学术术语,而是一个文学化的描述,它们往往具有庞大的参数量,需要在大规模数据集上训练。


“例如GPT3.5模型参数量有1750亿个,因而具有同等数量级参数的算法模型被视为大模型。”张孝荣表示。


不过,由于ChatGPT爆火,“大模型”一词也成为人工智能领域的高频词,AI大模型热潮持续,国产大模型产品密集落地,例如百度的“文心一言”、阿里的“通义千问”、科大讯飞的“星火认知大模型”、京东的“言犀产业大模型”、华为的“盘古大模型”等。


这些大模型产品无不拥有长期的人工智能研发基础,却在短时间内引发巨大关注,仿佛科技互联网巨头们的新一轮较量拉开序幕。《商学院》记者了解到,实际上在商业落地方面,基于各大科技互联网巨头的自身发展基因,其大模型AI也展现出不同特色,开始“分流”。


01

大模型“混战”



打响“大模型之战第一枪”的是百度。2023年2月7日,百度官宣“文心一言”(ERNIE Bot)将在3月份完成内测。此后3月16日,百度正式发布大语言模型、生成式AI产品“文心一言”。


作为国内第一款官宣的大模型产品,“文心一言”激起了极大的水花。


百度披露的数据显示:“文心一言”正式面世后的第二天,不少人排队申请百度智能云:文心一言企业版API调用服务测试的企业用户破7.5万。截至3月27日,相关云服务已收到了12万家企业的申请测试。


“文心一言”面世之后,各大科技互联网巨头纷纷入局,国内大模型瞬间遍地开花。


3月29日,三六零(601360.SH,下称360)首次对外披露公司大模型战略并展示大模型产品。彼时,360创始人、董事长兼CEO周鸿祎开玩笑说,这是把“刚出生的孩子”抱出来给大家看看,“叫360GPT还是360AI还没想好”。


4月7日,阿里版GPT“通义千问”开始邀请测试。阿里云官网显示,“通义千问”是阿里巴巴达摩院自主研发的超大规模语言模型,4月11日,“通义千问”在2023阿里云峰会上揭晓;4月18日,钉钉正式接入阿里巴巴“通义千问大模型”。


国产大模型“混战”:科技互联网巨头纷纷入局,商业场景出现“分流”


4月8日,在人工智能大模型技术高峰论坛上,国际欧亚科学院院士、华为云人工智能领域首席科学家田奇提及华为“盘古大模型”,再次引发外界对于“盘古大模型”的关注。


《商学院》记者了解到,“盘古大模型”包括NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型、多模态大模型、语音大模型等多个模型。该项目从2020年启动研发,2021年4月正式发布,到2022年聚焦行业应用落地。


4月14日,腾讯云发布新一代HCC(High-Performance Computing Cluster)高性能计算集群。腾讯云官网显示,新一代高性能计算集群HCC拥有旗舰级计算、超带宽网络、高性能存储,灵活适配各类大模型场景需求。


大模型产品落地方面,此前2022年10月,腾讯已完成首个万亿参数的AI大模型——混元NLP大模型训练。在此番“大模型竞赛”下,传言腾讯不久将推出大模型产品“混元助手(HunyuanAide)”。不过,腾讯方面并未向《商学院》证实该消息。


国产大模型“混战”:科技互联网巨头纷纷入局,商业场景出现“分流”


5月6日,科大讯飞宣布推出新一代认知智能大模型——“星火认知大模型”。官网显示,“星火认知大模型”拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。


国产大模型“混战”:科技互联网巨头纷纷入局,商业场景出现“分流”


5月6日,被誉为“中国智能科技最高奖”的吴文俊人工智能科学技术奖颁发,京东云旗下的言犀团队凭“任务型智能对话交互关键技术及大规模产业应用”斩获科技进步奖。与此同时,京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士获杰出贡献奖。


何晓冬介绍称,2018年京东建成AI研究院;2020年“言犀”人工智能平台首次亮相;2021年推出十亿级规模大模型K-PLUG;2022年推出百亿级大模型Vega……如今,京东正开发千亿级大模型——“言犀产业大模型”。


此外,还有商汤宣布推出大模型“商汤日日新”、昆仑万维和奇点智源合作发布“天工”3.5、知乎联合面壁智能发布中文大模型“知海图AI”……一大片大模型产品正在发布或者形成,国产“大模型混战”已然开启。


02

商业场景“分流”



“ChatGPT是第一款真正意义上的AI原生产品。”何晓冬表示。而这款时代的AI原生产品先蹚出了一条商业道路——人工智能生成对话聊天。


显然,国产大模型产品几乎都有着与ChatGPT相似的影子,人工智能对话几乎成为标配。不过,蜂拥而上的科技互联网巨头们也研发出各具特色的大模型产品,在商业场景上开始“分流”。


以百度为例,已经“押注”人工智能赛道十几年的百度,早在2019年就发布了“文心一言大模型”的第一个版本,此后的每一年都发布一个新版本。直至2022年ChatGPT横空出世,“文心一言”率先在内容和信息相关的行业和场景落地。


5月9日,百度智能云又推出全球首个一站式的企业级大模型生产平台——“文心千帆大模型平台”,一边以“文心一言”为核心,提供大模型服务,帮助客户改造产品和生产流程;一边作为一个大模型生产平台,帮助企业开发自己的专属大模型。


京东则是基于实体产业属性,选择了产业AI的“战场”,打造“产业版ChatGPT”。


作为以供应链为基础的技术和服务企业,京东拥有从零售到物流、科技,再到健康、保险、工业等产业布局,有着复杂的产业生态,给大模型提供了大量真实场景数据,用以磨练千亿级的“言犀产业大模型”。


目前,“言犀产业大模型”在垂直产业的深耕,正不断赋能不同行业产业。例如在零售领域,京东已经在大规模利用数字人直播带货,入驻4000+商家,带动6亿GMV,成本不足真人主播1/10;将AI和12345政务热线结合,推动政务热线智能化;搭建老年人口数据库、养老服务网和智慧养老服务平台,为每个老年人配备贴心的AI助理;打造全国首个能独立、全程办理银行真实交易的数字人,接起率提升,远程银行运营拓展成本降低……


此外,360将坚持“两翼齐飞”战略,先占据场景,同步发力核心算法技术。而在商业化场景落地方面,360大模型战略计划在To C、To SME(中小型企业)、To G&B三个方面推行。


具体而言,在To C端,将推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品;在To SME端,将基于生成式大模型推出SaaS化垂直应用,如结合生成式AI的“苏打办公套件”和“企业即时通讯工具-推推”等,以解决中小微企业数字化转型难题;在To G和To B端,360已将核心数字安全能力融入安全AI模型,计划结合数字安全业务推出企业私有化AI服务,满足客户对私有知识、资产的索引需求。


在何晓冬看来,AI商业化路线方面,最先突破的是文本生成,接着是图像商业化,随后视频、游戏、3D也会迅速进入商业化。因此,在当前国产大模型“阵营”里比较多的是语言模型,但大模型理念和技术在迅速向不同模态扩展。


“展望未来,往多模态方向发展是一个重要的趋势,未来的‘言犀产业大模型’也将是一套跨多模态的大模型。”何晓冬补充道。


03

喜忧参半



对于这场快速掀起的“大模型混战”,一方面展示了国产人工智能在遍地开花,另一方面也暗藏泡沫。


北京社科院研究员王鹏指出,大模型之所以称为“大”,其实涵盖了几个方面:一是其运算量基础非常高,需要承受住上千亿级别甚至万亿级别的数据运算,数据量极为庞大;二是模型本身构造复杂,需要经过多层次学习,包括自然语言处理、计算机视觉、语音识别、深度学习、知识图谱、人工神经网络等;三是大模型在系统复杂的基础上必须投入大量算力,对算力资源需求旺盛。


因此,大模型区别于针对某一个特定领域训练的人工智能模型。对于一个小型应用、一个简单的商业变现,可以不需要大模型。但是如果未来想要利用人工智能支撑起一个大的产业,必然需要在人工智能领域得到长效进步、长效竞争优势。


“所以大模型训练确确实实是国家需要重点推进的产业方向,是重点科研攻关方向。这对于人工智能行业的发展、各行各业的发展,乃至是国家的发展,都具有深远意义。”王鹏总结道。


如今,各大互联网科技巨头纷纷加入“战局”,掀起了一场“大模型混战”,也拉开了国产大模型进击的序幕。


对此,张孝荣指出,基于大模型的生成式AI是当下的行业热点,因为ChatGPT表现出色,openAI获得了微软100亿美元投资,有了这个巨量投资事件的背书,国内外企业蜂拥而至研发大模型相关技术和产品,由此形成了一股潮流。另外,行业缺少新的技术突破,布局AI大模型业务可以迎合相关政策号召,形成舆论热点,提高公司影响力。


然而,看起来势头凶猛的国产大模型依旧面临着不容忽视的风险。


张孝荣直言,一个机构发展大模型的门槛相当高,不光需要有顶级AI人才进行算法创新,还需要有巨大的算力支持和海量数据支持,这三个因素背后意味着数亿到数十亿美元的资金持续投入,国内能进入该领域的企业数量极少。


“各大科技互联网巨头之所以能够在短短几个月里纷纷推出大模型产品,主要原因是近期国外出现了一批开源的大模型项目,国内企业迅速引进,变成了自己的应用创新项目,以此吸引资金关注。”张孝荣表示。


具体而言,上述情况大致可以分成三类,一类情况是少数几家企业或科研机构,基于自身原有算法结合国外开源技术进行研发;第二类是直接借助于国外开源算法模型或API接口进行训练,推出仿造型产品;还有一类则是跟风蹭热点,没有实质性投入。“如果是利用国外项目的API接口进行训练,这种做法好比把自己的大楼盖在别人的土地上,一旦触发某些限制或制裁,后果不堪设想。”张孝荣表示。


总之,一方面,无论是对于走在前沿的科技公司而言,还是对于行业乃至国家而言,大模型训练都是必不可少的摸索尝试。但另一方面,国产大模型在短时间内遍地开花背后,其实也暗藏风险。


面对高成本的科研难题,在风口之下,到底谁能顺利上岸,谁在裸泳,还要等到潮水退去。



我也说一句

已经有条评论

全部评论

    上一篇:刚刚,国家金融监督管理总局正式揭牌!释放什么信号?

    下一篇:张燕生:中国外贸运行的底层逻辑正发生新变化

    QQ空间 新浪微博 豆瓣网 微信

    请先来登录吧

    没有经营者账号?立即注册
    忘记密码?

    请先来注册吧

    已有经营者账号?立即登录

      报名成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了

      加入班级成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了