5月10日消息,近期中国移动研究院发布《我国人工智能大模型发展动态》报告,对国内涉足人工智能大模型训练的多家企业及科研院所进行评估。中国移动研究院认为,从大模型业界评估看,国内大模型与GPT-4有差距,但科技大厂具备追赶实力,百度、阿里巴巴、腾讯、华为等在大模型研发投入、技术能力和人才团队等综合实力较强;在商用推进方面,依托现有业务领域形成大模型应用规模效应。
报告指出,国内大模型研发应用领域热潮持续高涨。据不完全统计,目前国内至少有19家企业及科研院所涉足人工智能大模型训练,主要分为大型科技公司、科研院校和初创科技团队三类。
从大模型的布局体系来看,百度、阿里、华为等大型科技公司从算力层、平台层、模型层、应用层进行了全面布局,科研院及初创科技公司主要以研发大模型算法及细分领域应用为主。以百度为例,百度“昆仑芯+飞桨平台+文心大模型+行业应用”在芯片层、框架层、模型层和应用层布局最完整。四层架构之间能形成层到层的反馈、端到端的优化,尤其是框架层的飞桨和模型层的文心大模型。最新数据显示,飞桨与文心一言协同专项优化在一个月内迭代4次,推理性能提升10倍,其中分布式推理引擎推理性能提升了123%。阿里的“含光800芯片+M6-OFA底座+通义大模型+行业应用”、华为的“昇腾芯片+MindSpore框架+盘古大模型+行业应用”也是多层布局。
报告认为,从大模型参数量看,大型科技公司的参数量远大于科研院所,但基本都处于千亿及以上规模,而科研院校大模型的参数量在千亿级及以下。公开资料显示,2019年,百度发布文心大模型ERNIE,目前已迭代至千亿级参数的ERNIE3.0Zeus。2023年3月起,百度相继发布了知识增强大语言模型产品“文心一言”和一站式企业级大模型生产平台“文心千帆大模型平台”。
报告数据显示,从综合实力和商用推进方面,百度文心大模型和文心一言均领先,处于第一梯队头部。在商用推进方面,百度文心大模型拓展内外部应用,目前面向公众和企业用户同时进行开放测试。文心大模型在金融、能源、制造、城市、传媒、互联网等行业应用案例落地广泛。截至目前,已经有15万企业申请加入文心一言内测,覆盖政务、金融、媒体、电商零售等行业。
另据,国际权威咨询机构IDC在今年2月发布的《2022中国大模型发展白皮书》中,提出了行业首个大模型评估框架,根据评估结果,百度文心大模型在市场格局中同样处于第一梯队领先位置,产品能力、生态能力、应用能力均受到广泛认可。