上海市经济信息化委副主任张宏韬2月7日在上海徐汇召开的全球开发者先锋大会新闻发布会上表示,DeepSeek的成功,带动全球大模型技术创新的底层逻辑重塑,逐步由“算力规模优先”转向“算力效率优先”,更是我国坚持长周期创新战略布局的一个阶段性呈现。秉持开源是加速技术积累和实现技术突破的有效举措的发展理念,积极参与全球科技创新和治理。

  张宏韬说,近年来,上海结合国家战略任务和地方产业布局,重点围绕大模型、语料数据和人形机器人,培育开源生态体系,加速形成新质生产力,具体包括:

  一是以开源基模为底座,培育产业新生态。模型方面,上海人工智能实验室“书生”系列已开源了“浦语”大语言模型、“万象”多模态大模型、“风乌”气象大模型等。截至目前,MiniMax开源基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01,首次大规模实现线性注意力机制,突破传统Transformer架构。工具链方面,打造了大模型开源开放评测体系司南OpenCompass,已支持超过150个开源及商业模型的评估。应用方面,基于书生大模型已在多个领域形成示范案例。比如,中核八所首个核领域大模型应用平台“龙吟”,将质量审查覆盖率从5%提升到100%。

  二是以语料数据开源为重点,激活产业新动能。目前已率先发布团体标准《语料库建设导则》等,开源7批数据集、4200亿token文本以及1TB视频图文混合数据,总下载量超14万次。

  三是以人形机器人开源为突破口,抢抓产业新赛道。软硬件方面,国地中心开源全国首个全尺寸人形机器人公版机“青龙”,发布了全身动力学开源软件包和强化学习软件包;智元开源灵犀X1机器人的全套软硬件图纸和代码。数据方面,智元会同国地中心、库帕思等企业开源全球首个百万真机实采数据集,相比于Google开源的数据集,其长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量从实验室级上升到工业级标准。

  张宏韬说,未来,上海将始终坚持平台牵引、主体带动、支撑保障、生态续航的方式,全力推进开源工作。通过盘活开源组织、开源社区、开源项目、开源人才等要素资源,建设人工智能“上海高地”,加速形成新质生产力。