近日,2024全球开发者先锋大会在上海举行。为期两天的大会,汇聚了国内外超过100家开发者社区、100余家知名投资机构。OpenAI前高管扎克·卡斯、硅谷“创投之父”史蒂夫·霍夫曼等“大咖”也来沪与全球开发者交流。在此次大会的举办地徐汇滨江,上海首个大模型创新生态社区已然成形。仅仅成立半年,就吸引了近60家大模型企业,以及200余家产业链上下游企业资源汇聚。

  以应用牵引,发布市级应用场景;培育生态,做好算力、数据等关键要素供应;加大开源、开放力度,降低广大创新创业团队和中小企业的大模型训练门槛……近年来,上海积极培育人工智能产业沃土,逐渐成为大模型产业高密度创新的苗圃基地。

  大模型产业“风起云涌”

  大会上,上海人工智能实验室领军科学家林达华用“风起云涌”来形容近几年全球大模型产业的发展。

  2022年,ChatGPT横空出世,大模型开始走入大众视野,成为全球焦点。2023年2月,Meta公司发布LLaMa并催生发展出开源社区,大模型从“只会聊天的工具”,变成了有可能会进入到“严肃生产领域”的生产力。迈入2024年,Sora的出世、Claude 3.0展现出的强大推理能力,以及马斯克刚刚开源的Grok,都代表着整个行业处在“方兴未艾”的赛道。

  “大模型行业的发展有两个非常重要的驱动力量。一个是源于所有研究者和从业者对于技术理想的追求,不断突破边界,寻求越来越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同时产业界也看到了大模型带来产业革命的可能性,无数企业投入巨大资源到这个赛道中。两股力量交织在一起,形成了我们今天看到的大模型产业‘波澜壮阔’的局面。”林达华表示。

  而在国内,大模型产业的发展同样突飞猛进。去年3月份,百度发布“文心一言”,此后,阿里巴巴的“通义千问”、科大讯飞星火大模型、腾讯混元大模型陆续发布上线。互联网大厂之外,华为、京东、字节跳动、商汤科技,乃至三大电信运营商、各科研院所和高校的大模型产品也不断推出。有统计数据显示,中国研发大模型的公司已有100多家,迈入“百模大战”阶段。

  同时,大模型行业也在不断涌现出新的课题。以算力为例,微软原全球执行副总裁沈向洋称,发展大模型产业,算力是门槛。随着大模型参数的增加,对算力的需求几乎是几何级增长的。另外,包括ChatGPT在内,大模型还带来了“一本正经地胡说八道”、“深度伪造”等伦理问题,需要各方加强治理。

  此外,当前主流的大模型都是建立在Transformer架构堆叠的基础上,但这一架构对计算资源的消耗特别大。腾讯混元大模型算法负责人康战辉表示,当下越来越多的企业看到了MoE(即:混合专家模型)展现出来的优良特性,未来可能还会有更加高效的架构出来。

  产业应用“繁花绽放”

  有行业人士将2024年比作大模型应用的“元年”,认为行业的竞争焦点正在从基础模型到应用迁移。从目前来看,大模型确实已经落地到各行各业,生根发芽。

  “大模型+科学”可以产生哪些化学反应?上海人工智能实验室青年科学家白磊介绍,实验室发布“风乌”大模型,可用以预测气象。由于大气系统的复杂性,全球中期天气预报的有效性每10年才提高1天。此前,全球范围内最好的物理模型有效预报时长最大为8.5天,而“风乌”达到了10.75天,且预测时间仅需30秒。

  机器人与大模型的结合领域“具身智能”也是热点。“传统的机器人需要编程,需要写固定的代码,造成之前的人机交流非常僵硬。现在,我们告诉机器人它的手臂快碰到天花板了,在没有任何方向性指示的情况下,它能够理解,且做出正确反应。这在传统的机器人编程中,是不可想象的。我们期待,大模型能给机器人一颗通用的大脑。” 中电科21所高级专家刘一帆表示。

  “过去艺术家们通过AI软件进行艺术作品的设计,今天有更多的艺术家通过AI完成艺术作品的创作。此外,从去年下半年开始,包括电商、营销等领域,也有非常多的大模型产品涌现出来。”智象未来产品总监弓子健说。

  林达华认为,围绕大模型应用,产业分工会逐渐形成。“做基础模型的企业并不会垄断一切。如果从业者能够凭借自己在行业里积累的数据和经验,并基于自身的资源禀赋和数据优势积极寻找差异化发展路径,最终形成竞争力,我们的大模型产业一定会‘一路繁花’。”

  着力建设“大模型之都”

  人工智能是上海重点发展的三大先导产业之一。伴随着新一代人工智能的发展,大模型热潮掀起,上海正在着力建设“大模型之都”。

  怀着“栽好梧桐树,引得凤凰来”的美好愿景,上海以徐汇西岸为核心,启动了首个人工智能发展集聚区建设。如今,作为上海首个大模型创新生态社区,诞生于徐汇人工智能产业沃土的“模速空间”,已成为大模型产业高密度创新的苗圃基地。

  上海徐汇区委常委、副区长俞林伟对“模速空间”名字的由来进行了解释。他说,“‘模’意味着成千上万的开发者在这里创新创业,百花齐放。这里是场景的试验田,也是应用的孵化器。‘速’则指通过市、区携手,为企业提供全方位的加速服务。”

  转眼间,“模速空间”挂牌已近半年。如今有超过60家大模型企业与他们身后200余家产业链上下游企业的资源汇聚在黄浦江畔这一方天地。

  对于大模型企业来说,数据的体量、质量、多样性缺一不可,均对大模型能力的提升有重要意义。如何能够生产大规模、高质量的数据,也是各个大模型研发机构某种意义上“竞争壁垒”所在。

  此外,算力同样重要,不管是大模型研发企业,还是应用类公司,高算力成本都令人头痛。如何提供普惠的算力,通过较低成本把大模型在垂直行业真正用起来,让更多的中小企业、个人开发者加入大模型的开发中,也是行业关注的问题。

  记者了解到,“模速空间”五个公共服务平台作为“土壤雨露”,可为创新企业提供开放数据、算力调度、能力评测、备案辅导、融资服务等公共服务,提供关键要素保障。

  以算力调度平台为例,“模速空间”联合运营商和云厂商共同保障大模型企业算力,目前商汤、仪电、火山超5万张GPU可供调配。其开放数据平台依托浦江实验室牵头的大模型语料数据联盟,持续开源发布高质量数据集,数据总量近5TB,下载量近14万次,行业覆盖10余类。

  面向未来,大模型产业的发展尚有许多挑战。对此,上海已明确,未来将加强核心技术的突破,推动智能芯片关键技术和应用适配,打造更多元开放的智能计算生态。同时,完善标准体系、安全准则、伦理规范,推动人工智能、区块链、元宇宙等前沿技术的开发和应用。

  上海市副市长陈杰表示,未来上海将进一步加大开源开放的力度,探索大模型的新型开源和推广模式,以降低广大创新创业团队、中小企业等大模型训练的门槛,推出更多具有示范性、标志性的应用场景,来牵引大模型在金融、教育、医疗、制造等典型领域的垂直应用。(记者 杜康 上海报道)