【导读】专家表示,国产大模型正快速缩小与国际领先水平的差距

  2月22日,在上海资产管理协会和智能投研技术联盟(ITL)主办的“资产管理机构数智技术研修班(iAMT)——国产大模型在资产管理领域应用”上,与会人工智能专家表示,国产大模型正快速缩小与国际领先水平的差距。不仅如此,在部分领域,国产大模型已从追赶者成为引领者,在本地化应用场景中展现出独特的优势。面对包括尺度定律(Scaling Law)不可持续性、隐私安全以及业务端的小数据等挑战时,人工智能研究者和应用人工智能的机构需要持续创新才能推进技术发展和应用落地。

  本次活动由资产管理与人工智能联合创新实验室(AIAM Lab)和上海市虹口区金融服务中心承办,中国基金报等媒体机构为支持单位,活动吸引了约600名业内外专业技术人员参与。

  中共上海市委金融委员会办公室副主任葛平、上海市虹口区副区长陈帅为活动发表致辞,智能投研技术联盟(ITL)主席杨强和上海资产管理协会会长贾飙发表致辞,上海资产管理协会秘书长韩康出席活动,上海资产管理协会副会长、数字金融专委会主任委员罗水权主持活动。

葛平:市委金融办支持、加速推动技术从实验室到金融业务场景的转化

  中共上海市委金融委员会办公室副主任葛平在致辞中对资产管理行业应用大模型推动数字金融转型提出三方面要求。

  他表示,人工智能技术正在经历革命性的突破,国产大模型正在从技术跟跑迈向并跑、领跑,逐步展现出全球竞争力。上海金融领域各方行动迅速,积极探索创新,金融领域的大模型具体实践应用不断地深化和强化。相关的金融基础设施,银行保险证券、基金等已经开展了系列国产大模型部署和应用。

  葛平对资产管理行业应用大模型赋能业务发展提出三点期待。

  第一,以技术深耕业务质效。大模型技术正在从通用走向垂直,资管领域亟需深化场景应用,希望各机构聚焦风控、投研、投顾等环节,探索技术的落地途径,以数字金融引擎推动“五篇大文章”做深做实。

  第二,以开放协作共建行业生态,金融行业数字化转型需要产学研用的深度融合,期待金融机构、科技企业、高校院所等应用主体和创新主体强化合作,结合算力、语料、数据、人才等各项资源,共同建设发展的生态。

  第三,以底线思维护航稳健发展,大模型在金融领域发展需要平衡好创新与安全合规的关系,重视数据安全等挑战,在技术浪潮中加强金融科技伦理建设,牢固树立风险底线意识,技术创新和安全合规必须双轮驱动,实现稳中求进、提质增效。

  葛平提到,上海一直高度重视金融科技中心和资产管理中心的协同联动发展,《上海国际金融中心建设“十四五”规划》提出打造全球金融科技中心和资产管理中心“两中心”,是具体体现。2024年9月,上海市发布了《上海高质量推进全球金融科技中心行动方案》,进一步提出了推动金融科技与资产管理的深度融合,提升资产管理机构的数字化水平。

  他表示,市委金融办将一如既往支持、加速推动技术从实验室到金融业务场景的转化,共同书写上海科技金融中心和资产管理中心建设的崭新篇章。

杨强:人工智能过去60年实现了指数级的发展

  智能投研技术联盟(ITL)主席、中国人工智能学会(CAAI)荣誉副理事长、微众银行首席人工智能官、“吴文俊人工智能杰出贡献奖”获得者杨强在致辞中表示,在全球大模型技术快速发展的背景下,国产大模型正在崛起,成为推动中国资管科技创新的重要力量。国产大模型不仅在技术上逐步缩小与国际领先水平的差距,更在本地化应用场景中展现出独特的优势。智能投研技术联盟(ITL)将继续秉持“开放、协同、创新”的理念,与各成员机构携手共进,推动国产大模型在资产管理领域的深度应用。

  在主题演讲中,杨强从2024年人工智能研究者荣获诺贝尔奖说起。他提到,2024年诺贝尔物理学奖授予美国科学家约翰·霍普菲尔德和英国裔加拿大科学家杰弗里·欣顿,以表彰他们在“使用人工神经网络的机器学习方面的基础性发现和发明”。2024年诺贝尔化学奖,授予美国华盛顿大学西雅图分校的戴维·贝克,以及谷歌旗下“深层思维”公司的德米斯·哈萨比斯和约翰·江珀,以表彰他们“破解了蛋白质神奇结构的密码”。人工智能发展历史上高光时刻再次到来。

  他紧接着回顾了人工智能的发展。杨强表示,1950年,图灵测试被提出以衡量计算机系统的智能性。1956年人工智能概念正式提出。此后,科学家不断提出各种实现人工智能的方法,包括感知机,即浅层神经网络;20世纪80年代,专家系统成为全球人工智能研究热衷的方向。然而,专家系统遭到了严重挫折,因为其根基不稳,通用型人工智能仍然未能实现。直到2012年,深度学习获得突破。2017年Transformers这一全新的机器学习神经网络架构被提出(以关键性论文“Attention is All You Need”发表为标志),人工智能发展才进入新的阶段。Transformers将一个输入序列转换或改变为一个输出序列,它通过学习上下文并跟踪序列组成部分之间的关系来实现这一点。

  谈到人工智能发展上的关键节点。杨强介绍了强化学习技术。1998年《强化学习简介(Reinforcement Learning: An Introduction)》由Richard S. Sutton and Andrew G. Barto发表。Sutton和Barto在书中介绍了人通过与环境互动而学习的机制。根据Sutton和Barto在书中介绍的内容,强化学习的要点包括:与环境互动、奖励机制等。杨强认为,强化学习技术带来了人工智能发展方面的范式改变。强化学习机制令研究者明白,虽然我们不知道很多知识背后的道理,但是遇到问题我们却可以使用它们。这揭示出人类具备通过数据来学习的能力。

  他进一步介绍道,2014年,一个新的构想出现:“我们不仅要一个个单个的应用上实现人工智能,我们还希望设计一个通用的智能系统来呈现世界的面貌生成新的概率分布问题,即生成式的人工智能。生成式的人工智能刚刚被提出时,并不受大家重视。因为许多人并没有计算资源,而生成式人工智能对计算资源的要求很高。不过,目前我们拥有了算力资源,可以通过人工智能呈现世界的概率分布。”

  根据尺度定律(Scaling law),算力、数据、模型的大小决定了模型的能力。

  最近科学界有人认为大模型的发展不可持续,原因是公域的高质量数据有限。全球人类标注和制造数据的速度远不如计算机发展快。因此,如何利用带有隐私特性的数据训练或者微调大模型成为挑战。例如,金融机构的很多数据尚未参与大模型训练。研究者需要微调,使其变成垂域大模型。这需要这些行业数据的参与。综上,杨强认为,人工智能行业面临数据“无米之炊”、本地化和隐私保护等问题。

  如何破局?他介绍道,目前的一大热点是智能助手(AI Agent),即大模型在垂域经过微调后变成垂域应用。该应用具备以下能力:推理、理解问题的能力,并具备自我意识、自我审视能力,能够在不同智能体之间学习。智能体是垂域专家,能够学习、沟通和推理。数据方面,目前,人造合成数据非常热门,许多公司正在讨论新发展方向,我们是否可以通过合成数据缓解公域数据缺乏的危机,这也是金融界需要考虑的问题。

  在金融界,要解决私域数据的使用,首先需要考虑隐私问题。其次,要解决多个机构的数据联合建模的问题。例如,贷款申请不是一家金融机构的问题,多家机构需要联合解决反欺诈和反洗钱问题,这涉及隐私安全。

  中国在部分领域处于世界领先地位。联邦学习通过多个模型协作,通用大模型教会本地小模型,小模型具备的本地专业数据和垂域能力,可以反过来赋予大模型,“师生之间”可以互相交流和学习。迁移学习,指具有举一反三的能力。通用大模型与具体应用之间存在一定的概率鸿沟,建立桥梁将大模型的能力适配到本地至关重要。在机器学习中,这被称为迁移学习。

  经过六十多年的发展,人工智能获得指数级的提升。研究者最初使用小计算和小数据形成模型和垂域应用。目前,人工智能已可完成通用能力建设和生成式通用能力建设。在金融界的应用需要从整体分散到各个领域,形成智能体、合成数据,并具备迁移和联邦学习能力,以保护数据隐私和安全。这样,我们才能从容面对包括尺度定律(Scaling Law)不可持续性、隐私安全以及业务端的小数据等挑战。

  据了解,为适应资产管理行业数智化转型发展,积极参与上海全球资产管理中心和全球金融科技中心建设,上海资产管理协会与智能投研技术联盟(ITL)紧密合作,自2023年3月起率先开展大语言模型技术在资产管理垂直领域应用推进工作。同年7月,建立“资产管理与人工智能联合创新实验室(AIAM Lab)”。本次资产管理机构数智技术研修班的举办是在当前以国产大模型为标志的人工智能技术快速发展的背景下,以支持、配合会员单位数字金融发展而举行。