当前位置：首页 > 财经

全面开源浪潮信息发布千亿参数基础大模型“源2.0”

2023-11-28 21:11:37 来源：作者：阅读：

字体：小中大

11月27日，浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型，并宣布全面开源。“源2.0”包括102B（1026亿）、51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

　　基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面，“源2.0”提出了新的改进方法并获得了能力的提升。

截图20231128134601.png

“源2.0”能力测评数据（浪潮信息供图）

　　如在算法方面，“源2.0”提出并采用了一种新型的注意力算法结构“局部注意力过滤增强机制”，让大模型在使用更少的训练算力、更小的模型参数的情况下，同样可以获得更高的模型精度和涌现能力；数据方面，降低了互联网语料内容占比，通过使用中英文书籍、百科、论文等资料，结合高效的数据清洗流程，为大模型训练提供了高质量的学科专业数据集和逻辑推理数据集。

　　作为千亿级基础大模型，“源2.0”在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试，测试结果显示，“源2.0”在多项模型评测中展示出了较为先进的能力表现。

　　“源2.0”采用全面开源策略，全系列模型参数和代码均可免费下载使用。“大模型的开源开放可以使不同模型之间共享底层数据、算法和代码，有利于打破大模型孤岛，促进模型之间协作和更新迭代；同时，有利于以更丰富的高质量行业数据反哺模型，打造更强的技术产品，加速商业化进程。目前，业内仍没有完全开源可商用的千亿大模型，我们希望‘源2.0’能够为国内外开发者、研究机构、科技企业提供坚实的底座和成长的土壤。”浪潮信息高级副总裁刘军说。

　　浪潮信息长期致力于人工智能算力基础设施产品的研发，2021年在业界率先推出了中文AI巨量模型“源1.0”，参数规模达2457亿，落地南京智算中心。此次发布的“源2.0”较前一版本实现了能力的全面提升。（记者温竞华）

新闻链接

100吉瓦是多少？一图帮你理解马斯克的太空AI计划

　　日前，马斯克在接受投资人罗恩巴伦访谈时提到了一个颠覆性愿景——将人工智能计算设施部署在太空。　　马斯克表示，他看到了一条（可行的）技术路径，可将每年100吉瓦的太阳能AI

2025-12-03
高价扎堆！科创板百元新股已达40只摩尔线程仅排第29

　　11月24日，“国产GPU第一股”摩尔线程在科创板开启申购，公司发行价为每股114.28元，创下今年A股最高的发行价格，也是年内唯一的一只百元股，投资者中一签需缴款57140元。预计募

2025-12-03
11月24日晚间沪深上市公司重大事项公告最新快递

　　沪深两市多家上市公司11月24日晚间发布公司公告，以下为重要公告汇总。　　【品大事】　　ST西发：拟现金收购拉萨啤酒50%股权，交易仍在筹划　　ST西发公告称，公司持有拉萨啤

2025-12-03
最新发布！2026年考研人数343万考公人数反超考研

　　据教育部网站11月24日消息，2026年全国硕士研究生招生考试将于2025年12月20日至21日举行，据统计，考试报名人数为343万。另据国家公务员局数据，2026国考共有371.8万人通过用

2025-12-03
订单大幅领先！船舶逆势暴涨融资客布局这些票(名单)

　　周一(11月24日)船舶板块大涨超7%，个股方面，江龙船艇20CM涨停，天海防务涨超13%，中船防务涨停，国瑞科技、亚星锚链、亚光科技等跟涨。　　消息面上，克拉克森研究数据显示，中国

2025-12-03
官方动作频繁！卫星互联网概念爆发

　　卫星互联网概念11月24日走强，板块中航天环宇、雷科防务、航天发展涨停；臻镭科技、华力创通、振芯科技、上海沪工等也明显上涨。　　消息面上，在日前召开的2025中国5G+工业

2025-12-03