银河证券发布计算机行业月饼称,1月板块表现强劲。人工智能板块指数(884201.WI)表现强劲,涨跌幅达3.6%,显著优于同期的宽基指数。这一逆势上扬的态势反映了市场对人工智能技术持续迭代和应用拓展前景的认可。
DeepSeek全球爆火,国产大模型加速迭代。1月20日,DeepSeek正式发布并开源DeepSeek-Rl大模型,在数学、代码、自然语言推理等任务上性能比肩OpenAl ol正式版。同日,Kimi发布了多模态思考模型k1.5,其多模态和通用推理能力达到行业领先水平。1月22日,字节跳动发布豆包大模型1.5 pro,综合得分优于GPT-4。1月29日,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布,在多向公开主流模型测评基准上录得高分。这些进展表明,国产大模型正在持续缩短与美国核心厂商的差距,尤其是DeepSeek-V3/R1通过算法与工程侧深度耦合,不仅将算力资源利用率最大化,降低成本(训练成本仅为OpenAI同类模型的1、30),且性能上比肩OpenAI ol。以DeepSeek-R1为代表的通用大模型开辟出了一条新的AI技术范式,震惊全球。国内AI应用及端侧AI的优势在于丰富的场景生态和庞大的流量,DeepSeek的开源策略和高效性能将赋能AI应用与端侧AI爆发,认为,AIAgent将在教育、办公、金融、医疗等领域发挥价值。
算力国产化进程预期加速。1月13日,美国政府宣布推出AI芯片管制新规,旨在进一步限制中国等国家和地区对于高端AI芯片及技术能力的获得,并对华封锁16nm以下先进制程。这一举措将倒逼国产技术持续突破。另一方面,DeepSeek开源大模型也对国产化产生积极影响, DeepSeek通过使用FPS低精度训练、双管道训练、共享专家机制,大大降低了训练成本(DeepSeek-v3模型仅用557.6万美元和2048块H800GPU完成训练)。大模型成本的降低以及技术进步将推动整个算力资源使用总量上升,杰文斯悖论将再次到来,以DeepSeek为代表的大模型厂商将加速算力国产化进程。