春节前,中国人工智能企业DeepSeek发布了一个新的模型DeepSeek-R1,其基准测试性能可与OpenAI的o1相媲美,但其成本又大幅低于OpenAI,引发全球人工智能领域的轰动。

  DeepSeek-R1并非是AI领域的颠覆性创新,而是通过架构创新与算法优化大幅提升了效率,它对世界的巨大冲击主要源于其开源模式与低成本。OpenAI在发展出通用大模型后采取了闭源策略,企图实现技术垄断。

  人工智能发展高度依赖英伟达先进芯片的算力支持,OpenAI以天量投资堆算力并且不断迭代其专有模型,从而形成了类似于上世纪80年代的微软英特尔组建的“Wintel”联盟。英特尔在一定程度上垄断了先进算力,同时受到美国政府对其的销售限制。特朗普政府就职后,立即宣布5000亿美元投资AI的“星际之门”计划——三家科技巨头将在美国联手打造人工智能(AI)基础设施项目。

  DeepSeek-R1则以开源的形式发布,任何人都可以下载使用并加以本地优化,这使得原先由巨量资本垄断的AI突然实现了全球技术平权,绝大多数没有能力实现主权AI(通过战略性地使用人工智能来增强一个国家保护和促进其利益的能力)的国家,可以在DeepSeek开源模型基础上参与和发展。DeepSeek也证明了扩大规模并不是AI升级的前提,人们不需要投资天量的算力就能以相对较低成本发展AI,降低了准入门槛。

  目前,通过开源社区和全球下载渠道,DeepSeek的技术影响力已扩展至157个国家和地区,不仅在100多个国家和地区的苹果App Store与安卓平台下载排行榜首位,全球诸多机构、企业和政府也在本地部署DeepSeek-R1。中国许多金融机构、平台企业、汽车公司、国有企业、高校等都相继接入DeepSeek的系列模型,DeepSeek正在成为全球应用最广泛的人工智能模型之一。

  令硅谷惊叹的DeepSeek之所以取得成功,其原因之一是它没有完全按照大多数资本和企业的商业逻辑进行发展。中国还诞生了很多大模型,但许多投资者首要考虑的是其商业价值,即能够有应用变现盈利的可能。这要求技术人员必须按照某种具有一定限制的路径发展,同时技术跟随的成本和风险也相对更低。DeepSeek的目标不在于跟随硅谷的脚步并将相关技术加以商业应用,而是主要为了模型创新,研发时对应用落地与安全性等问题考虑较少。恰恰因此,DeepSeek实现了创新并成为最广泛的应用之一。

  当前,我们也要认识到,我国包括DeepSeek、通义千问、豆包、月之暗面等在内的大模型与美国相比仍然存在差距,既包括高制程人工智能芯片的差距,也包括在诸多高难度任务上算法与模型的差距。在此背景下,仍然需要DeepSeek这样的团队如之前一般专注于创新,而不是仅仅为了追求眼前的商业利益而转向“应用开发”。毫无疑问,DeepSeek等AI企业应该继续迭代其模型并不断进步。我国在AI领域追赶世界先进水平需要更多坚持创新与长期主义的企业。同时,中国企业也还需要加快发展人工智能芯片,并在国产算力平台上部署与训练国产大模型,并不断优化。

  通过开源,DeepSeek将形成全球性的应用与创新生态系统,我国企业应抓住机遇走在前列。目前,OpenAI为了与DeepSeek竞争生态,随即公布o3、Deep Research等技术进展,降低应用成本并开始与日本、印度等国家进行合作,从而寻求在全球市场巩固其地位。然而,我国企业在推动DeepSeek生态系统时,绝不能将其作为资本炒作的工具,否则这将异化其价值,并导致我国构建AI生态体系的努力受到削弱。