当前,全球人工智能技术发展迅速,大模型成为行业关注重点。但大模型普遍存在的“AI幻觉”问题,影响其准确性和可靠性。

  中国科学院成都计算机应用研究所副总工程师,研究员、中国科学院大学教授、博士生导师秦小林在接受金融投资报记者采访时表示,DeepSeek大模型功能固然相较以前有大幅提升,但其逻辑推理能力有待提升,幻觉问题仍未解决。

  金融投资报记者注意到,面对“AI幻觉”难题以及探索大模型更广泛应用场景的需求,四川企业并未仅仅满足于引入DeepSeek,而是凭借敏锐的行业洞察力,主动深入挖掘。尤其是“AI幻觉”这一难题,四川多家企业积极行动,与DeepSeek深度融合,在不同领域与DeepSeek开展合作,DeepSeek的四川朋友圈不断扩大。

这些川企致力解决大模型幻觉问题

  AI幻觉,指的是模型产生不准确或无根据的回答。

  秦小林举例称,他向DeepSeek提问了初中数学中三角函数的问题,但并未收到正确回答。

图片

秦教授向DeepSeek提问的数学问题

  “其实还是需要理性地看待DeepSeek。我给R1一个有点难度的几何题,DeepSeek、豆包都相去甚远,Chatting的回答稍微有点像那么回事,但仍然没有给出正确的结果。”秦小林告诉金融投资报记者:“大多数时候是给一个差不多的答案,然后自圆其说。还有一些简单的问题,大模型也喜欢将简单的问题复杂化,不过会给解题人一些思路,这一点倒是比较有意思。”

  在秦小林看来,目前的大模型仍未解决“AI幻觉”问题,DeepSeek对已有知识的能力的确进步神速,但机器的逻辑推理能力仍有不少的路要走。

  不止数学问题,不少用户在使用DeepSeek的过程中发现,它在回答专业问题时经常存在幻觉。例如给它一首歌让其分析音乐风格并对其进行深度解析,DeepSeek生成的内容看上去十分专业,但实际上仍有不少专业性错误。

  金融投资报记者观察发现,AI幻觉的问题在于,AI会生成大量专业词汇,当它生成的内容超出用户学科认知的时候,其信息量之大,让用户很难一一核对,无法辨别真假。

图片

用户使用DeepSeek时收到的错误回答受访者供图

  针对解决AI幻觉问题,金融投资报记者了解到,成都它思科技有限公司(以下简称:它思科技)在成立之初就把解决幻觉问题当作头号问题,是业内目前在解决幻觉问题上投入相对较多的企业。

  思科技CEO赵贤宇此前接受金融投资报记者采访时表示,它思科技采用了“检索增强生成”(RAG)技术。该技术能够根据知识库中的信息生成可靠的答案,降低了编造答案的可能性,从而降低了模型的幻觉。

  “DeepSeek是它思科技常用的底座大模型之一,DeepSeek的强化学习思路和我们半监督学习从本质上是类似的,只不过具体实操有些区别,可以做到类似的效果。”它思科技首席技术官聂玮奇向金融投资报记者表示。

  据悉,它思科技目前在文旅场景有一些新的产品尝试,但具体实验成果目前还在保密阶段。在解决AI幻觉上它思科技是否有更新的技术进展?金融投资报记者将持续关注。

  此外,成都明途科技有限公司(以下简称:明途科技)在解决大模型幻觉方面也有布局。明途科技董事长肖雪松表示,明途的私有数据价值发掘、决策智能和群体正好可以帮助DeepSeek解决通用模型的幻觉问题,帮助其在B端和G端实现商业化落地,尤其是明途的决策智能,正是DeepSeek推理能力的下一步延伸方向。

DeepSeek四川朋友圈持续扩容

  值得一提的是,四川企业在拥抱DeepSeek方面展现出极高的热情与行动力,不断融入其朋友圈。

  算力领域,四川华鲲振宇智能科技有限责任公司目前已经适配DeepSeek V3、R1、R2模型,并免费提供48小时DeepSeek基于昇腾算力任测服务,2月10日起,用户可免费申领DeepSeek API接口。

  芯片领域同样积极响应。成都华微2月6日在互动平台表示,DeepSeek的推出使得大模型的部署计算算力需求大幅降低,一方面是模型训练成本降低,另一方面为大模型在边缘和端侧的部署提供更有力的支撑,使得AI端侧大规模商用落地进度大幅提前。公司致力于边缘和端侧人工智能处理器开发,也在积极推进在处理器开发上进行DeepSeek推理模型部署,打造智能联合体在智能机器人、机器狗等方向的应用,提供从算法到软件到算力芯片的端到端解决方案。

  医药领域也不甘落后,四川合纵药易购医药股份有限公司2月7日宣布全面部署DeepSeek大模型,用于医药智能供应链、新零售赋能、精准医疗等场景。其部署标志着医药大健康产业生态的数字化升级,旨在从“经验驱动”转向“数据智能驱动”模式。

  AIGC应用服务商成都数据天空科技有限公司也上线DeepSeek,其人工智能开放平台目前已上线了包括DeepSeek在内的近60个AI模型,通过数据天空的AI云盒接入,用户可以低成本实现对比模型对比应用。

  目前,四川各行各业在DeepSeek的应用与推动上,正通过技术创新、产业融合、模式探索等多种方式多点开花。

  延伸阅读

西南交大人工智能专家邢焕来:

尽快本地部署DeepSeek防止网络攻击

  DeepSeek爆火后,受服务器限制及海外网络攻击影响,用户向DeepSeek发送文字聊天消息总会遇到崩溃情况。2月6日晚间,DeepSeek暂停了API服务充值。官方对此声明称,当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。

  西南交通大学计算机与人工智能学院副院长、博士生导师邢焕来接受金融投资报记者采访时,从网络安全从业者视角深入探讨此次事件。

  邢焕来指出,面对大规模网络攻击,DeepSeek原本应具备一系列有效防御机制,如升级防火墙安全策略、部署DDoS防护系统、入侵检测与防御系统,实施强密码策略与多因素认证,同时定期进行安全审计和漏洞修复。针对网络服务因流量压力过大而崩溃的问题,可采用流量预测、异常检测与分析、自动扩展服务、负载均衡以及利用云服务提供商弹性资源等技术手段,提前预测和应对流量峰值。

  在服务维护和API调用限制方面,邢焕来建议加强API调用频率限制,实施服务降级策略,优化数据库,提升缓存性能,并建立灾备和快速恢复机制,以保障服务稳定性。

  值得注意的是,近期DeepSeek受到的攻击呈现出一些新特点。攻击针对性强,专门针对像DeepSeek这样拥有丰富数据或知识产权的组织和企业,攻击者会详细收集目标情报,了解其防御和内部结构;组织严密,由专业团队实施,利用0day漏洞、僵尸网络等先进技术和工具;持续时间长,可能长达数月甚至数年;隐蔽性高,通过加密通信、修改日志等手段隐藏行踪,传统安全防御系统难以侦测。

  针对这些新特点,邢焕来表示,防范措施包括实时更新防火墙安全策略、加强日志分析与溯源,以及与安全厂商合作进行威胁情报共享。对于普通用户,当遇到网页崩溃时,可尝试本地部署DeepSeek,下载模型参数到本地,实现无需联网即可使用。

  “具体来看,本地快速部署DeepSeek首先需要安装大语言模型运行框架Ollama,然后下载DeepSeek最新发布的开源模型,最后安装AI 客户端应用和智能助手Chatbox AI,按提示添加模型并完成配置,即可本地使用DeepSeek。”邢焕来表示。