数字时代,以大模型为代表的新一代人工智能作为国家重大战略需求,是支撑并强化更高水平人机智能协同的关键技术方向。特别地,大模型在数据、信息、知识、智慧的跨链增值上,已呈现“智能涌现”的规模化优势,并且这些功能可以辅助并强化人类工作的知识性助益。基于大模型的知识助手,是当前商业价值最大化而潜在风险最小化的大模型落地场景,能够广泛提升人与AI应用协同工作的体验与效率,实现工作效益的切实变革。

  北京中关村科金技术有限公司(简称“中关村科金”),已实现大模型知识助手在企服赛道的成功切入。中关村科金通过自主研发的领域大模型、大数据智能搜索、多模态文档解析等关键技术,在知识问答、知识构建、知识归纳、知识推荐等核心场景,实现高效率、低成本、规模化的强人工智能创新应用,打通企业知识应用的“最后一公里”。

  一、大模型时代下的新型人机协同,知识助手成功开启商业蓝海

  当前,以大模型为代表的通用人工智能正在飞速演进,正在成为重组数据要素资源、重塑人机协同新型生产关系的关键力量。较短时间内,基础大模型的研究和发布呈蓬勃发展态势,接下来将进一步呈现商业落地的竞速比拼。

  然而,大模型的落地时间表还与具体场景要求息息相关。大模型的商业化变现仍面临幻觉倾向、数据偏向、准确率不足等挑战,需根据具体商用场景甄别实际风险,从而制定相关技术路线和制度规范体系。

  根据落地场景的容错性和通用性要求,大模型知识助手将率先开启商业蓝海。具体而言,可以按照容错性、通用性两个维度将应用场景划分为以下四个象限(如图1所示)。其中,服务企业内部员工的知识助手,既具备专业性、又具有较高的容错性,是短时间内大模型技术落地应用的最佳切入点。

图1:应用场景划分


  二、聚焦效率与体验,大模型知识助手已成三大应用模式

  基于大模型的知识助手,能够提供面向搜索的精准问答,从而打造企业知识应用的新范式。尤其是,对比传统企业知识库、QA机器人等传统知识管理手段,大模型知识助手能够带来知识归纳、构建、问答、推荐等全流程效率和体验变革。一方面降低知识归纳和构建过程的成本,特别是现有信息抽取模型技术的大量标注、定制化开发模型时间长、纯人工总结的私域数据规模太大等难题;另一方面提升服务问答和推荐环节的问题覆盖范围,避免语义理解环节的匹配度低、无法覆盖长尾等问题。

图2:传统知识库架构


  大模型知识助手,可以由浅至深分为三种应用模式,如图3所示:

  一是“通用大模型+提示工程”。对于知识总量有限、专业性要求不高的企业,可以直接使用通用大模型,针对企业具体的场景需求,由业务专家探索出提示词,此时企业需要的是一套灵活好用的提示词管理工具。

  二是“通用大模型+领域知识库+提示工程”。对于长尾碎片知识(如SKU)较多的企业,需要在通用大模型的基础上,外挂领域知识库,针对具体场景、企业特有的问题可以让大模型去知识库里找答案,最后再在提示词的引导与约束下返回输出结果。

  三是“领域大模型+领域知识库+提示工程”。对于领域常识总量大的企业,需要构建企业专属的领域大模型,将领域里的通识输入到大模型的“大脑”里,既保持通用的常识和推理,又具备领域内的专业知识和技能,让大模型由本科生变成领域专家。

图3:大模型知识助手的三种模式与四项挑战


  目前,中关村科金基于领域大模型的知识助手产品已在和诺亚财富的合作中得以应用。中关村科金通过融合自研的金融领域大模型、智能客服等人工智能技术,为诺亚财富打造的智能知识库,具备多模态文档分析、QA问答对自动抽取、知识内容自动标签化处理能力。通过集成诺亚财富的企业微信和旗下财富管理平台iNoahAPP应用,为其员工和用户提供基于企业知识文档的智能问答查询功能。通过大模型技术为智能客服产品赋能,大幅提升客服系统问答意图识别准确率和回复准确率,预期后期可减少70%以上的系统运营工作,有效帮助企业降本增效。

  三、风险与价值的双向平衡,核心攻关四大技术能力

  中关村科金凭借领先的AI技术实力、系统的解决方案能力、深度的行业服务经验,研发与企业用例的整体风险容忍度相一致的知识助手,并且完善相关技术路线和参与共建行业制度规范以减轻相应风险。在知识助手的基础上,公司研发“基于大规模语言模型的营销助手”,荣获中国信通院2023可信AI案例大模型研发应用和工具平台优秀案例,并且设计“企业超级员工”成功入选“2023WAIC全球创新项目路演TOP20榜单”。目前,中关村科金可为企业提供开箱即用、系统无缝衔接、成本可负担的大模型服务。

图4:知识助手产品示意图


  中关村科金聚焦形成四项核心技术能力,以平衡大模型的风险防范与价值创造。

  一是避免产生幻觉(Hallucination)倾向的外挂知识库技术。幻觉倾向是指大模型经常生成一些看似合理、实在不符合事实的语句。有时杜撰出来的信息一看便知真假,有时则让人一时无法分清事实。幻觉是目前大模型的一项固有属性,中关村科金通过外挂知识库在很大程度上杜绝该现象。

  二是领先的多模态文档解析技术。企业内高频、事实性知识(KnowWhat)往往存储于结构化数据库中,流程性知识(KnowHow)和一些低频事实性知识往往存在于非结构文档中,如:产品手册、操作规章、培训视频等。这类数据以往只能打上一些粗粒度标签,中关村科金通过自研的ASR、OCR等预处理后,能够做结构化的解析和表示,输入到大模型中实现细粒度的语义理解和流程挖掘。

  三是基于大数据智能的思维链归纳技术。企业内外部真实问答场景中,往往流程性知识问答占比较高,中关村科金通过自主研发的领域大模型,从文档中的显性文字描述中理解这类知识、从日志中的隐性事件中挖掘出这类知识,实现了优于传统技术的增值点。

  四是避免灾难性遗忘的领域模型训练技术。领域常识注入通用大模型的过程中,往往造成大模型通用能力的下降,中关村科金通过训练数据和训练任务等一系列技巧,可以使其在具体任务上性能显著提升且保持通用性。

  大模型是大势所趋,所有业务或场景都会涉及其中。目前,知识助手是企业服务赛道上最佳的切入点。未来,在其合规性、安全性、可解释性等得到保障并赢得用户的数字信任后,可进一步布局营销、客服、运营等全链业务生态,实现新型人机协同的价值释放。