“大模型是中型公司的机会,它既有比小公司更多的资源,又有All in的决心。”

  文|《中国企业家》记者 赵东山

  2023年春节后,APUS创始人、CEO李涛在公司提出一项明确的要求——全员必须All in人工智能。该要求严格到,连行政人员也必须考虑人工智能如何改进自己的工作。李涛甚至提出要将员工使用人工智能的程度与涨薪挂钩。

  过去的近10年中,APUS以手机系统和软件出海见长。面对老板这样的要求,一部分员工自然是懵的,他们完全不理解李涛到底要干什么,就像李涛第一次见到OpenAI创始人Sam Altman时,他本人也完全没想到会有一个如此宏大的画卷摆在面前一样。

  2019年,沈南鹏率领三思院的一众创业者学员前往硅谷游学,这一行中,李涛、王小川、王兴、张一鸣等新锐企业家都在列,游学的重要行程就是拜访很多硅谷的大佬,如雅虎创始人杨致远、Zoom创始人袁征等,其中的一站,他们见到了Sam Altman。

  Sam Altman当时给大家演示的案例,是人工智能在游戏场景中的应用。“当时大家听了都觉得很酷,但是没有想到它的应用场景有这么大。”李涛向《中国企业家》回忆。

  时间来到2022年11月,ChatGPT的问世让李涛有种“后脖颈发凉”的感觉,“惊鸿一瞥”是他当时的感觉。

  李涛惊讶地发现,ChatGPT颠覆了以往信息交互的方式,仿佛在跟一个真人在交流,可以连续追问,它用对话机器人的方式不停给你答案,它甚至知道你在想什么。而且,ChatGPT门槛极低,很多人都可以用。这些都给了李涛极强的冲击力。

  从那一刻起,李涛深刻地意识到一场新的技术变革已经到来,一场新的狂欢即将开始,而作为最早意识到这一趋势的群体之一,李涛也开始了自己的大模型探索和准备。2023年4月18日,APUS发布自研的千亿参数规模多模态人工智能大模型“AiLMe”,并在近日开放公测。

  曙光出现

  在亢奋地投身大模型之前,李涛身陷一种巨大的痛苦中。用他自己的话说,“找不到出路。”

  过去几年,在疫情和全球局势变化等客观环境之外,李涛明显感觉到互联网时代尾声的到来,他眼睁睁地看着身边的人去炒比特币,去做加密货币,随后又加入Web3、元宇宙,转行一波接一波,在李涛看来,“本质是大家都找不到出路”。

  其实,就在几年前,APUS才刚完成一次转型。

  从2014年成立到2019年左右,APUS一直是一家主做手机系统和工具类应用软件开发的企业,其主要市场在东南亚等新兴地区和国家。2019年后,李涛越来越强烈地意识到,全球化就是这一代中国企业的宿命。除了东南亚等市场,还有很多发达国家市场有待挖掘,如美国、欧洲、日本、韩国等等。

  然而,面对发达国家市场,势必无法再用原来的工具和系统,否则在这些市场无法得到竞争优势。为此,过去几年,APUS的组织能力建设和团队基因发生了变化,除了原来工具类的产品,李涛率领团队在内容类、交易性、社交类产品方向上做了大规模的尝试,并涌现出PickU和CutCut等小爆款。

  不过,那些小的成就根本无法掩盖李涛对移动互联网红利殆尽的感伤。ChatGPT的出现,才让李涛感觉看到一道曙光。

  在做内容类产品的过程中,李涛接触到大量的用户需求,仅以旗下产品CutCut所在图像领域为例,用户就会产生自动化修图、变老、变年轻、性别转化等需求,而为了满足用户的这些需求,就必须引入新的人工智能技术。借此契机,APUS完成了人工智能能力第一步的积累。

  等到体验过ChatGPT之后,其所展示出的易用性和亲民性,让李涛再次意识到人工智能技术能力在这中间起到的判断和衔接作用。

  2022年12月,李涛在公司内部召集了一个大模型团队,并快速立项,将重心全部转移到人工智能和大模型上。李涛还下了三个结论:第一,通用人工智能时代即将到来,而人工智能时代的操作系统就是大模型;第二,APUS一定要有大模型;第三,必须得是自己做。

  今年3月,APUS专门分拆成立人工智能研究院,由研究院首席专家张旭负责。张旭本科、硕士、博士均毕业于清华大学,也是此次大模型的主力之一。

  张旭告诉《中国企业家》,AiLMe采用目前业内主流的Transformer架构,同时设计了一套“插件式”架构,可以自主学习和使用“工具”,这些“工具”以插件的方式接入到AiLMe平台中。而在文本、图像、视频、音频的生成部分,AiLMe则沿用了目前业内主流的扩散模型(Diffusion Model),并继承了开源社区的生态。

  急速转身

  2023年4月18日,APUS发布AiLMe时,多少有点让人惊讶,因为这是继百度之后,第二个中国公司推出的大模型。

  李涛告诉《中国企业家》:“背后无非两个因素,一个是意识和决心的问题,另一个是资源和能力的问题。APUS并不是因为快,而是因为早。”就像百度在2019年就推出文心大模型,李涛在2022年12月就集公司之力打造大模型。

  李涛关于大模型的意识和决心,除了2019年见过Sam Altman种下的种子外,还因为在过去20多年的从业经历。

  在创办APUS之前,李涛曾在大唐电信做过微波通信,之后与周鸿祎一起创业做三七二一,后被中国雅虎收购;随后他加入奇虎360担任高管,并成功推出手机安全卫士、手机助手等爆款产品。

  李涛清楚地知道,一个新的技术时代对于操作系统来说意味着巨大的红利。他亲历了以windows+IE为操作系统的PC互联网时代,以及苹果+安卓为操作系统的移动互联网时代,他不忍心自己再错过即将到来的以大模型为操作系统的通用人工智能时代。

  何况,在移动互联网出海时期,李涛已经用速度证明过一次自己的判断。APUS创办于2014年,李涛是最早将出海带到中国创投圈的创业者之一。那时,基于Launcher桌面系统、清理安全、加速等工具类产品,APUS实现了“上线1个月超千万,6个月破亿”的增长成绩。

  谈到资源和能力,APUS虽然不如大厂的资金雄厚,但李涛认为,“人工智能大模型是中型公司的机会,因为它既有比小公司更多的资源,又有All in的决心。”

  李涛透露,目前APUS年收入在超过10亿元人民币的规模,公司账面上也趴着10多亿元现金。此外,目前APUS在全球用户量已超24亿,覆盖200多个国家和地区。

  此外,APUS动作够快的另一重因素是,采用了开放的研发模型。在APUS人工智能研究院之外,APUS还跟中科院、清华大学、南洋理工大学、香港理工大学等高校实验室形成开源的项目组,让大模型的搭建快速落地。

  高质量的数据比算力更重要

  李涛将影响大模型质量的要素分为4类:算法、算力、数据和场景。在他看来,如果将决定大模型效果的因素按照重要性来排序,应该为:训练数据质量>训练数据规模>参数规模。

  在技术路线上,APUS采用大参数和大数据来训练中等规模模型。

  “AiLMe是1000亿参数的模型,但背后的数据其实是2.2万亿的token,他们原来都是追求所谓大参数,APUS在训练上略有不同,我们的场景依赖度会更高。”李涛告诉《中国企业家》。

  为解决算力问题,APUS在郑州和新加坡分别建设了两大智算中心,在自建GPU服务器算力外,APUS还跟腾讯、阿里、亚马逊等服务商进行租用和采购,与第三方的算力协同作用。

  在数据方面,APUS大模型的数据来源有4个:第一,公开的行业数据;第二,互联网的公开数据;第三,专门用于训练人工智能的数据集;第四,真实的用户需求数据,即每天有上百万人在使用产品时产生数据和互动,该部分在模型训练里的权重也非常高。

  在李涛看来,ChatGPT的震撼一半归功于OpenAI团队,另外一半得归功于全球的用户,因为是全球的用户打开了ChatGPT的想象空间,开启了思维模式。

  相比大家对算力的焦虑,李涛更看重高质量的数据。

  “这通常是真实用户的真实需求和问题,我们都脱敏过,不会涉及数据隐私安全,更关注用户的问题和需求,至于你是谁并不重要。”李涛解释,比如,APUS旗下“智能问答大师”产品每天产生几十万的用户问题,这些都可以用来训练数据和模型。

  针对具体应用场景,APUS从AiLMe大模型内蒸馏出文本、图像、视频、音频四个垂直领域精炼模型,并基于此开发出直接面向用户的智能问答大师、简笔成画、墨染、Star Night、KJV Bible Now、PicPik等AI产品。

  在李涛看来,应用场景最大的好处是两个,第一,提供高品质的数据;第二,提供实时的数据。

  在商业模式上,李涛采用短期to C、中长期to B的模式。他认为,to C很容易形成闭环,用户自发付费,更灵活也更有弹性。但中长期一定是to B,因为一家公司所能覆盖的场景一定是局限的,需要更多的行业伙伴共同建构。未来它将无处不在,所有的服务都要用到它,整个市场将是10万亿美元以上的规模。

  与此同时,李涛还预言,未来很多行业服务都要通过在大模型基础上蒸馏出精炼模型来支撑,而不是用大模型全局支撑,因为这样成本太高了,一个大模型会蒸馏出若干个经验模型,用来支撑不同的服务。

  从春节到现在,APUS内部员工从部分人不解、一些人不信,到慢慢地大家都去尝试,一切都在悄悄发生变化。如今,APUS几乎所有的员工已经有了采用AI工具的意识,李涛也提出了“如果员工借助AI提效30%涨薪10%,提效50%涨薪20%,提效50%以上涨薪30%”的允诺。

  在此背景下,APUS内部正在分成三批人:一批人专注做大模型;一批人专注把大模型用到C端产品上;另一批人就是职能部门的员工,可以采用任何AI产品。内部员工的产品选择,也正形成一种隐形压力,比如李涛可能会问:“你看同事都不用你的产品,你是不是得努力?”

  过去的20多年,李涛亲历了360的起伏,也见证了字节跳动、美团等新巨头的崛起,他直觉判断通用AI大模型会成为未来20年的主流,“这是一场全新的技术革命,既然我都看到了,就必须要跑在别人前面。”

  过往的经验告诉李涛,任何技术变革前期都是巨大红利期,也是对社会创造价值最多的时间窗口。“对于做企业的人来说,永远要捕捉这个时代的潮流。”李涛表示。