AI开始认知世界,成为有知识、能思考、善表达、会学习的智能体。

  文|《中国企业家》记者 赵东山

  ChatGPT引爆一系列变革之后,给王小川的直观感觉是“地动山摇,要变天了”。

  过去一个多月里,几乎每隔一段时间,甚至是每隔几天,OpenAI就有新的技术进展,从GPT-4的发布,到与微软Office系列产品的结合,再到推出Plugin平台开放更多的插件,每天都在刷新人们的认知。王小川对此的形容是“掉个渣儿都会产生很大的影响”。

  ChatGPT也引发了国内的AI大模型创业潮。在一系列的讨论中,王小川被认为是最有可能参与打造中国版OpenAI的候选人之一。

  王小川是清华大学计算机系96级的知名人物,创办了搜狗搜索,多年前就通过AI技术探索在输入法、搜索、语音识别等应用。更重要的是,2021年10月,卸任搜狗CEO后,王小川一直在寻求指引他再次创业的那盏明灯。一年零两个月后,他终于看到了。

  2023年1月,王小川在试用ChatGPT后,意识到“强人工智能时代到来了”。仅3个月后,4月10日,他正式官宣入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能。

  目前,百川智能已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。团队拥有包括来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的数十位顶尖AI人才。

  不同于创办搜狗,这一次创业,王小川把自己的名字写进了公司名字中,他解释:“百川不是我一个人,需要更多人来做这个事。”每天,他花三分之一的时间找人,三分之一的时间学习。他也非常有信心在年底做出中国最好的大语言模型。

  过去十多年,王小川一直在关注人工智能的进展。2016年,在AlphaGo与李世石展开人机大战之前,他就和几位AI大佬打赌并预测AlphaGo会赢。不过,从搜狗退出后,他把重心转移到了生命健康领域,这些年他读了上千篇医学论文。

  关于缺失在人工智能语境中的那两年,他告诉《中国企业家》:“可能有人比我先淋到雨,但有可能他不觉得在下雨。但当雨滴滴下来之后,我第一个意识到,变天儿了!”短短三个月,他用ChatGPT的次数已经明显多于用搜索的次数。

  针对“谁能在这场大模型竞争中胜出”这个问题,王小川表示:“小创新大厂赢,大创新小厂赢。大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,这个事就适合用创新来做,我不觉得AI创新是专属于大厂的事情。”

  王小川的精彩观点如下:

  1.创业不是一个拼盘的过程,感觉好像拉几个人,概念上放在一块就行了。它是一个生命体,要不断演化,一点点长起来。

  2.我现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要的,这是不一样的。

  3.机器掌握语言,强人工智能就到来了。当你没有语言的时候,我们其实没法去认知这个世界,语言的边界就是世界的边界。

  4.OpenAI需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。这种情况本身就跟科学精神更一致。

  5.搜索正好是ChatGPT的反面,细节都知道,抽象知识不会。ChatGPT是抽象知识会了,细节全忘了。就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。

  6.OpenAI的逻辑叫做理想大于落地。我们就要平衡这件事儿,理想上可以比OpenAI慢半步,落地要快半步。

  以下是《中国企业家》采访王小川实录(有删减):

  谈ChatGPT:当它能多轮对话时,我觉得要变天了

  《中国企业家》:我们最近访谈了很多人,他们谈到ChatGPT的时候,往往都有一个惊艳时刻,你有没有这样的惊艳时刻?

  王小川:我们一直搞语言,搜狗当时也做了百亿参数的大模型,但交给腾讯之后,我开始转向把健康变成数学问题的研究,中间零零散散看到一些进展突破,假如当时还在语境里,我可能会更早敏感到这个事儿。尤其记得当时,当你提个问题,一旦后面加了一个prompt(提示词)“think step by step(仔细想一想)”,机器就答对了,我觉得好好玩儿。

  到了今年1月,用了ChatGPT之后,当我开始追问它时,我就发现变天了。它能够用最自然的方法,根据我的提问回答,然后我再追加几个字的问题,它能根据追问做调整,这个时候我就发现不得了了,通用人工智能时代已经到来了。

  《中国企业家》:傅盛老对外讲他问ChatGPT,他的狗为什么叫三万的问题,随后让他惊艳,你有没有问这样的问题?

  王小川:我跟他们其实很不一样。我可能不需要一个特别能让大众理解的东西来触动我。我记得当时有个会,我和傅盛都参加了。我当时就讲,通用人工智能到来了,他还不信,还觉得我在装。但后来他打电话跟我说,小川,你太英明了,他也跟我说了三万这个案例。

  我的敏感跟大家不一样,看到它能够多轮对话了,我就觉得通用人工智能时代到来了,并不是需要三万这样一个惊艳的例子。

  《中国企业家》:其实你很早就预言,“当机器掌握语言之后,强人工智能就到来了”,会想到这么快就被实现了吗?

  王小川:没有这种时间上的概念。刚好在技术突破的时候,我退出搜狗离开了这个语境,但当这个雨滴滴下来之后,我认为我是第一个意识到,变天儿了!可能有人比我先淋到雨,但他不觉得在下雨。

  《中国企业家》:国内这么多年来一直在人工智能方面深耕,还有很多卓越的创业者,为什么等到ChatGPT出来之后才恍然大悟?大家原来都忽略了哪一点,或者说不敢想?

  王小川:本身这种原创性的想法,很多时候就发生在美国。我简单讲,大家不是不敢做,是没想法居多,特别到了工业界更是这样子。他有自己的业务目标,天天为了向老板怎么汇报,天天琢磨收入,谁没事儿琢磨这个呢?

  但我想过。AlphaGo出来之前,大概2013年我已经在想CNN网络(卷积神经网络)能下围棋,当时我就满清华去找老师合作,想去做下围棋这事儿。系主任、党委书记、所长、实验室主任都找过,大家对这事没有太大的冲动和热情。

  AlphaGo出来之后,我有两个断言:第一,机器掌握语言之后,强人工智能时代就来了;第二,预测下一个由AI改变的是视频。我相信今天预测下一个由AI改变的是视频这个事儿,也一定有人在死磕,因为这意味着你对物理空间有新的理解。

  我觉得需要有这种脑洞,这个脑洞需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。这种情况本身就跟科学精神更一致的,去理解一种规律,跟商业世界确实比较远。

  《中国企业家》:即使最头部的大厂意识到通用人工智能的机会,可能也没有办法持续投入?

  王小川:没错。这也是为什么我觉得谷歌干不过OpenAI的原因。谷歌里面的工程师,可能有这个想法,没人有这个想法也组织不起来了。

  谈通用人工智能:语言的边界就是世界的边界

  《中国企业家》:你在很多场合说过语言的重要性。你认为语言在人类的文明,包括未来智能文明当中,扮演的角色是什么?

  王小川:我之前说“机器掌握语言,通用人工智能就到来”,就是把语言跟通用人工智能放在一个画等号的位置上。

  我之前从做搜索、做输入法,都是以语言为核心。我们小学上课的时候就知道,马克思、恩格斯也讲,人跟动物的区别,就是会语言、会使用工具。

  我经常举一个例子,有一件艺术品叫做“三把椅子”:一把真的椅子在这儿,一张椅子的照片,还有一个是椅子这个词。三把椅子,哪个才是椅子?

  我们的第一反应可能都是,真正的椅子它是。但是,我们去想,假设没有发明椅子这个词,人类没有个概念之前,那你坐着的就是一个东西,你没有办法抽象成一个具体的功能载体。

  当没有语言的时候,我们其实没法去认知这个世界。维特根斯坦也讲到,语言的边界就是世界的边界。语言既是知识的载体,也是沟通的载体。

  《中国企业家》:我听到一种说法,之前的深度学习的方式更像是一个人学习外语的方式,现在这种大模型的学习语言的方式,更接近于学习母语的方式。

  王小川:我是认同的。其实今天的问题,是深度学习之上更大的一个复杂方式,区别在哪儿?

  学外语的时候,你等于要重新挂一个模块进来,通常是强迫你在迅速高密度地知道这种语料,所以本身是大量的叫做监督数据或者标记数据里去做映射,例如英文映射成中文,你再去学习它,这是我们通常学的一种方法。我们之前做机器翻译也是一样的。

  但今天的做法,是让你先去书读百遍,其义自见,就跟小朋友学习一样。第一天不是先教他学东西,而是先自由地到处看,他可能看到泡泡往上走、气球往上飞会特别兴奋。他会很关注,然后去学。他学的是世界上基本的规律,不是当成一个知识来学。自然语言处理是人工智能皇冠上的明珠。

  谈行业变化:地动山摇,掉个渣都会有很大影响

  《中国企业家》:AI大模型出来之后,整个科技界就像打了一剂强心针,你身在其中,有什么感觉?

  王小川:地动山摇。

  我认为这是一个大时代的变化。我们已经走出了互联网时代、信息时代,进入到了一个智能时代,这种情况下,掉个渣都会产生很大的影响,我觉得这是一种新的文明。基础大模型其实需要特别多的钱,但不妨碍在中间有各种开发,做各种事情,有很多垂直领域的做法。

  我不认为今天可能就只有这么一件事情去做,有太多周边垂直的事情,然后更有创造力的事情,都被发展起来,就像人类社会一样。

  《中国企业家》:现在GPT-4不是开源的,对于创业来说,这不是在源头断掉了?

  王小川:局面很复杂。

  微软中国正在推云上接口,排队排得很长。中小企业排队,前面排了15000到20000个企业,还要先提前注册,然后排到一个半月甚至两个月后。此外,你还要写清楚,我的公司是干吗的,我的网页长啥样子,然后我调这个服务器干吗用的。对方审完了,才给你接口。

  《中国企业家》:前段时间OpenAI推出的Plugin平台,将会产生一个非常大的操作系统、生态系统,你怎么看?

  王小川:今天大家都说要做中国版OpenAI,但很少有把ChatGPT当成它一部分来看的,其实ChatGPT特别重要,是to C以后最大的一种颠覆性的入口和人机交互界面,就像黄仁勋讲,这是iPhone时刻。这种情况下,ChatGPT未来也会做增强,可能有不同的路线图。

  在我的想法里,会去做搜索增强,你知道现在时效性不够,以及会有实时性的东西缺乏,需要用搜索去跟它接。搜索正好是反面,细节都知道,抽象知识不会。这个抽象知识会了,细节全忘了。就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。

  今天至少OpenAI的做法,就是一路狂奔,它不屑于把搜索当成一个老的轮子挂着,而通过Plugin的方式去解决,OpenAI的逻辑叫做理想大于落地。我们就要平衡这件事儿,理想上可以比OpenAI慢半步,落地要快半步。

  《中国企业家》:这一波浪潮来了之后,搜索是在被海浪拍的最前沿的那个海岸线,是吧?

  王小川:是的。今天我用搜索的次数已经开始低于ChatGPT的次数。

  《中国企业家》:你之前在做生命科学领域,后来出来做大模型,这中间你自己的变化是什么?

  王小川:生命科学比这事更有理想,这个事今天做,十有八九只是觉得小川你适合干。说明这事是更现实的,是已经被别人突破了。前几年突破之前,中国其实也有一些人想做,但是理想坚定度不够,或者受到局限。

  生命科学更复杂,更遥远,我认为健康本来就是数学模型,提了三个观点:第一,牛顿把物理学变成了数学模型;第二,OpenAI把语言变成了数学模型;第三,我思考把医疗健康变成数学模型。因此,我在选择时也力图在新公司里,把医疗健康作为重要的组成部分。

  谈创业:这不是属于大厂的游戏

  《中国企业家》:你大概在什么阶段决定正式筹备百川智能?

  王小川:2月份我开始认真想这件事。

  《中国企业家》:你把名字融入到公司名字,这个事看来很不王小川,是表明自己要All in?

  王小川:对,以前做搜狗的时候,没有这样一种机缘。这次来讲,确实你说得对。

  《中国企业家》:百川最核心的创始团队怎么达成的?吸纳更多外部的人,还是找原来一些创业伙伴?

  王小川:这是两个问题。

  首先,我是比较坚定一开始先从搜狗那边来搭团队。因为创业其实不是一个拼盘的过程,创业是一个生命体,要不断演化这种过程,是一点点长起来的。所以,今天的时代不允许你开始由两三个人一点点去找。

  第二,搜狗的团队离AI非常接近,很多人觉得无人驾驶是AI,搜索不是。其实搜索对AI的使用是非常多的,搜索也是数据、算力、算法,数据本身基本上是语言数据。搜狗其实是在语言数据上,到今天为止最有能力掌握数据的公司。此外,安全问题、意识形态问题等,搜狗也都是有成套的处理经验。

  《中国企业家》:探讨大模型创业,算力、数据、人才都是成本,如果拿不到足够多的投资,实际上这个事没法做。

  王小川:不同的路线图。如果想做的是离AGI(通用人工智能)最近的公司,那么我预测是3亿到20亿美元的资金投入。3亿只是入门的门槛。我们目前是选了对资金要求比较高的道路。

  《中国企业家》:在路线图选择上有过纠结吗?要选择离大模型最近的一条,还是做离使用更近的?

  王小川:双轮驱动。超级应用需要跟底层产生非常强的连接,如果没有底座是没有办法支撑超级应用,在我心中大底座和大应用是相辅相成的。

  《中国企业家》:具备什么样的素质才能选择离大模型更近的路?

  王小川:至少两件事,一是本身对技术有足够多的理想,因为它就是很挑战技术的活;二是中间有一定体量的公司治理的号召力和能力,否则肯定不会做。

  《中国企业家》:一端是对技术的理解,一端是对创业本身的理解。你说过有信心在年底做出中国最好的大语言模型,敢说这句话的人现在不多。

  王小川:大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,说白了这个事就适合用创新来做,我不觉得这是属于大厂的事情。

  不知道大家怎么看,我只不过长过一次教训,比如搜索那一波。最早搜索起来所有门户都做了一遍,搜狗是拆分完了好不容易活下来了,百度也活下来了,但是阿里、腾讯也都没有做成,而那还是可以看得见的成熟的东西,但今天有巨大的变化,对于决策的专注度、灵活度、专业性都有很高的要求,历史没有告诉我们大厂可以干这个事。

  《中国企业家》:大家认为大厂,有可能是基于眼睛可以看到的,比如现在有多少A100的芯片,有多少人才,看起来像是大力出奇迹,你认同吗?

  王小川:上一轮搜索也不是当时的大厂跟进的,这一波AGI也不是大厂可以做到的,但大家都说大厂可以干。这个东西就是“小创新大厂赢,大创新小厂赢。”

  《中国企业家》:现在大家都比较关注算力,其实数据高质量也很重要,如果数据质量比较低的话,算力再多最后也浪费了,你们在数据或者语料这一块怎么做的?

  王小川:语料做搜索公司尽可能把公开的语料或者以前收集到的语料用起来,质量怎么评价会做得更好一些。

  《中国企业家》:现在在搭建下一步团队的时候有什么样的标准?前两天听到说全世界的人都在挖OpenAI的人,但是没有人离开,还有大量的人才往OpenAI去。

  王小川:确实有距离,需要敬仰的一个状态,现在人才储备有两条路,一是把国内最好的都能够聚到一块,甚至有好的效能把它发挥出来;有机会再从硅谷摸到一点人或者认知。我4月底会去一次美国交流学习。

  《中国企业家》:你每天花在找人的时间多吗?

  王小川:三分之一,找到合适的人之后还要做沟通,三分之一的时间还要学习,每天新的技术、新的产品发布都需要时间去学习。

  《中国企业家》:你常说包袱变轻了,但好像压力变大了,怎么理解?

  王小川:现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要,它需要的东西不一样的。确实是压力变大了。现在有太多创业需要整理的人和事,这个精力是远远不够用的状态。