王小川官宣百川智能:AGI的终局是什么?
作者 | 董子博
“这131天,对我来说,就像过了好几年一样。”回忆起自ChatGPT诞生至今的日子,王小川如是说道。
大模型创业,自卷起大潮后,已经过去了数月之久,王慧文将“光年之外”落在搜狐大厦,李志飞回到出门问问双线作战,王长虎则给新公司定名“爱诗”招兵买马,贾扬清则在离开阿里后还百废待兴……
而王小川也没有闲着,在王慧文新办公室的楼下,小川召开了一个媒体沟通会,官宣了他的新厂牌——“百川智能”。会上,王小川身着一件橙红色的帽衫,不用PPT,只是在众人拥簇下侃侃而谈,有接近小川的人对雷峰网表示:“这几年他变化很大,松弛了不少,也幽默了不少。”
早在雷峰网之前的文章——《ChatGPT群雄逐鹿:陆奇屠龙,号令天下;小川不出,谁与争锋》——中就有提过,从学术号召力、工程能力、政商能力、意愿冲劲四个维度中,王小川都不落人后,综合实力一流。
到四月底,百川的团队将达到50人规模,“今年年底,对标ChatGPT3.5的模型就可以训练完成。”王小川如是说道。
近期,雷峰网和王小川有过一次对谈,对于生成式AI,乃至未来的AGI的可能形态、完成终局、创业者如何找准位置入局等问题,进行了深入的交流。
交流中,王小川提到,这两个月,关于未来AI大模型的打法和决策,在进行反复的思考和迭代,“基本算是把路径想清楚了”。
在搜狗的后期,王小川越发能感受到人员招募的艰难;而在ChatGPT之后,随着人们对于AI热情的高涨,王小川说,聚拢人才相比几年前更容易了,到这个月末,团队的规模就能扩充至50人,甚至还有人“带资进组”。
有消息称,百川的团队招揽了大量他在搜狗的旧部,一方面,他们更懂搜索和NLP,与大模型算是近水楼台;一方面更认同小川的价值观,更有目标感;一方面也更懂得如何和他合作,知道对方想要什么。
而对于团队,王小川的目标还不止于此,他对雷峰网表示,在厘清了现有团队的结构之后,马上还要奔赴美国“薅人”,颇有“周公吐哺,天下归心”之意。
在原先的文章中我们就有提到:王小川出身清华,并与清华大学联合创办了天工人工智能研究院,有很高的学术号召力。得道多助的小川背后,还有清华这间国内顶级高校的支持。
评价王小川的大模型创业,中国工程院院士、清华大学计算机系教授、王小川在清华的硕士导师郑纬民表示:“王小川敢于创新,敢于思考,具有丰富的系统工程经验……研究并行计算和相关的体系结构,是我所在的清华大学高性能计算研究所的重要工作,也有着丰富的经验,一定会全力配合与支持王小川。”
而中国科学院院士,清华大学人工智能研究院院长,王小川的博士导师,张钹也表示:“新创建的百川公司的团队很强,我相信他(王小川)能完成这个使命,并在未来的发展中给予全力支持。”
除郑纬民、张钹两位院士外,清华大学计算机系的尹霞、马少平、刘奕群等教授,也不乏对百川智能的溢美之词,纷纷表示将鼎力相助。
资金方面,王小川也表示,现有的资金状况可以放心,手中5000万美金的启动资金,已经可以支撑他当下的团队和算力成本。而大模型的从零到一,王小川估算,成本的规模大概在3-20亿美金。
从产品的角度上,王小川锐意进取,直言:就是要做中国最好的AI大模型。
如何做到最好?不少人盲目地迷信模型参数——参数越大,模型就越强。
但王小川并不同意这一点,他表示,盲目追求大参数,未免有些浮夸。当下,百川已经开始了参数量级在500亿左右的模型训练,而在年末对标GPT3.5的模型。
王小川对于AGI终局的几个核心认知
语言,是打开AGI大门的钥匙
20年后,王小川离开搜狗,豪言:“往后二十年,若能为生命科学和医学的发展尽一份力。”时间又过去两年,王小川将生命科学的盘子转托给杨洪涛,全情投入大模型创业。对于这一点,他心中难免有波澜。
要将生命科学的秘密摸清,20年太久,也太理想主义,王小川心里清楚,理想主义和现实需要平衡。早在数年前,谷歌开发的AlphaFold就实现了以蛋白质的基因序列,预测蛋白质的 3D 结构的功能。尽管功能还远称不上完善,但这让王小川看到了从AI到生命科学的“曲线救国”。
要做AI,王小川却没有选择从生命科学入手,相反,他选择了他更轻车熟路的语言。
为什么要从语言切入,王小川的思考,是从人的认识论开始的:通过语言,才能认识这个世界。
早有不少人问他,AGI这一波来势如此汹涌,机会也不止于大模型,为什么不做文生图、CV、智能驾驶这种技术路径更成熟的领域?
而王小川的立场却相当坚定,语言是知识、思考、沟通、乃至文化的载体,如果目标的是AGI这颗“皇冠上的明珠”,那么必须从语言入手——语言距离AGI,比图像和视觉都要更近。
而同时,语言也一直是王小川的优势所在。对雷峰网,王小川直言:“输入法是猜你想说啥,搜索引擎是猜你想要啥——而ChatGPT,则是将这两种需求进行了一站式的解决。”
大模型X大应用,缺一不可
借鉴过去微信、淘宝的“老路”,想要突围,除了有技术以外,关键还是得做出中国自己的杀手级应用。
这一点,王小川深有体会:搜狗的成就,并非体现在搜索引擎的技术本身;正是有了搜索引擎、输入法这两个爆款应用之后,搜狗的价值才真正被人看到。
而这也是王小川入局创业,便迅速积累了一批搜狗旧部的原因;想必这一次的创业,王小川的“三级火箭战略”指导思想和打造杀手级应用的经验也将再一次发挥价值。
“智能的终极,我们肯定永远都会追求。但我们和ChatGPT不一样的地方是,我们也关注,AI大模型落地的场景,是否是真实的;产品化的AI,是否真的用得着。”王小川这么表示道。
从输入法走向搜索,未来还要走向Chat,王小川认为,明天的王道,是“Chat+搜索”的“Chat Pro”形式。
“我认为,今天的OpenAI有点‘目空一切’,AI能力很强,但并没有进攻搜索领域;New Bing则是以搜索为核心,加上了ChatGPT的能力,但仍然不够纯粹。”
王小川认为,Chat只是一种体验的升级,也只是增强产品核心的一个能力。而真正落进实际的场景,应该面向专业的领域——比如健康、法律,并且要将这些专业领域整合到一起,做一个“大Chat”。
而要完成诸多领域的整合,做成AI时代的“超级APP”,背后一定是拥有强大能力的AI大模型的支持。
“陪伴X知识”——AI是如何做到信息普惠的?
王小川对雷峰网表示,上个时代的范式,可以被称作“连接X信息”。以谷歌为例,无论是门户网站、搜索、再到推荐,都是将知识用网络连接了起来。
在王小川看来,上个范式的连接分为三种——点到点的“Portal(传送门)式连接”,从关键词到海量相关信息的“搜索式连接”,从用户使用习惯到推荐内容的“推荐式连接”。
抖音就是把“推荐式连接”做到了极致,于是才成了移动互联网时代的王者之一。
而在今天AI大发展时代,王小川认为,新的范式应该被称作“陪伴X知识”,让表达和获取知识更加简单。
在这个范式下,Chat能力的“陪伴”作用能被发挥到最大——比如,在当下的医院,医生没法将全部精力给到每一个病人身上;在Chat能力的作用下,AI可以完成私人医生的作用,实现对病人一对一的陪护。
类似的场景,无论是老师,还是律师、医生,都可以用陪伴的方式,来完成知识的传递。
旧时王谢堂前燕,飞入寻常百姓家。有“陪伴X知识”体系的赋能,社会也将变得更加扁平,私人法律、医疗等等服务也将更加普惠。
生成式AI可能的两个终局
AI的To B生意,在今天早已是一片红海,甚至称得上是“死海”。
诚然,To B生意更能赚到稳定的营收,而如上所言,商业的决策绝不能是只为眼前一时的取舍。王小川认为,看AI的大方向,就要看到生成式AI的“终局”
纵观计算机发展的历史,从大型机到WorkStation,再到PC、手机,最终技术的简化路径,总是会落向个人。
“在服务业被机器取代之后,人就可以解放出来,可以做创新,做迈向宇宙的事情,把简单的服务交给机器人。”王小川如此说道。
他在他的朋友圈中也表示:“通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索“我是谁?”我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。”
对于百川智能的愿景,王小川对雷峰网表示,目前有几个:
首先,一定是要做中国最好的大模型,当下,百川智能的大模型正在按部就班地训练,争取可以在年底之前发布;
针对ChatGPT和同类产品“胡说八道”的幻觉问题,王小川意在使用过去搜狗在搜索赛道的积累,增加回答的准确性、细节和时效性;
在产品化落地的角度,增强大模型在教育、医疗等垂直领域的知识积累,让大模型能够及早在专业领域发光发热;
而这一切的终局,则是让大众能够轻松普惠地,获取知识和专业服务,以AI技术的演进推动社会生产力的提升与变革。