百川智能王小川:医疗是大模型皇冠上的明珠
我们现在处于什么时代?
百川智能创始人兼CEO王小川认为,我们已经从信息时代步入智能时代。而大模型是智能时代的基础设施,可以创造新的价值和伙伴关系,可以带来生产力的直接提升。
在大模型应用落地方面,王小川提到,医疗是大模型“皇冠上的明珠”,大模型有望做到院内、院外的全病程管理,并在预防、诊断、干预环节实现精准医疗。
在近日举办的2024全球数字经济大会人工智能专题论坛,王小川进行了分享。以下为王小川分享内容,经i黑马编辑:
今天整个中国社会,尤其是科技界,都处于一种既兴奋又焦虑的状态。
一方面,我们要跟美国卷模型,要投入十亿、百亿美金去做超级模型;另一方面,又在呼唤大模型落地应用的场景。大家担心,只做落地应用会错过未来,但只考虑未来又没有当下。
百川是去年4月成立的,今年1月份,朋友们给我发微信祝贺,说“2024年元旦快乐”。我回复的是,“智能纪元二年快乐”。
这句话的含义是什么?我们已经进入到一个全新的时代,到了智能时代。虽然现在还没有做到AGI。
我们很幸运,大家是从互联网时代走过来的,享受了互联网20年的高速发展,现在又见证和参与到了智能时代的发展。
01
通过语言,我们在接近智能
我想用一个关键词来表达对智能时代的中轴的理解,就是把语言转变成数学模型。
我们今天讲大模型LLM的时候,第一个关键词叫Scale,就是规模。从百亿参数到千亿参数到万亿参数,再到号称GPT5的百万亿级参数,数据规模上去之后就能带来智能。到最后变成,大家觉得投入多少钱进去,就能实现智能。同时我们也会欢呼,比如今年视频生成领域Sora的推出,是不是代表了未来的另一种智能。
这些其实都不是完整的答案。因为今天我们走通的人工智能路径,不是在Sora,而在语言。通过将语言变成数学模型之后,能够获得今天这样的人工智能。
很多人说,人和动物的区别,可能是人会语言。
比如图像识别很厉害、无人驾驶很厉害,我开玩笑讲,狗也会无人驾驶和图像识别。区别在于,语言是我们思考、沟通的载体,是文化和知识的载体。因此通过语言,我们在接近智能。今天这个范式体系并没有脱离掉语言,因此我们强调语言为中轴。这是在通用智能里的一个关键逻辑。
另一个关键词是能源。数据、算法、算力,大家都已经很清楚了,但今年上半年以来,提到更多的是能源问题。尤其是在国外,已经开始有可控核聚变,在为大规模的新模式部署做准备。如果说AGI或者人工智能再往下爆发,那算力背后的能源会构成一个大的短板。中国目前为止还没有开始探索这个问题,在电力方面还没有美国这种疯狂的想法。这也是中美大模型发展的区别之一。
02
大模型带来的是生产力的提升
有个知识管理框架叫DIKW模型,即Data Information Knowledge Wisdom。以前机器产生的是信息,这个时代的智能核心是产生知识。也就是说,大模型带来的不仅是信息的传递,而是能够产生knowledge,代表着对世界的认知。再往后发展,则可以产生智慧。
我们知道,在互联网时代,更多的是改变了生产关系。不管是淘宝、滴滴还有美团,都是通过互联网让更多的商家跟更多的用户连接在一起,提高供需匹配的效率。
但在智能时代,大模型带来的是生产力的直接提升。GPT是这个时代的第一个应用产品,未来我相信会有更多新的应用产生。
在信息时代,我们是用一种工具思维来使用计算机。现在,我们应该把大模型当成伙伴来思考。如果还是把大模型当成原来的计算器来对待,那它能够发挥的作用就太有限了。我们更应该把AI当作可以产生陪伴和服务的伙伴。我预测,在未来两三年,我们可以走出这种工具思维,并且让AI变得像人类一样具备服务能力和陪伴能力。
这种情况下,目前的探索方向,一是赋能千行百业,也就是对生产力的提升。另外还有两个领域:智能助理和虚拟世界。
在个人领域,这种智能助理之前其实做得不太好。目前来讲,Perplexity在智能助理领域应该算是不错的,通过对于搜索的总结,可以提供更好的知识的呈现。GPT4O更多代表的是一种交互模式的革新,是以人的方式来跟用户沟通。我认为,未来智能助理会有新的To C产品形态产生,而不只是在原来的电商、游戏以及其他领域再重做一遍。
在虚拟世界,随着技术的进步,未来3到5年,我们预见到人工智能将在虚拟世界的多个方面扮演更重要的角色,特别是在娱乐游戏行业。随着虚拟世界的发展,它将为全球经济带来新的动力和变革。我们认为,这将是一个从生产关系向生产力转变的过程,最终将实现对虚拟世界的赋能。
目前,我们已经讨论了许多概念,包括搜索增强、多模态、智能体等,这些都是当下提升大模型能力的主要技术路线。这些技术的发展可能会在未来引发一场变革性的力量。
03
强化学习让大模型具备思考能力
在语言和规模之外,大模型还有一个发展思路是强化学习。OpenAI曾提到,他们的模型可以在某些地方实现超越,包括在18个月之后让大模型达到博士生的能力。这不是在当下这个范式中能够解决的,以目前的范式解决问题来讲,大模型能达到高中生的水平就不错了,所以只能做辅助工作。
但未来会有新的一种范式出现,这是值得大家期待和关注的。这种范式的核心是,用强化学习来改变今天的模型设置。广义上来讲,这就像之前大家熟悉的AlphaGo,专门下围棋的人工智能。AlphaGo跟大模型走了两条相反的道路。大模是数据越多越好,有多少数据就可以带来多少智能。而AlphaGo的第一版本是结合了数百万人类围棋专家的棋谱。但是到AlphaGoZero之后,就不需要人类的棋谱了,不用数据反而变得更加智能。
今天大模型只能解决快思考的问题,其实不具备慢思考的能力。所以大家提到AI超越人类,还需要很长一段时间来通过强化学习产生慢思考。用孔子提倡的学习方法来讲,大模型是“学而不思则罔”,学了很多东西,但是不会思考,并不是特别智能;AlphaGo则是“思而不学则殆”,只在一个领域钻研得很深。因此,将学习和思考系统进行结合,才可能实现智能时代最终的爆发。我们现在掌握的两种技术,还没有融合在一起,这是我对未来的一些基本判断。国内有高校在做这方面的探索,我们甚至预言美国已经在这方面实现了突破。
随着我们自己的实践,我们强调如何平衡理想与现实之间的关系。追求“诗和远方”就是去追赶OpenAI,但没有落地场景。如果去做落地场景,则有可能走不到了大模型的远方,丢掉了“慢思考”,丢掉了大模型所代表的通用智能的可能性。
因此,针对当前中国的情况,包括芯片能力、人才储备和市场环境,我们提出了一种逻辑,即“理想上慢一步,落地上快三步”。也就是说,理想上我们不是不跟,而是通过他们验证之后来确保我们的方向。我们的首要任务是打开落地场景,同时确保我们不会失去对大模型终极理想的追求。因此,我们的目标是既要发展超级模型,也要发展超级应用。所以我们在赋能千行百业时,选择这些知识密度特别高,真的需要千亿模型、万亿模型的场景,然后我们把它降到百亿,这是百川的定位。
百川去年整体发展很快,成为第一批获得工信部备案的八家大模型公司之一,也是唯一一家当年成立的公司。在今年5月,百川推出最新一代基座大模型Baichuan 4,并同期推出首款AI助手“百小应”。
04
医疗是大模型皇冠上的明珠
百川在落地场景上选择的是医疗领域。医疗是大模型皇冠上的明珠。反向传播之父Geoffrey Hinton强调,医疗将是最重要的AI应用领域之一,将发挥AI的最大潜力。大模型对于知识的掌握,对经验的掌握,大模型的多模态能力、记忆能力、思考能力,大模型减少幻觉、沟通共情的能力,所有这些在医疗领域都能够用到。甚至是模型做得越好,医疗就能越发达。
目前在医疗领域比较成功的是互联网医院,包括好大夫等,需要依靠现有的医生,其实还是对生产关系的改变。因为医生供给是不足的,提升医生供给就是一个重大的机会,所以医疗行业叫做“得医生者得天下”。
同时,我们也对AI医疗进行了等级划分,从L0到L5,这一分级类似于无人驾驶。
L0就是传统医疗,没有AI介入。
L1是依靠单一功能的机器辅助,在单点上可以给出建议。
L2是多模态辅助,AI可以整合病历、影像等多种数据提供信息。
L3是条件自动化诊疗,类似于现在的自动驾驶,已经可以完全取代司机开车,但在关键时刻还需要司机的确认。我们的目标是,在今年到明年,做到L3的水平,让AI给医生做助理,也能为消费者提供后期的健康顾问,但关键决策需要医生确认。
L4就需要AGI的水平了。AGI的能力可以造出医生来,完全像医生一样工作,就是一个通用的人工智能。
L5是完全自动化健康管理,可以超越AGI,从预防、诊断到治疗,可以管理患者的全部健康旅程。到这个时候,我们开始从语言模型走向生命模型,对生命做解码,做到超越医生的水平。
在这个过程中,我们落地了两件事情。一是在前期做全病程的管理,二是在此基础上做精准医疗。
现在医生资源远远不够,不可能有医生一直陪着患者。大模型可以在院内做医生助理,在院外做健康顾问,能做全病程的管理。在这个过程中,大模型可以患者进行尽可能多的数据收集,这对医生来说也就像临床实验一样。因为医生不仅是临床工作者,也是科研工作者,他们需要把自己的观察和经验总结出来,写成论文,变成知识。每个医生的精力是有限的,在中国一个医生一辈子可能只能为3万个患者做诊断。大模型能够快速地迭代学习,可以为每个患者单独建模,最终走向精准医疗,让预防、诊断、干预都达到新的高度。
对于未来,百川一方面是继续攻坚,以语言为中心去突破模型规模,做出超级模型。同时,我们在医疗上做很多增强,期待通过AIGC的方式去达到AGI,并在此过程当中提高医疗的相关服务。