医疗大模型十人谈 大模型背景下 对话京东健康 互联网医疗的商业化还是难题吗
“一款理想的医疗大模型是解决医疗不可能三角,创造生产力价值。”
近日,在《医健AI掘金志》对话京东健康技术产品部智能算法部负责人王国鑫,他指出,医疗绝对供给量不足是造成医疗“不可能”三角--成本、质量、可及性的根本原因。但在这一冰层下,还隐藏着医疗结构性供给不足的问题。
过去分级诊疗曾是解决这一问题的主要手段,通过将大量常见病、多发病、慢性病的病人,从三级医疗机构中、从专家手中,转移到基层医疗机构的全科医生手中。
尽管不少区域已通过医联体或医共体的方式推动分级诊疗,但分诊的重点仍在于“分”,而非“诊”,被视为一种简单的“浅层创新”。
在如今的AI大模型技术红利下,京东健康尝试用先进的AI技术协助医生和患者,为创造出增量的医疗产业生产力提供一种新的解决路径。
这就是前不久京东健康发布的面向医疗健康行业的“京医千询”大模型。王国鑫介绍,该大模型可快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,为远程医疗服务换上新的“技术底座”。
今年5月底,医联率先推出首个国内医疗大模型MedGPT。6月底,叮当健康发布叮当HealthGPT,基于此研发应用型医药AI产品——叮当药师、营养师AI助手。此外,润达医疗,卫宁健康、科大讯飞、创业慧康、朗玛信息等公司也在积极布局。
越来越多的医疗健康领域企业意识到,强大的语言理解能力、生成能力、逻辑推理能力,将让大模型在互联网医疗领域大有可为。
“不过,这要看哪家企业能够率先打造出一个杀手级应用走向正循环。”王国鑫表示。
首先,相比于一些企业只选择与三甲医院医生合作进行产品研发测试优化,截至7月中旬,已经有178家科研医疗机构、26家药企、69家企业客户,以及超过4.3万名医生,直接或间接参与了京医千询大模型的应用建设。
其次,京东健康建设了行业内首个实物与服务相联通、知识与数据相融合的百万级大规模健康知识图谱,沉淀了超过亿级的覆盖线上、线下医患场景的高质量健康档案,并拥有海量的医药全域流通大数据。而这些则是打造一款“杀手级”应用的天然试验场。
不过,大模型在互联网医疗领域的落地仍然任重道远。
王国鑫指出,“大模型将来要面对的几亿消费者,充当他们的健康助手。但京医千询目前的推理速度还有较大的提升空间。”
因此,京东健康如何运用这一创新服务模式,推动医疗服务的常态化、医疗资源的可及性,将是后续的重要命题。
以下为《医健AI掘金志》与王国鑫的对话内容,《医健AI掘金志》做了不改变原意的编辑与整理。
《医健AI掘金志》:京东基于“言犀”大模型,研发了医疗大模型“京医千询”,这一模型上有哪些亮眼能力可以分享?
王国鑫:互联网医疗发展历程中,技术能力是服务的关键支撑,而“京医千询”大模型是我们医疗数智化技术的一次集中体现。
它利用了京东健康超亿级的高质量医患对话数据、大规模的医疗知识图谱,以及公开资料如临床实践指南、最新的医学文献和专家知识等,最终涌现出三种能力:覆盖全流程的医疗需求,具备智能决策,支持多模态的医疗信息处理。
值得关注的是,京东健康并未只将医疗大模型作为针对某一类受众或用户的单一产品,而是将其作为新一代医疗健康服务生态建设的“技术底座”,推动全行业解决方案和产品的智能化升级,尽可能发挥新技术的价值能量。
首先,在服务医生方面,基于京医千询形成的“智能助理”工具,可以协助医生完成诊疗风险识别、临床辅助决策、影像辅助决策、患者辅助筛查、智能辅助审方等操作,帮助医生生成语音电子病历、进行智能随访,提供动态医嘱、专病管理、教学培训等内容,从而提高工作效率,提升诊疗准确率。
第二,针对个人用户,基于京医千询大模型的“AI健康管家”,能将用户基础状态、饮食运动、生理信号等全时空健康数据,进行整合分析,提供健康方案定制、管理执行的闭环解决方案。
这不仅可以在用户生病的时候提供帮助,还能在日常生活中提供在线咨询、用药指导、情感陪伴、健康自测、饮食营养管理、健康行为干预等服务。
第三,对于医疗机构和企业客户,京医千询能够协助医疗机构和企业客户进行远程诊疗服务调度、商保理赔、药品流转追溯、硬件服务体验提升、企业健康管理优化等,从而帮助实现医疗资源高质量供给的提升。
第四,在科研领域,京医千询还可以进行辅助新药挖掘、医疗大数据科研、标准化病历质控、医疗专病分析、智能硬件反馈评估。
《医健AI掘金志》:你在介绍京医千询大模型时用了三个词:覆盖全医疗流程、智能决策、多模态。单拎出来任意一个都很有挑战,你们为何决定一次性全解决了?
王国鑫:从一开始做大模型时,我们就坚持一种想法,要先定义好大模型的能力再做技术开发。
因为京东健康中是有非常多的应用场景,而且很多场景早已广泛使用了各类AI技术。所以与其说我们要做一个具有什么能力的大模型,还不如反过来问,我们都有哪些不得不做的能力,才能够覆盖京东健康已有的应用场景。
所以第一个词“全流程”就自然产生。也就是说,无论to C、to B、to G、to H,其需求一定是医疗全流程“防筛诊治康”中的一环,必须用最新的大模型技术替代掉原有碎片化的中小型技术。
第二个词“智能决策”从何而来?
它确实是大模型带来的核心想象力,在决策机制上降低对人的依赖,显著提高用户的收益增速度。
而且大模型之于医生绝对不仅仅是一个问答和对话的陪伴角色,最重要的是帮助医生完成任务,提供决策的能力。
第三个词,多模态。
这是医疗行业的刚需。目前最常见的多模态技术是医学影像学,如CT可以提供高分辨率的结构图像,MRI可以提供更详细的软组织信息,PET可以提供代谢信息。医生可以将这些信息综合起来,制定更准确的治疗方案。
但未来大模型必须能够支持医疗场景下的多模态输入和输出,它至少得懂各种医学资料,比如体验报告、化验单、以及终端可穿戴设备的监测数据,从而精准判断病情。
总的来说,这三种能力是今天医疗大模型能良好落地的技术前提。
《医健AI掘金志》:你们大概什么时间决定做一款医疗垂直大模型,也就是说何时开始将言犀大模型往医疗场景迁移、验证和应用的?
王国鑫:言犀是京东的通用大模型,代表了京东最底层的技术能力。但我们并非在ChatGPT出来后才去布局,而是京东探索研究院过去几年一直在做的工作。比如2021年,探索院就推出了“织女”模型并问鼎GLUE榜单,它可以看作言犀大模型的前身。
但我们真正决定试验大模型的应用能力是从今年1月开始。直到今年7月,京东在JDD大会上推出言犀大模型和京医千询医疗大模型,并进一步建设面向产业应用的技术生态。
我觉得从技术上讲是这么一个过程,所以很难回答大模型相关技术研发的起点。如果没有之前的沉淀和积累,特别是行业人才稀缺的情况下,很难在半年之内打造一个千亿级,面向产业应用的模型。
第二个问题,我们医疗场景的迁移这件事情,跟刚才的问题是一致的,并不是现在才迁移。
京东健康的技术产品体系本身就有大量的医学自然语言工作任务,只是之前基于织女模型去开展工作,今年做了模型升级,就在言犀大模型继续开展工作。
《医健AI掘金志》:从通用大模型到产业大模型,半年时间里你们的主要工作是什么?
王国鑫:时间都去哪了,这是大家是非常关心的问题。首先可以明确一点,决定走大模型路线后,我们反而在技术路线的选择上少了很多纠结。
比如说,自然语言行业有两个核心,一个是自然语言理解,一个是自然语言生成。但是“理解”是可以用“生成”的技术去实现,所以以前我们在选择技术路线时,会考虑两种技术路线怎么选择。
但ChatGPT的出现对我们最大的启发是“技术路线的再确定”。因为不论“理解”面临多少困难,或者“生成”面临多少困难,都要用大模型技术去做,这一共识是ChatGPT给予我们最大的帮助。
明确路线后,我们也遇到了大模型会带来的必然问题--幻觉。
所谓“幻觉”,指的是人工智能模型生成的内容,不是基于任何现实世界的数据,而是大模型自己想象的产物。
从技术原理来看,这些虚假信息语言模型是无意识的模仿者,并不理解自身在说什么,但是,以ChatGPT等为代表的大语言模型的“幻觉”,不仅会让人类在海量信息中难分真假,还会对患者的生命安全、医生工作带来威胁。
所以从今年1月到6月,我们跟言犀模型团队在一起,回答的一个核心问题是:如何在“有用”和“安全”两者中做好平衡。
实际上,医疗场景的特殊性就在于对有用和安全的追求都达到了最高水平。
如果一味追求安全,大模型可以说“您这个问题我没有办法回答,需要咨询你的医生。”
反之一味追求有用,大模型就要提供相对全面的信息。而对于生成模型来说,提供越全面的信息,就意味着它出错的概率越高。就像上台演讲,演讲的时间越长,说话打磕巴的概率就越高。因此,我们提出了一种对抗AI“幻觉”的新策略。
另外,我们较早的时候就意识到言犀是一个大语言模型,但要应用在医疗场景中需要明确:大模型自身的能力边界、何种条件下需要借助外部的业务系统、哪些场景无需大模型发挥作用及部分作用。
比如,医生希望大模型分析一下当天所有问诊情况,这种情况就需要访问外部业务系统,即用Agent技术来实现大模型对各种工具的串联和调度。
《医健AI掘金志》:为了打造京医千询大模型,团队内部做了哪些分工?
王国鑫:首先,算法团队毋庸讳言,团队中凡是有自然语言技术背景的同事基本都全员参与;其次,具有医疗背景的同事,也是最核心的团队成员之一。
因为生成模型有一个难点:对于相对复杂的问题、超过个人认知和学识的问题,我们往往无法判断正误。
这个问题可以类比于,我们做了一个小语言比如阿拉伯语的翻译模型,绝大部分人对翻译的好坏是无法评价的,必须要懂这个语种的人才行。
因此,我们根据京东健康的核心服务场景--互联网医院、零售药房、京东家医服务,把医疗团队划分为三种角色:医生、药师、健康管理师。而且我们在医疗专业团队建设上的投入,并不比算法团队少。
与此同时,我们还吸引了一批专业人员。他们主要是评估大模型专业能力之外的“能力”,比如模型是否能第一时间给出内容、是否符合用户需求,或是否能够易于理解等。
《医健AI掘金志》:立项、迁移、验证、应用、到开放生态,过程中最有挑战的是哪一部分?
王国鑫:都很有挑战,如果非要选一个话,我认为“验证”最难。
举个例子,当大模型的安全性下降,幻觉提升,我们就要和医学专家一起去“诊断”,是否模型之前使用的数据出现问题、还是迭代策略失误,还是存在其他问题?
实际上,我们团队里有很多PhD,还有MD,不少人还具有医学和算法的双重背景。即便在这种情况下,我们在做医疗大模型时仍会感觉交叉人才的缺乏。而且大模型每次迭代,医学专家有他们的意见,算法专家也有他们的意见,还会彼此产生质疑。这些复杂评测和验证过程需要大量细致的分析,因此占用了大量时间和资源。
我不敢说“验证”是所有垂直行业都存在的难题,但至少在医疗行业是一个挺难逾越的鸿沟。这其实并不稀奇,例如医学影像AI公司最难的环节也在于确立核心数据的金标准,以及医生与研发人员的配合。
《医健AI掘金志》:在搭建京医千询的过程中,京东健康过去积累的哪些能力得到发挥?
王国鑫:相比于其他大模型的推出时间,我们推出时间不算早,但我们在落地上的进展很快。有两个原因:
一是医疗行业本身虽然技术验证周期长,但对新技术的探索机制非常强,使得我们在医学场景的适配速度相对较快。
比如传感技术、人工智能技术、机器人技术、纳米技术、基因技术等,几乎都是早期阶段就在医上尝试,创造出新的应用场景,如医疗传感、医学成像、智能诊断、人机交互、远程医疗和个性化医疗。
二是京东健康过去在医疗健康服务领域的持续投入,建立了良好的验证场景,而且基于真实医疗场景下构建出一套知识体系,这是我们的大模型快速迁移的基础资源。
比如过去为了全面保障患者用药安全,我们早在几年前就构建了药学的知识库,如今基于此我们能够很快速且有效地构建不同药品之间的作用关系,解决药学大模型中的“幻觉”问题。此外过去建立起的处方审核能力,如今也能让我们更好地识别问诊对话中的关键信息。
《医健AI掘金志》:你们为何将“远程医疗”这个点放大,“大模型+互联网医疗”有哪些优劣势?
王国鑫:远程医疗是京东健康对医疗行业结构性供给不足的一种解法。
大家都知道医疗有一个“不可能”三角,即成本、质量、可及性很难同时满足,各国只能优先保证其中两个,美国优先的是可及性和质量,中国优先的是可及性和成本。所以是先解决看病难、看病贵,再进一步深入到看病好,水平高。
但在基层医疗机构中医疗的“可及性”还没被满足,存在医疗资源绝对供给不足的问题。它很用各种技术问题去解决,而是一个社会学问题或国家政策层面的问题。
但在绝对供给不足的冰层下,还隐含着大量医疗结构性供给不足的问题。
作为一家技术公司,通过远程医疗来解决医疗供给的结构性不足是我们的核心战略。而且远程医疗不是单纯的医疗服务项目,而是用信息技术下沉优质医疗资源的方法,提升区域医疗水平的均等化水平,解决医疗资源总量不足、分布不均衡的难题。
其次是改善就医质量。
很多人都有感受,远程医疗和线下面诊有一种体验鸿沟。这对医生来讲也还是一样的。所以我们今天希望用大模型为表的AI技术,去尽可能填补这一鸿沟,用我们自己内部有一句话叫“实现线上线下的医疗同质化”。
《医健AI掘金志》:互联网医疗行业长期以来都是卖药盈利,长期以来医疗AI产品未被纳入医院诊疗收费项目名录,院方不愿意付费。那么用上了大模型的“互联网医疗”,能够更好地商业化吗?
王国鑫:商业化很多时候都不是问题。医疗行业虽然在每个国家都不太一样,但终归都是一种很特殊的行业。最终能否商业化本身要回归到一个问题上:这项技术是否为整个医疗场景创造了价值?
如果一个患者从疾病状态走到康复状态,而且我们能在某一个点上证明AI的价值,那么商业化就不是问题。
医疗AI产品在过去很长一段时间基本是两种商业路径:
一种是成为医生或医院的生产力工具,它的付费方就从患者“转移”到了医院或者医生本身,进入医院的收费名录。即院方付费,但很多医院在实际购买时动力不足。
第二种是诊疗效果被医生和患者认可,最终由患者付费。这是过去很长一段时间数字疗法等技术不断追求的目标。
而我们今天谈的大模型技术,有可能会带来新的商业模式。
比如大模型支持下的健康管理解决方案,实际上是要打通院内院外,用户离开医院还能持续获得医疗服务。那未来或许会看到,以大模型技术为代表的AI技术产品能突破原有的商业思路,带来新的商业路径。
《医健AI掘金志》:在医疗大模型的路上,华为的算力基础设施、以及终端硬件,广受业界青睐。你们为何选择华为的硬件,将来还有哪些合作?下一阶段,京东健康还有哪些规划和升级?
王国鑫:站在我的角度去讲,京东健康和华为的合作是两方面的。
一个是同华为等公司合作构建国内的底层技术生态。这件事情可以认为我们这一代技术人的使命,因为我们都不太希望国际上存在技术断链的情况,也期待实现全球价值自由的流动。
另一方面,我们会和华为的产品结合。华为有较好的硬件生态,消费电子产品在国内有举足轻重的地位,京东健康则是一个有医疗健康全场景的服务商,我们两者的合作能够为消费者提供长周期的健康管理能力,这件事情本身在业务合作上很顺畅。
京医千询大模型下一步的核心工作是验证它在部分场景上的安全性、提高推理速度、降低资源消耗。
安全不用多说。做大模型的团队都知道,最后拼的一定是推理速度和成本。如果将来想完完全全面对几亿消费者,提供健康助手的能力,以我们现在的推理速度和成本还有较大的提升空间。
同时也要快速优化我们的底层技术,资源消耗进一步降低,为下一阶段全面开放使用做准备。
《医健AI掘金志》:大模型可能应用场景覆盖诊前、诊中、诊后多个环节,但临床设想距离落地仍有一定差距。所以医疗领域的大模型之争,将按照什么逻辑演化?
王国鑫:我个人观点,今天医疗领域的大模型在比拼,最后拼的是谁能更快走向正循环。
什么叫做正循环?正循环的核心起点是有一个杀手级别的应用(killer app),你要在这个killer APP上不断创造价值。反过来用户还能够打磨你的技术,增强killer app。这是整个产业生态,也是这一代AI技术所不得不面临的核心问题。
走向正循环有五个前提:一,基座竞争,这是一个永恒话题,大家都把它比作“杀手锏”;二,高质量数据的竞争;三,验证能力的竞争;四,推理能力的竞争;五,AI Native的“杀手型”应用。这种产品洞察能力是整个市场所期待的,也是我们实际工作中需要进一步加强的。
原创文章,未经授权禁止转载。详情见 转载须知 。