知识图谱与智能诊断这是最全的解读关于医疗大脑 (知识图谱与智能运用)

文章编号：36487 资讯动态 2024-11-30 智能诊断医疗大脑康夫子知识图谱

关于医疗大脑、知识图谱与智能诊断，这是最全的解读 | 雷锋网公开课

雷锋网按：本文整理自康夫子创始人张超在雷锋网硬创公开课上的演讲，主题为“智能诊断与医疗大脑”。

张超：康夫子创始人，前百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人；知识图谱、实体建模方面专家；毕业于电子科技大学计算数学专业、新加坡国大多媒体搜索实验室研究助理。

以下为公开课内容：

雷锋网：简单介绍一下康夫子所做的事。

张超： 让计算机去阅读医疗文献，构建知识库，赋予这些知识库一些推理能力，最后达到辅助医生、患者的目的。

在产品维度，分为面向患者和医生；医生端分为全科与专科医生。它们的底层是相似的，都是知识图谱加推理，不过上层应用有差别。患者偏重逻辑问答，包括患者语言的理解；全科医生要求知识面，而专科则要求临床路径监控，包括医嘱的下达。

现在我们的产品主要用在医疗机构这样的B端，主要提供医学辅助，不做诊断，结论由医生把关，供患者参考。

雷锋网：医疗大脑包括什么，可以具体解释下吗？

张超： 医疗大脑是个比较笼统的称呼，简单来说是一种知识库，加上基于此的逻辑推理和计算。它可以泛指医疗从业人员的智慧总和。具体点说，它具备诊断、治疗的能力，可以独立提供用药辅助、分诊导诊、健康咨询等服务，也可以高质量的辅助医疗从业人员完成某项工作。

对我们的医疗大脑来讲，患者医疗健康行为需要的能力、所有医生行医过程中的知识辅助能力我们都会着力去构建打造。

雷锋网：相比百度的医疗大脑和IBM Watson，康夫子的特别和区别是什么？

IBM Watson目前重点在肿瘤领域针对医生提供辅助决策功能。区别是，我们：

我们和Watson的场景和方法不太一样，它大的框架是问答、搜索的框架，同时融入了多种Feature（如知识图谱）。我们整个医疗决策系统是基于知识图谱做推理。技术上讲，对肿瘤这样的疑难杂症，Watson诊断用的维度非常高，但常见病的维度没那么高。这两个方面带来的挑战不一样，我们是从常见病入手，把服务的范围也会扩大。

我们的医疗大脑和百度医疗大脑在某些方面有着相同之处，都致力于辅助网民提供医疗信息服务。差别是：

雷锋网：目前国内做智能诊断的现状是怎么样的？

从时间上分，有传统派和新兴派。传统派是指类似决策树专家系统，知识库依靠专家构建，诊断逻辑也基于专家书写的roadmap等等。新兴派是指利用AI技术，利用计算机从海量文献数据中构建知识图谱，并根据历史经验自动学习诊断逻辑。

从类型上分，有基于文本从症状、化验入手做智能诊断的，也有基于图像从CT图片入手做智能诊断的。

传统派的诊断系统，受限于知识库的规模和复杂的医学逻辑表示，疾病的覆盖率和诊断的准确率都不够高。新兴派在这块整体上要好于传统派，但由于研发时间短，目前仍无法达到可用状态。

整体上智能诊断还处于初期，目前没有可以实现大规模商用。

雷锋网：智能诊断最重要的技术挑战又是哪些？非技术上的挑战呢？

技术上，我们现阶段认为智能诊断的底层核心是知识图谱，诊断的过程是基于知识图谱实现的推理过程。知识图谱的规模从根本上决定了智能诊断的瓶颈。另外就是应用上的挑战，智能诊断不管服务谁，在应用场景上有很大的差别，要有针对性地提升效果。

在非技术上，重点要让老百姓及医疗机构认可或理解这套诊断逻辑。

雷锋网：做好智能诊断的标准主要是哪些？应该包括哪些主要内容？

笼统地说，好的标准要靠效果说话，也就是说：

如果智能诊断用来服务患者：

对康夫子来讲，数据主要来自如下三大方面：

前两部分数据用来构建知识图谱，训练诊断逻辑。互联网数据主要用来做患者语言理解，患者可能会有一些不标准的描述，比如“感觉身体被掏空”，这些词在医学上没有对应的匹配，需要计算去理解。

雷锋网：有的医学文献，经验证是与事实存在偏倚的，有的甚至是错误的，这个问题怎么看？

错误是肯定有的，但我们在整个过程中要想办法降低并消除这种错误。大概有如下思路：

雷锋网：数据训练上，是否与影像诊断一样，存在优质数据获取和数据标注上的障碍？

医学AI相对于其它领域来讲有着天然的数据优势。大量的病例数据/影像数据就是很好的训练数据。

这里面的难点在于数据的获取、预处理、结构化和建模。另外，目前能看到的病历数据很复杂，多数做AI诊断的，很少有团队用门诊病历，多数用的都是住院病历，而住院病历是很复杂的，如果服务于C端用户，这类数据就不太合适了。

个人认为，智能医生或者影像解读，现阶段都有着充足的数据供训练。比如，在病例或者文献上，医生在无结构化文本种已经变相做了标注，如：“大叶性肺炎通常表现为咳铁锈色痰”，一个医学影像也有专家解读成文本信息供使用。数据维度难在从这些大量的数据中提取出优质数据。

雷锋网：如果说医学上只要有充分的多维度知识，就能在辅助决策上做一些事，那之前智能诊断不算流行的原因是哪些？是否是有哪些技术上的进步？

我认为主要在于2个层面：

在技术上，悲观来看近几年没有多少进步。只是前些年，人工智能和自然语言处理多在大公司和研究院使用，而现在有很多优秀人才流入到创业公司。

雷锋网：目前较为火热的深度学习，用处不算太大？

深度学习目前在NLP领域取得的成绩，比不上在多媒体领域取得的成绩。康夫子目前主要基于深度学习做一些患者语言理解方面的工作，不排除未来会拓展到更多的场景中去。

至于将深度学习用于Clinical Decision Support这样的专业领域，我觉得现阶段不太合适。首先深度学习是个黑盒，让人感觉不可信，这是心理上的问题。在应用方法上也有很大难度，比如训练数据并非完全准确，包括格式都有误差。我认为短期内这是一个不断研究的方向，但不能立马产生效果。

雷锋网：对于医疗信息知识图谱，可以具体解释下吗，具体指什么以及作用如何？

通俗地讲，知识图谱就是结构化知识，它由实体及实体关系组成。

比如在医疗领域，实体维度包括疾病、症状、检查、检验、体征、药品等等医学名词，甚至医生、科室、医院也可以纳入范畴。关系是指实体间的关系，比如，针对疾病和症状，关系可有“包含关系”，“不包含关系”，甚至“金标准关系”（比如，所有炎症都会带来发热，这就是金标准）。疾病和医生可以定义“医生擅长治疗疾病”，医生和医院可以定义“归属于关系”等等。这些都是知识图谱的构成。

我们在应用时，需要基于这些关系做推理，进而满足上层应用，同时上层应用的需求也会指导知识图谱的建设方向。比如，我们想帮助患者推荐医生，那么推理路径大概分为：根据“症状与疾病”的关系推测患者可能疾病，根据疾病和医生的关系，为患者推荐医生。

雷锋网：公司构建的知识图谱与医生的知识结构之间差异大吗？

首先知识图谱的知识结构是专业人（医生）定义出来的。医生觉得，在诊疗过程中，我需要用到什么知识，那么就让计算机去学习并构造这些知识。

医生的知识结构可以举一反三、演绎归纳，但现有的知识图谱只能机械的做一些事，并且在短时间内该部分技术很难取得较大突破。那么在这种场景下，知识图谱的积累和构建速度就显得尤为重要，同时真实的应用场景不断给知识图谱提需求，那么二者之间的差异也会逐渐缩小。机器是按照人制定的逻辑工作，而人是有联想能力的。

雷锋网：知识图谱构建上有哪些经验可以分享？

我从2010年加入百度，大部分精力在从事信息抽取类工作，从中也积累了大量的实战经验。在信息抽取（知识图谱建设）上，我们的着眼点依次是：

在这样的标准下，我们比较推荐简单粗暴可控的框架，即基于模板的抽取。这类方法简洁可控，容易冷启动，准确率可控，通用性也不错。不足是：模板产生困难、覆盖率不高，而且容易产生语义漂移，需要做边界控制，最后是计算复杂度高。这是目前这种计算框架的优劣。

在构建中，我们首先攻克计算性能问题，即在做pattern learning时，如何做快速计算、筛选，给每个pattern打分，这是计算性能问题。

然后我们通过pattern协作，搞定便捷控制和语义漂移。最后是把大量的精力放在pattern learning上，同时加大数据量提升覆盖率，并引入bootstrapping机制提升召回。这是我们认为当前比较好的解决方案。

目前也有一些基于pattern做的解决方案，但往往偏人工，不成体系，通用性也较差。

另外，我们主要做从无结构化文本抽取，一些类似HTML的半结构化数据比较容易，但是有深度的知识覆盖面很少。这块有不少工作，有兴趣的话，也可以经常关注一些IE方面的论文，有很多新奇的想法。

雷锋网：康夫子可以做到知识规律的自动发现，这个是如何做到的？

这里的知识规律发现其实就是上文说的pattern learning。人们是按照一定书写方式来描述知识的，数据量越大越能体现出书写的语法及结构。康夫子的一个核心技术即针对要抽取的知识从海量文本中学习这种知识的描述方式。

关于医疗大脑、知识图谱与智能诊断，这是最全的解读 | 雷锋网公开课

上图是计算机阅读海量文献，针对某种知识总结出上万条书写规律然后进行抽取。如针对“疾病<—>症状”的关系，文献中描述方式为：“（X疾病）的症状有（Y症状）”，“（X疾病）临床表现为（Y症状）”，“（X疾病）容易引起（Y症状）等不适症状”等等。

在技术维度，较多层面是我们原创的技术，我们定义一个好的规律，既要体现出不同文本之间的区分性，又要能够尽可能的匹配到相似文本，另外还要追求量和简洁性。在这个目标约束下，剩下的就是求解优化的问题了。

雷锋网：智能诊断中的逻辑推荐可以具体解释下吗？具体的挑战是什么？

这个是智能诊断和医生诊断最为根本差异的地方。

我们认为，当输入数据一样时，机器是可以完全比人做的好。比如，给定相同的若干组症状、若干辅助检查数据，机器诊断是可以轻松超过人的，因为这时候诊断的过程本质上是个搜索的问题，人脑的计算量和记忆程度在特定任务下是比不过机器的。

但是，医生的优势在于，不可思议的联想能力，可以帮助他更好地获取对诊断有用的数据。还是针对上面症状+检查数据，当医生诊断不确信时，他可以从病理或者历史经验去联想新的数据特征，进而辅助诊断。而对于机器来讲，联想能力基本为零。

所以说，逻辑这块是机器智能诊断的一个重要攻克方向：

雷锋网：康夫子的产品投入应用后，有没有不满意的方面？

如果让我们给我们自己的产品打分，100分是非常满意，应用效果等同于所有科室的专家诊断总和，我们现阶段只能打到40分，而同时市面上其它类似产品很少能超过30分。

这里的不及格除了在知识图谱维度还不够完善，另外就是这个产品目前还只能按照既定方式去完成某些任务，而在真实的诊断场景中，“知识联想、理解用户”是非常重要的环节。

当然，现阶段康夫子智能诊断还比较年轻，我们花了不到半年的时间已取得非常不错的效果，也正是因为各种不满意才促使我们的系统更加迅速的迭代。

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/ae912d80d176d4becf79.html

上一篇：翻山越岭老年人看病不再平安健康推出陪伴式

下一篇：为何成为一门好生意家用呼吸机为什么成为

春鹏商贸（天津）有限公司

电影视频 2024-09-15 01:09:05

深圳收债公司

深圳最正规的收债公司不成功不收费！合法清债、追债、收债，收债公司收费标准，深圳清账怎么收费，收数公司那里有？债权转让一站式服务。奥巴商务

商业服务 2024-07-03 22:01:49

百度AI开放平台

百度AI开放平台提供全球领先的语音、图像、NLP等多项人工智能技术，开放对话式人工智能系统、智能驾驶系统两大行业生态，共享AI领域最新的应用场景和解决方案，帮您提升竞争力，开创未来。

电影视频 2024-08-17 00:48:31

-本地生活团购Saas小程序解决方案服务商

本地生活SaaaS头部服务商,产品包含微信小程序,抖音小程序,支付宝小程序,各大平台团购小程序,帮助你快速抢占市场流量,多来客致力于推动本地生活城市电商的拉新,促活,留存与转化,助力数据化营销运营,提供集高颜值,多元化营销场景于一体的本地生活行业解决方案

网络营销 2024-08-17 00:51:03

首页

吉德环保工程｜重庆生化池｜成品生化池｜装配式生化池｜重庆化粪池｜成品化粪池｜重庆隔油池｜成品隔油池

电影视频 2024-11-19 17:54:50

江苏龙城精锻集团有限公司

江苏龙城精锻集团有限公司创建于1994年，建厂以来，公司从生产摩托车齿坯精锻件起步，逐步发展成为以主营汽车发电机爪极、皮带轮、转子、小型异型精锻件和有色金属锻件等锻造零件生产商。

汽车一族 2024-11-20 20:17:25

七彩光手游网

七彩光手游网是一个专业的手游网站，为玩家提供好玩的手游,手游攻略、手游资讯、一手活动资源，做到好玩的手游推荐

游戏网游 2024-11-27 14:20:19

游戏攻略技巧

三只叮叮喵手游网所有用户提供游戏的攻略,希望在玩家有游戏问题需要解决的时候三只叮叮喵的攻略能够帮到大家,也希望玩家能够经常来网站查找游戏的攻略。

游戏网游 2024-11-27 19:08:57

视频格式转换器

专业稳定的音视频格式转换器,全能的音视频格式转换软件。

电影视频 2024-11-29 17:50:55

苏州中科天启遥感科技有限公司

网络应用 2024-12-09 14:21:54

山东亚辉建材有限公司

山东亚辉建材有限公司是一家致力于建筑装饰解决方案的专业制造商和服务商，主营冲孔铝单板,仿木纹铝单板,仿石材铝单板,仿铜拉丝铝单板,氟碳铝单板等，欢迎咨询：13964768268

商业服务 2024-12-22 00:22:02

爆破针阀

江苏瑞朗博机械设备有限公司是一家国家级高新技术企业。瑞朗博致力于为用户把好最后一道安全关，利用成熟的爆破针技术为客户提供紧急泄放与紧急关断解决方案。公司产品包括爆破针型泄压阀、油气井口紧急切断装置等。在全球，瑞朗博业务涉及领域：石油、石化、天然气、海洋平台、海底油气井口、陆地油气井口等。

安全杀毒 2025-02-01 17:39:45

2019云栖大会润和软件被阿里云授予专有云ISV首批联合方案合作伙伴 (2019云栖大会张勇演讲稿)

9月25日，一年一度的云栖大会在杭州·云栖小镇的国际会展中心盛大举行，为期三天，本届大会以全球开发者为主角，以，数·智，为主题，聚焦数字经济核心议题，吸引了来自世界各地的十余万名开发与科技爱好者，全方位展现云计算、大数据、人工智能等新科技赋能产业蓬勃发展的生态全景，作为蚂蚁金服的战略合作伙伴，润和软件作应邀参加本次大会，会议期间，阿里...。

2024-12-10 00:56:23

重磅！通义千问GPT (通义坊遗址)

大模型的价格越来越卷了，5月21日，阿里云抛出重磅炸弹，通义千问GPT，4级主力模型Qwen，Long，API输入价格从0.02元，千tokens降至0.0005元，千tokens，直降97%，这意味着，1块钱可以买200万tokens，相当于5本，新华字典，的文字量，这款模型最高支持1千万tokens长文本输入，降价后约为GPT，4...。

2024-12-09 15:49:39

三问因果推理为什么需要是什么如何使用 (三问因果推理方法)

译者，AI研习社，听风1996，双语原文链接，CausalInference，What，Why，andHow作为一名经济学博士，我致力于寻找某些变量之间的因果关系，用来完成我的论文，因果关系强大到可以让人们有足够的信心去做决策、防止损失、求解最优解等，在本文中，我将讨论什么是因果关系，为什么需要发现因果关系，以及进行因果推理的常用技巧...。

2024-11-30 18:32:10

转型全布局赋能兴业银行数字化 (转型赋能)

从高建平2019年9月因任职年龄原因辞任董事长算起，兴业银行的董事长之位已经空缺20个月，一直由行长陶以平代理，而近日，吕家进辞任建行副行长、赴任兴业银行党委书记，这意味着董事长一职大概率由吕家进担任，业界预计，这一人事调动将于本月的股东大会和董事会会议上官宣，不过，尽管董事长空缺一年多，但兴业银行的业绩并未受到影响，兴业银行2021...。

2024-11-30 17:11:05

六问 3名95后大专学历女干部被选拔副科能否地下透明 (六问六答内容)

近日，江西吉安市万安县委组织部颁布一则干部任前公示，其中包含3名，95后，年轻女干部，拟提名乡镇人大副职，均为在职大专学历，引发宽泛热议，即使万安县委组织部颁布了，状况说明，，但仍有很多不懂惹起网友质疑，25岁~27岁、大专学历选拔副科能否偏心，事业单位编制间接选拔副科，能否有依据，选拔环节能否地下透明，三人的效果和上班才干能否应该地...。

2024-11-12 14:36:01

请珍惜这低调的星二代 (请珍惜这低调的日子)

本文系网易沸点上班室，谈心社，栏目，群众号，txs163，出品，每天降级，很多人由于电视剧，我，青睐你，看法演员林雨申，剧里，他与赵露思协作，饰演了王道总裁路晋，衣着洁净笔直的彩色西装，打着领带，留着小胡子，一身，精英范儿，王道总裁的人设并不好演，少一分显得太弱，过于强势又会显得平淡，林雨申掌握得很有分寸，这个角色不只出圈，还被观众...。

2024-09-03 17:43:32

欧尔班自己发帖证明外媒曝欧尔班与特朗普在海湖庄园会面敌对使命5.0 (欧尔班力挺中国)

[全球网报道记者索炎琦]路透社11日报道称，匈牙利总理发言人示意，正在美国缺席北约峰会的匈牙利总理欧尔班外地期间周四，11日，与美国前总统特朗普会面，二人，探讨了敌对的或者性，报道称，目前欧尔班正在推进俄乌开战，据引见，匈牙利7月1日接任欧盟轮值主席国，为期6个月，路透社称，本月早些时刻，欧尔班开启的，敌对使命，访问上班，惹恼了欧盟...。

2024-07-13 13:07:07

淮北星散大地影院如何订情侣座 (淮北大地星光今日影讯)

1、关上美团APP，在首页中点击电影或演出，2、点击购票选用所需的电影，点击购票，3、选用场次选用购票的期间场次，再次点击购票，4、最后选用最后一排情侣座即可，大地影院会员卡怎样查购置大地影院会员卡查问购置的方法如下，1.关上大地影院官网网页，2.点击，我的，按钮，进入，我的页面，3.在，我的页面，中点击，会员卡，按钮，进入，我的会...。

2024-07-09 00:52:43

布加迪威龙车标是什么 (布加迪威龙车标)

布加迪威龙车标如图所示，布加迪商标中的英文字母即布加迪，上部EB即为埃托尔布加迪英文拼音的缩写，周围一圈小圆点意味滚珠轴承，底色为白色，布加迪威龙16.4，是1998年德国公众汽车，Volkswagen，并购布加迪之后，于2000年地下宣布的超级跑车，德国公众团体在2016年3月1日在日内瓦汽车展宣布了继任车款布加迪Chiron，裁减...。

2024-07-06 21:42:40

出口起亚索兰托哪里买 (起亚索兰托入华)

起亚索兰托汽车专卖店购置，可到外地起亚索兰托汽车4s店购置或许登录起亚索兰托官网网站检查自己喜欢的车型，起亚索兰托是起亚汽车值得自豪和被寄托厚望的车型，其称号源于意大利语具备上流设施和华美车型的车，仰仗动感的外观、温馨的内饰、热情澎湃的动力性能以及环球级规范的安保装备，在国际市场上SUV市场上尽展英姿，kⅠa汽车是什么品牌的起亚汽车，...。

2024-07-02 15:17:58

350 飞驰CLS级 CLS 4万公里爱护名目费用 2008款 (飞驰300b)

2008款飞驰CLS级CLS3504万公里惯例爱护名目费用惯例爱护名目包含基础B爱护，AMG机油，、火花塞爱护、空调荡涤，片面深度荡涤，、前雨刮片爱护、前制动摩擦片爱护、燃油系统荡涤爱护和制动液爱护，其中，基础B爱护，AMG机油，须要1300元，火花塞爱护须要1297元，空调荡涤，片面深度荡涤，须要820元，前雨刮片爱护须要410元，...。

2024-07-02 14:56:26

伏天落幕暑湿尚在，早睡早起多补水|足三里穴|秋燥|穴位|饮食|作息

伏天落幕暑湿尚在，早睡早起多补水,足三里穴,秋燥,穴位,饮食,作息

2023-09-02 16:46:53

文章推荐

MAX90英寸和小米电视ES Redmi Pro90英寸区别对比

日前，小米推出两款90英寸电视RedmiMAX90英寸和小米电视ESPro90英寸，RedmiMAX90英寸在峰值亮度和存储的配置上略低于小米电视ESPro90英寸，价格上也比小米电视ESPro90英寸便宜2000元左右，1、RedmiMAX90英寸和小米电视ESPro90英寸峰值亮度区别RedmiMAX90英寸峰值亮度700nits...。

2025-02-02 18:31:58

资讯动态

多家科技互联网公司被点名；马斯克将公司职位头衔改为；小鹏汽车获5亿元战略投资货币大师央视315曝光多个线上黑幕 (科技互联互通)

央视315曝光多个线上黑幕，多家科技互联网公司被点名昨晚央视315晚会点名曝光了多家科技互联网企业，范围涉及人脸识别滥用、线上简历泄露、大数据杀熟、在线教育培训、线上购物等用户投诉热点，其中，提供擅自收集消费者信息的人脸识别技术的万店掌、雅量科技、悠络客、瑞为技术被点名；泄露求职者简历的智联招聘、前程无忧、猎聘被点名；360搜索因涉及...。

2024-12-10 00:38:13

资讯动态

0523广告联盟站内互动数据分析 (20030502广告)

代码说明，本页面的认证代码为0523广告联盟专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在0523广告联盟网站首页底部或友情链接位置处，普通认证，普通联盟认证标志适用所有类型的广告联盟，能有效提...。

2024-12-05 22:07:57

网络百科

腾讯会议怎么投屏到电视 (腾讯会议怎么打开摄像头)

发表在专业问答2022，5，418，52展示机型信息，品牌型号，小米电视5s、iPhone13、华为P50、小米11系统版本，MIUITV3.0、iOS15.4.1、鸿蒙OS2.0、MIUI12软件版本，腾讯会议3.7.4腾讯会议需要通过手机无线同屏的方式投屏到电视，下面是具体手机同屏腾讯会议到电视的操作步骤，腾讯会议怎么投屏到电视苹...。

2024-11-29 01:22:33

网络百科

什么陪聊app正规 (什么陪聊平台最赚钱)

陪聊天赚钱的正规软件包括花瓣陪聊、红娘陪聊、HiClub、瓦力陪聊、等觅、豆泡同城、畅言交友以及素质云陪聊、闲来陪聊和聊天宝等，这些软件各有特色，例如，花瓣陪聊提供多种聊天主题，并根据会话时间进行计费；红娘陪聊则是一个基于性别的聊天应用程序，它通过计算聊天量和质量来提供收入；而HiClub更像一个社交网络，用户可以通过聊天、评论和参与...。

2024-11-18 21:42:42

资讯动态

知识图谱与智能诊断 这是最全的解读 关于医疗大脑 (知识图谱与智能运用)

相关文章

文章推荐

知识图谱与智能诊断这是最全的解读关于医疗大脑 (知识图谱与智能运用)