复旦大学团队发布中文医疗健康个人助手,开源47万高质量数据集|样本|大模型

用微信扫码二维码

分享至好友和朋友圈

患者感到身体不适时,可以向模型问诊,描述自身症状,模型会给出可能的病因、推荐的治疗方案等作为参考,在信息缺乏时会主动追问症状的详细描述。

图2:问诊场景下的对话

用户还可以询问与自身无关的医学知识,此时模型会尽可能专业地作答,使用户全面准确地理解。

图4:与自身无关的医学知识询问对话

DISC-MedLLM是基于我们构建的高质量数据集DISC-Med-SFT在通用领域中文大模型Baichuan-13B上训练得到的医疗大模型。值得注意的是,我们的训练数据和训练方法可以被适配到任何基座大模型之上。

DISC-MedLLM具有三个关键特点:

3、方法:数据集DISC-Med-SFT的构造 复旦大学团队发布中文医疗健康个人助手开源4

在模型训练的过程中,我们向DISC-Med-SFT补充了通用领域的数据集和来自现有语料的数据样本,形成了DISC-Med-SFT-ext,详细信息呈现在表1中。

数据集。分别从两个公共数据集MedDialog和cMedQA2中随机选择40万个和2万个样本,作为SFT数据集构建的源样本。

重构。为了将真实世界医生回答调整为所需的高质量的统一格式的回答,我们利用GPT-3.5来完成这个数据集的重构过程。提示词(Prompts)要求改写遵循以下几个原则:

图6展示了一个重构的示例。调整后医生的回答与AI医疗助手的身份一致,既坚持原始医生提供的关键信息,又为患者提供更丰富全面的帮助。

图6:对话重新改写的例子

医学知识图谱包含大量经过良好组织的医学专业知识,基于它可以生成噪声更低的QA训练样本。我们在CMeKG的基础上,根据疾病节点的科室信息在知识图谱中进行采样,利用适当设计的GPT-3.5模型Prompts,总共生成了超过5万个多样化的医学场景对话样本。

在训练的最终阶段,为了进一步提高模型的性能,我们使用更符合人类行为偏好数据集进行次级监督微调。从MedDialog和cMedQA2两个数据集中人工挑选了约2000个高质量、多样化的样本,在交给GPT-4改写几个示例并人工修订后,我们使用小样本的方法将其提供给GPT-3.5,生成高质量的行为偏好数据集。

通用数据。为了丰富训练集的多样性,减轻模型在SFT训练阶段出现基础能力降级的风险,我们从两个通用的监督微调数据集moss-sft-003和alpacagpt4datazh随机选择了若干样本。

MedMCQA。为增强模型的问答能力,我们选择英文医学领域的多项选择题数据集MedMCQA,使用GPT-3.5对多项选择题中的问题和正确答案进行了优化,生成专业的中文医学问答样本约8000个。

训练。如下图所示,DISC-MedLLM的训练过程分为两个SFT阶段。

图7:两阶段训练过程

评测。在两个场景中评测医学LLMs的性能,即单轮QA和多轮对话。

比较模型。将我们的模型与三个通用LLM和两个中文医学对话LLM进行比较。包括OpenAI的GPT-3.5,GPT-4,Baichuan-13B-Chat;BianQue-2和HuatuoGPT-13B。

单轮QA结果。单项选择题评测的总体结果显示在表2中。GPT-3.5展现出明显的领先优势。DISC-MedLLM在小样本设置下取得第二名,在零样本设置中落后于Baichuan-13B-Chat,排名第三。值得注意的是,我们的表现优于采用强化学习设置训练的HuatuoGPT(13B)。

表2:单项选择题评测结果

多轮对话结果。在CMB-Clin评估中,DISC-MedLLM获得了最高的综合得分,HuatuoGPT紧随其后。我们的模型在积极性标准中得分最高,凸显了我们偏向医学行为模式的训练方法的有效性。结果如表3所示。

在CMD样本中,如图8所示,GPT-4获得了最高分,其次是GPT-3.5。医学领域的模型DISC-MedLLM和HuatuoGPT的整体表现分数相同,在不同科室中表现各有出色之处。

CMID的情况与CMD类似,如图9所示,GPT-4和GPT-3.5保持领先。除GPT系列外,DISC-MedLLM表现最佳。在病症、治疗方案和药物等三个意图中,它的表现优于HuatuoGPT。

各模型在CMB-Clin和CMD/CMID之间表现不一致的情况可能是由于这三个数据集之间的数据分布不同造成的。CMD和CMID包含更多明确的问题样本,患者在描述症状时可能已经获得了诊断并表达明确的需求,甚至患者的疑问和需求可能与个人健康状况无关。在多个方面表现出色的通用型模型GPT-3.5和GPT-4更擅长处理这种情况。

DISC-Med-SFT数据集利用现实世界对话和通用领域LLM的优势和能力,对三个方面进行了针对性强化:领域知识、医学对话技能和与人类偏好;高质量的数据集训练了出色的医疗大模型DISC-MedLLM,在医学交互方面取得了显著的改进,表现出很高的可用性,显示出巨大的应用潜力。

该领域的研究将为降低在线医疗成本、推广医疗资源以及实现平衡带来更多前景和可能性。DISC-MedLLM将为更多人带来便捷而个性化的医疗服务,为大健康事业发挥力量。


相关资料:txt下载doc下载文章搜索网址搜索百度搜索

本文链接:http://www.gpxz.com/article/a592ea5658b4eef9aa25.html


全局中部横幅
全局中部横幅
雅思培训

环球教育专注雅思考试、雅思培训班、托福考试、托福培训班、出国留学、国际游学等英语培训服务,针对不同学员的自身情况量身打造学习方案及留学规划.

医学人才网·医堆,卫生人才网,医疗人才网,医生招聘,护士招聘

医学人才网·医堆专注于医疗卫生人才招聘服务,从事医生招聘、护士招聘以及医疗卫生各类人才的招聘。医学人才网真诚为医疗人才提供方便快捷求职服务;为招聘医院、门诊提供招聘服务。医学人才网·医堆医院招聘电话:【0571-85354566】

如何建立自己的网站,怎么样做网站,创建一个网站制作流程,个人网站建设步骤

巅云建站教程平台-教你怎么样建立一个自己的网站,简单明了的个人网站制作步骤及企业网站建设流程,让你1天快速学会如何做网站,创办一个自己的网站如此简单。

视频新闻中心

人民网于1998年开始推出网上音视频节目,后专设多媒体频道,2007年更名为人民宽频频道,2008年推出人民播客,2010年3月人民电视开播。目前已经形成以新闻类视频节目为主,同时囊括文化、娱乐、体育、生活、社会等各类综合内容的业务格局。本页面汇总每日最新视频新闻。

东北网

东北网是黑龙江影响力最强、访问量最大的综合性网站,是拥有新闻发布、资讯服务、视频播报、多语种传播、无线增值业务服务等多功能的新媒体平 台,开设黑龙江新闻、视频、健康等40多个内容频道及论坛、博客、微博、微信等互动交流,提供最全面的黑龙江信息。

吉林网站导航大全

LOL网址导航网是专业的上网导航网站,精心收录各类优质热门网站信息,同时提供天气、快递、违章等各种生活便民查询工具网址,为您提供安全便捷的上网导航服务,现已被众多网友设为上网主页,网址导航大全首选LOL网址导航.

保定市民科环境检测有限公司

保定市民科环境检测有限公司创建于2003年10月份,依法注资500万元,地处具有古城之称的河北保定,位于繁荣的商务中心地段,环境优雅卓越,办公设施正规齐全,实验设备先进一流,是一家长期致力于环境(水、土壤、噪声、大气、固废、污染源)、辐射、油气回收、职业卫生评价等以检测为主的具有独立法人地位的股份

养颜吃什么

豆果美食是最优质的美食菜谱社区,提供各种菜谱大全,食谱大全,家常菜做法大全,丰富的菜谱大全可以让您轻松地学会怎么做美食,展现自己的高超厨艺,开启美好生活!

生活服务app下载

互联网的发展促使我们日常生活日益便利,从手机购物、外卖跑腿到房屋租赁、运动减肥,无一不需要用到手机app,这些生活服务app满足用户生活需求,为人们的生活提供了很大的便利。有了这些app提供各种团购优惠、打折、套餐、活动等等衣食住行优惠信息,你会更懂你的城市。

智能小程序平台

智能小程序,智能连接人与信息、人与服务、人与万物的开放生态,依托APP为代表的全域流量,通过百度AI开放式赋能,精准连接用户,无需下载安装便可享受智慧超前的使用体验。

全局底部横幅