医联MedGPT丨“诊断”直播测评!治疗方案与真人医生96%一致
据消息,医联研发的国内首个医疗大模型:MedGPT,已经在“接诊”患者了。
(资料图片仅供参考)
不可否认的是,MedGPT还有些问题需要调整,几位专家指出它会出现偶尔过度给出治疗建议、重复推荐检查项目、某些概念表述不准确,以及无法实现查体等局限——要想MedGPT更加可用,这些意见一定程度比正面评价还要重要。
但总的来说,首个医疗大模型的公开首秀的结果还算不错。
总结下来,首先是大模型的基本能力都有,语义理解、多轮对话、多模态识别等,还能像OpenAI那样通过插件商店链接到各种行业应用。
还有通用大模型被广为诟病的对齐和准确性问题,MedGPT整个流程结果也不输真人医生。
再从行业维度来看,确实能真正从医学角度为医生提供有效帮助,提升患者疾病管理效率。
此次真实测试过程中可以看到,它能基于有效问诊以及医学检查数据,MedGPT得以进行准确的疾病诊断,并为患者设计疾病治疗方案。
甚至在诊后,MedGPT还会在患者收到药品后进行用药指导与管理、智能随访复诊、康复指导等智能化疾病管理工作。
目前它基本覆盖ICD10的60%疾病病种,这意味着常见病症都能Hold住还能7*24小时不间断干活,一旦规模化落地辅助医生诊疗,能大大提升医疗效率,对于分级诊疗,医疗资源普惠,都能够发挥一定作用。
首个医疗大模型如何炼成?
医疗向来是AI落地中专业性最强、壁垒性最高,对安全要求最高的领域之一。
以往用户们会习惯性使用信息搜索来帮助自己做一些初步的疾病判断,但信息鱼龙混杂,普通用户缺乏专业知识无法进行有效筛选,最终导致往往会收效甚微。
但又因为这个领域牵涉到每个人的生命健康,市场需求和社会价值一直很大。
因此自ChatGPT诞生以来,关于何时能在医疗领域“上岗”发挥作用,就备受产学研各界专家的关注。
诚如“弱智吧”成为检验各个通用大模型能力的Benchmark一样,各个大模型的医疗能力也在美国执业医师资格考试USMLE中摩拳擦掌。
早些时候, 哈佛大学教授曾亲自下场测试ChatGPT辅助诊断的表现。
结果显示,ChatGPT在45个案例中39个诊断正确,并为30个案例提供适当的分诊建议。这样的表现已经超过现有机器诊断水平,接近医生。
另一个代表,谷歌健康团队打造的Med-PaLM 2,它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。
但能做题并不能意味着就能落地应用。
以GPT-4为首的通用大模型,他们高度依赖文本统计概率生成答案。相信大家也能感知到它很擅长一本正经地胡说八道,如果应用在日常交流,倒也乐在其中。
但要是应用到行业中去,往往非专业人士会难以察觉,这就会引发各种风险,尤其又像医疗这种民生行业,对内容生成的把控要求更高,容不得半点差池。
更不用说医疗本身覆盖知识面广而繁杂,而且从整个就医流程来看,诊前、诊中、诊后都涉及各种各样长尾任务,所需高质量数据可能并不比通用模型小,且大部分数据不是靠网上摘取。
这对企业来说,不单只是算法、算力和数据的考验,而是一整套系统工程性难题。
既然如此,作为国内首个医疗大模型MedGPT,又是如何做到的呢?
简单总结:专业大模型,以及多种准确性机制保架护航。
首先,一上来就打造医疗大模型。
此前专业大模型的思路是,先打造一个大模型,再利用专业数据做监督微调。但MedGPT直接是以医疗数据预训练、微调以及超100名医生参与RLHF机制。
关键词:
相关阅读
-
医联MedGPT丨“诊断”直播测评!治疗方...
据消息,医联研发的国内首个医疗大模型:MedGPT,已经在“接诊”患... -
我省紧急预拨防汛救灾资金7000万元
本报讯(记者梁晨)日前,按照省委省政府要求,省财政厅紧急预拨洪涝灾 -
《无职转生》第二季第五(5)集 拉诺亚魔...
(视频已经做完,但因特殊原因需要晚点发布)Hello各位观众朋友们你们 -
工字钢商品报价动态(2023-08-07)
交易商品牌 产地交货地最新报价工字钢 材质:Q235B;规格:25 ;鞍山宝得 -
新龙江 新故事丨一个社区干部忙碌的一天
赵秀媛(中)询问居民家中受灾情况。赵秀媛(左)坐铲车去帮居民取药。 -
涤纶POY商品报价动态(2023-08-07)
交易商品牌 产地交货地最新报价涤纶POY 分类:熔体纺;粗细:150D;孔数:4 -
昆山的戏曲博物馆计划今年10月对外开放
作为江苏省重点文化和旅游产业项目,昆山的戏曲博物馆建设工作进入尾声 -
木浆商品报价动态(2023-08-07)
交易商品牌 产地交货地最新报价针叶木浆 分类:针叶木浆;工艺:漂白山东 -
白城中院到基层法院调研一站式多元解纷...
近日,白城市中级人民法院组成调研组到各基层法院调研一站式多元解纷机 -
徐州做强枢纽,提升城市辐射能级
本报记者范海杰宋新吴云颜子舒7月30日,徐州市委十三届四次全会召开。 -
【成都大运会】下雨致网球赛事推迟 志...
8月6日,成都大运会网球项目比赛因持续下雨暂停。傍晚雨渐小,为使比赛 -
《咒术回战》推出五条悟手办,外形太过...
《咒术回战》官方联动手办厂商F:NEX推出五条悟手办,当这款手办的外形 -
京津冀多部门投入救援力量 抢修受损基...
为应对华北、黄淮等地极端降雨影响,各地多部门投入救援力量,抓紧修复 -
斗罗:这个美女老师是王言?难不成发生...
在斗罗大陆绝世唐门小说原著中,对王言的介绍还是比较详细的,但是他是 -
动物园开进商场?“萌经济”别惹了祸
小浣熊、狐獴、羊驼、孔雀、梅花鹿……这些曾经在动物园里才能看到... -
《汪汪队立大功》首拍大电影人气角色亮...
作为全球人气动画IP,《汪汪队立大功大电影》自定档起也引发了许多小朋 -
城市五分钟、城乡半小时充电圈……浙江...
近日,省政府办公厅印发《浙江省完善高质量充电基础设施网络体系促进新 -
旅客站台晕倒 铁警及时救助
通讯员洪淳8月3日下午1点30分许,千岛湖高铁站进站口已经排起了长长的 -
北京市海淀区市场监管局开展影院食品安...
暑期之际,影院观影成为广大市民在炎炎夏日里的消费热点。为进一步加强 -
黑龙江12条河流超警 5座大型水库超汛限运行
记者从黑龙江省水文水资源中心获悉,8月7日8时,黑龙江水位与警戒水位