MedBench最新榜单出炉!深兰科技医疗大模型综合测评第一
创始人
2025-05-29 10:41:51
0

本报讯 (记者矫月)5月27日,国内权威医疗大模型评测平台MedBench发布最新评测榜单。深兰科技DeepBlue-MR-v1医疗大模型不仅以复杂医学推理评测第一的成绩持续霸榜,而且在多个综合评测中以94.2的高分荣膺桂冠。

榜单显示,参与本次评测的大模型有腾讯优图天衍医学大模型、基于华为盘古大模型研发的润医医疗大模型、云知声UniGPT-Med-U1大模型等。

MedBench是中文医疗大模型第一权威评测平台,由上海人工智能实验室与上海市数字医学创新中心联合国内多家医疗机构和科研单位设立,该平台汇聚了顶级医疗机构的专家经验和知识储备,已为全球超过387个模型提供评测。

深兰科技DeepBlue-MR-v1医学推理大模型是由深兰科技自主研发的医学推理大模型,擅长临床医学问诊、辅助医学诊断和制定诊疗方案等任务,通过对医学教科书、诊疗指南、专家论文、病案病历、医学推理、医学术语以及心理咨询等海量数据的清洗、构建和医学专家团队标注,运用自研训练体系,实现了人类医学推理能力对齐的基于Transformer架构的稠密大语言模型。DeepBlue-MR-v1医学推理大模型在海量高质量的医学数据上进行预训练,构建医学推理语义空间,通过训练监督微调、医学推理指令增强和多阶段自适应强化学习算法实现医学推理能力迭代提高。

医学推理能力是AI医疗皇冠上的明珠。深兰科技DeepBlue-MR-v1医疗大模型,自登顶MedBench复杂医学推理能力榜首至今,持续霸榜并扩大领先优势。在保持复杂医学推理能力的绝对领先优势的同时,还在医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理共五个维度的综合得分也荣登MedBench榜首,该成绩充分彰显了公司行业领先的技术实力。

目前,基于DeepBlue-MR-v1医疗大模型,深兰科技所开发的AI医疗产品,已形成涵盖“AI问诊助手”“远程视频问诊”“辅助诊断系统”及“医学专家知识库”等在内的智能体产品矩阵。与武汉市中心医院、武汉协和医院、武汉市血液中心、武汉市精卫中心、武汉市武东医院等多家医疗机构达成合作,将联手推动AI技术在问诊、诊断、专科服务等场景的深度应用。

(编辑 张昕)

相关内容

热门资讯

良信电器申请一种辅助触点结构及... 金融界2025年5月31日消息,国家知识产权局信息显示,上海良信电器股份有限公司申请一项名为“一种辅...
科技巨头争夺未来:智能手机时代... 【环球网科技综合报道】在科技飞速发展的今天,智能手机这一定义了过去十多年数字时代的设备或许即将成为历...
新华访谈|天问二号有哪些了不起... 5月29日凌晨1时31分,中国在西昌卫星发射中心用长征三号乙运载火箭,成功将行星探测工程天问二号探测...
石化油服获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示石化油服(600871)新获得一项发明专利授权,专利名为“一种...
雷军宣布小米·中国汽车耐力锦标... 5月31日,雷军发文宣布小米·中国汽车耐力锦标赛成都站,今天正式开赛,大家一睹中国最高级别的汽车耐力...
知名演员去世,祖籍山东 5月30日深夜,知名纪录片导演郭柯在个人社交账号发文,透露凭借《银狐》《戏王之王》《胜者为王3》等作...
原创 法... 5月27日,法国军方终于被问到了一个非常尴尬的问题,在5月7日印巴空战当中,到底有没有阵风战机被击落...
重庆部分居民称自来水有臭味,洗... 极目新闻记者 王灿 “家里的自来水有好大一股味道啊”“洗碗洗杯子不得不用矿泉水来冲”,5月30日,许...
A股:大家要做好心理准备,端午... A股市场,向来是投资者们情绪的“过山车”。今天,A股又想重演V形反转的走势,可最终连早盘的跳空缺口都...
二〇二五年科学教育天山行活动启... 29日,2025年全国科技活动周和全国科技工作者日新疆主场活动暨科学教育天山行活动举行启动仪式。科技...