动态资讯 分类
无惧OpenAI2026年国内最值得期待的十个医疗大模型 发布日期:2026-02-12 21:24:12 浏览次数:

  1月初,OpenAI连续发布ChatGPT Health和OpenAI for Healthcare,在满足HIPAA合规要求的同时,能为个人用户和医疗机构提供更稳定、更优质的患者护理服务。这也是OpenAI首次推出官方的医疗健康专用模块。

  OpenAI的动作也引发了一连串连锁反应——短短几日内,其主要的竞争对手Anthropic和谷歌也迅速做出回应:前者针锋相对,发布了Claude for Healthcare;后者则更新了开源医疗大模型,拿出了MedGemma 1.5(4B)。

  面对全球大模型巨头们的军备竞赛,国内医疗大模型并没有被吓到。电梯广告随处可见的蚂蚁阿福自不必说;“All-in”医疗的百川智能更是技惊四座,拿出了医疗基准测试超越GPT-5.2的Baichuan-M3;京东健康更是一口气连发大模型新品和解决方案。

  首先发布的是ChatGPT Health,它在ChatGPT中嵌入了一个新的独立模块,基于最新的GPT-5模型,通过新标签页的形式解答用户有关医疗健康的咨询。用户还可以选择是否连接个人EHR或者Apple Health等数据来源,且该模块存储的对话记录及数据等独立于ChatGPT其他对话,注重数据隐私。

  随后发布的OpenAI for Healthcare则主要针对医疗机构用户,包含了ChatGPT医疗保健版和OpenAI API两个产品。前者需要企业级部署,更像是ChatGPT Health的企业版。主要用于医疗临床环境、研究和运营目的,比如自动草拟病历、出院总结、转诊信等文档,且支持HIPAA。后者则用于医疗生态系统。目前,已有数千家AI企业(如知名的Abridge和Ambience)通过配置该接口来支持符合HIPAA标准的应用。

  一个重要的原因在于国内大模型同样进展迅速,有着十足的竞争力。就在1月13日,“All-in医疗”的百川智能发布了全新的医疗大模型Baichuan-M3。在全球权威的医疗大模型基准评测HealthBench和HealthBench Hard中,它分别以65.1分和44.4分的成绩夺冠;且幻觉率仅有3.5%,全球最低,实现对GPT-5.2的“三杀”。仅几天后,百川智能又发布了Baichuan-M3 Plus,将幻觉率降低至2.6%,刷新了自己刚刚创造的纪录。

  更为关键的是,去年DeepSeek通过架构高效率提升同时实现高性能和低成本,且其开源模式深刻影响了后续国内Kaiyun官方入口大模型发展,各大模型大厂和初创企业纷纷大幅增加开源投入,目前,国内模型在全球最大的AI开源社区Hugging Face上的下载量已超越美国。全球越来越多的用户开始使用并依赖国内开源大模型。

  开年的热闹场景,注定今年将是医疗大模型一个重要的年头。那么,除了已经深度嵌入全行业生态,成为国产大模型标杆的DeepSeek外,国内还有哪些医疗大模型是今年最值得期待的?动脉网尝试从性能、迭代、资源、数据及行业热度等几个维度来做出我们的解读。

  性能无疑是最为核心的考虑因素。目前,医疗大模型的性能基准测试以HealthBench(全球范围)和MedBench(汉语)最为权威。

  MedBench则由上海人工智能实验室发布,是国内首个面向垂直大模型、专用大模型和应用场景的医疗大模型评测与验证体系,目前已升级至 MedBench 4.0。这一基准测试覆盖大语言模型、多模态大模型及智能体三大类,围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建共60个评测集70余万专业评测题,并覆盖10项细分任务。

  数据对于医疗大模型来说至关重要,但高质量的医疗数据却十分稀缺。一方面,处于数据隐私合规等方面的考虑,医疗及医保机构对于数据态度十分谨慎;另一方面,即便不考虑这一因素,国内的医疗数据质量也难言乐观。若能与知名医疗机构合作,理论上不仅可以获得更好的数据,同时也可以使得产品在临床专家团队的帮助打磨下更为完善。

  作为唯一“All-in医疗”的大模型独角兽,百川智能在这个开年狠狠火了一把。新发布的Baichuan-M3在HealthBench和HealthBench Hard踩着GPT-5.2登顶,紧随其后对标OpenEvidence的Baichuan-M3 Plus又在短短数日内刷新M3创下的最低幻觉率纪录。这也将为其与儿童医学中心首都医科大学附属北京儿童医院合作的首个儿科大模型提供更好的支撑。

  百度灵医大模型是国内首个“产业级”医疗大模型,在“重循证”思路下投入千亿Token优质医疗健康训练语料支持,覆盖300万+多模态影像数据、5亿+条权威健康科普内容、70万+项临床试验介绍信息及2000万+多语种医学文献资源等。灵医大模型也是国内首批商业化落地的医疗大模型,通过多产品矩阵及密集更新已提供健康管家、医生助手及企业服务等能力,支持多种接入方式,已覆盖800+医院、4000+基层医疗机构和大量药企,在智慧诊疗、智慧科研、智慧服务等场景实现规模化应用。

  方舟健客杏石医疗大模型具备多维度能力,并将知识、导诊、预问诊、医生、电子病历五大智能体聚合实现慢病管理全链条闭环覆盖,其创新模式也被Nature关注并报道。它也是最早对标OpenEvidence的国内医疗大模型之一,整合中华医学会170多种核心期刊超110万篇文章,覆盖临床所有重点学科。据统计,其已累计已为医生提供近40万次技术辅助,帮医生节省了超6万个小时的工作时间,患者的单次问诊时间也缩短了70%以上。

  京东健康京医千询医疗大模型在去年初成为国内医疗行业首个全面开源的垂类大模型。目前,京医千询医疗大模型已实现从通用基座模型到全科大模型,再到专科专病大模型的完整技术演进。依托这一技术底座,京东健康还打造了覆盖多个医疗场景的大模型产品体系,包括“京医”“知医”“卓医”等,已成为应用场景最丰富、与医院共建最深、合作医生最多、参与用户最广泛的医疗垂类大模型之一。

  蚂蚁集团已经将医疗健康业务成为新战略支柱板块,蚂蚁·多模态医疗大模型可以预期也将会成为诸多AI应用的基石。依托超万亿tokens专业医疗语料底座,支撑自主研发千亿参数多模态模型,蚂蚁·多模态医疗大模型也是国内首个通过国家信通院医疗健康行业大模型双领域可信评估的大模型。在HealthBench、MedBench等国内外行业榜单中始终名列前茅。

  借助几乎无所不在的微信生态圈和健康领域“朋友圈”,基于腾讯混元大模型底座的腾讯健康医疗大模型可能是目前在基层应用最为广泛的医疗大模型之一。截至去年9月,由其驱动的AI导辅诊服务在全国34个省、直辖市、自治区的近10000家各级医疗机构得到广泛应用,并已实现“微信直连”。各类“开箱即用”的医疗AI解决方案服务超过1300家机构,涵盖医院、药械企业、科研院校、医疗科技企业。

  在最新的一期MedBench评测榜单中,微医医疗大模型表现突出,拿下两个冠军和一个亚军。在AI落地上,微医也走在前列——在其向港交所提交的招股书中,其2025年上半年AI医疗服务收入已达总营收九成以上;且按2024年收入统计,微医在中国数字健康服务市场及AI医疗健康解决方案市场中均位列第一。

  自2023年以来,讯飞医疗旗下讯飞星火医疗大模型已经历多次迭代,核心医疗能力不断精进,多次在评测榜单中上榜。试点数据显示,星火医疗大模型专科诊断合理率提升至96%,跨科室诊断合理率提升至91%,病历书写时间减少50%,已达等级医院主任级医师水平。基于该模型的医生助理已覆盖全国801个区县,累计提供11亿次辅助诊断;AI健康助手下载量则已突破2400万次,完成超1.6亿次AI健康咨询。

  医渡科技大模型也是评测榜单中的常客,已授权处理覆盖超过10000家医院共13亿患者人次的近70亿份医疗记录,沉淀了大量多维度可量化的知识图谱。基于该大模型,医渡科技还与多家医院合作打造专科大模型及智能体。在第十一届中国健康信息处理大会上,医渡科技荣获“医学NLP代码自动生成测评”冠军及“最佳论文奖”,体现了医Kaiyun官方入口疗垂类大模型领域的技术实力。

  除了上述这些大模型外,另外一些国内医疗大模型依然相当有特点。尤其是之前的医疗AI企业。以数坤为例,其近年来的技术与产品重心已从单点算法或模型能力比拼,转向多模态医疗大模型在真实医疗体系中的规模化落地与长期运行能力建设。

无惧OpenAI2026年国内最值得期待的十个医疗大模型(图1)

  其面向真实医疗支付与服务场景提供系统级支持,将分散于医药、保险与服务环节中的多源数据进行统一建模与规则整合,支撑复杂支付路径的自动匹配与执行,是镁信健康“一码直付”及多项核心业务能力的重要技术底座。截至 2025年12月,mind42.ai已累计服务覆盖4.43亿保单量,包含多种保险产品与用药、就医场景。

  关注互联网医疗及健康领域的新技术、创业和投资,以及新技术背后的伦理变迁。微信公众号:vcbeat

  融资丨半年连融两轮!智冉医疗完成3亿元A+轮融资,中科创星领投,老股东集体加注

  3B参数实现物理智能涌现:飞捷科思智能科技发布首个全模态物理AI基础模型OmniFysics