平安医疗大模型获全球医疗AI最高评分,超越Meta、OpenAI,金融、医疗专业大模型均达世界一流水平

lnradio.com 4 0

近日,中国平安旗下平安科技携手平安好医生、北大医疗联合研发的平安“医疗大模型3.5”,在全球医疗AI权威评测集HealthBench Hard(OpenAI发布)中斩获全球最高分(57.27分),超越百川(44.4分)、Meta(42.8分)、OpenAI(42分)等多家头部科技企业位列排名榜首,刷新该基准的评分纪录。此前,中国平安金融大模型在行业权威大模型评测体系CNFinBench大语言模型公开榜单上同样位列综合第一。相关评测方表示,目前中国平安在“金融”“医疗”两大专业领域的大模型技术能力均达到世界一流水平。

据了解,平安医疗大模型参与评测的HealthBench基准由OpenAI发布,由60个国家、26个医学专业的262名医生共同构建,包含5000组高仿真多轮医疗对话,并设置48,562项由医生制定的评分标准系。其中,HealthBench Hard被视为高难度子集,是OpenAI从5000组对话中筛选出1000组更具挑战性的案例,用于测试模型在复杂、不确定、高风险临床场景中的推理能力上限,也是OpenAI评估先进模型及医疗健康产品的重要参考。

复刻真实医生临床推理逻辑,AI医疗大模型从“咨询”走向“诊疗”

平安科技介绍,区别于通用大模型侧重标准化问答的训练逻辑,平安结合北大医疗集团、平安好医生等医疗自营旗舰业务的真实场景,依托长期积累的“筛、管、治、康”全病程服务闭环数据,持续推动医疗AI从传统的信息获取、健康咨询,进一步走向复杂病种辅助决策、多学科协同诊疗等更接近临床核心的应用场景,打造主动服务式AI大模型。

结合真实场景数据,AI大模型复刻真实医生临床推理逻辑。针对临床普遍存在患者症状描述模糊、病情动态变化、关键信息缺失等难题,平安科技研发团队设计了由患者数字分身、自适应评估智能体、临床知识图谱组成的动态诊断模拟环境,将医生在不确定条件下的判断过程建模为multi-Turn RL推理任务,为算法优化突破提供支撑。

锤炼顶尖算法能力,提高AI大模型可用性、准确度。针对医疗推理高复杂、低容错的特点,研发团队采用三阶段递进训练:静态框架内化构建具临床逻辑的知识体系、动态思维链探索实现复杂场景下的长链与跨学科推理,最终实现高阶推理能力跃迁。同时自研全链路幻觉控制引擎,融合上下文及语境学习、不确定量化等算法,实现从提示词、训练到推理阶段的全流程风险控制,不断降低幻觉率。

AI赋能“四到”医疗体系(到线、到院、到家、到企)。推出平安灵眸、健康管家、AI-MDT、AI康复等AI医疗产品,平安逐步构建了覆盖“筛查—管理—治疗—康复”的完整医疗链路,通过规模化、数据飞轮、真实世界对齐三项核心要素,实现医疗AI智能跃迁。在早筛环节,“平安灵眸”已构建90余种疾病筛查模型。目前,该产品已下沉至全国1500家基层医疗机构,累计完成150万次早筛,每年帮助30万客户实现风险早发现。在管理环节,“健康管家”通过多智能体协同,打造了“社群运营”式健康管理体系,已构建起服务200万患者的国内最大慢病管理社区。通过AI主动干预,慢病患者的依从性提升了5倍,实现了从一次性咨询到长期健康效果管理的质变。

落地MDT多场景,AI诊疗方案采纳率已达85%

平安科技介绍,区别于通用大模型侧重标准化问答的训练逻辑,平安结合北大医疗集团、平安好医生等医疗自营旗舰业务的真实场景,依托长期积累的“筛、管、治、康”全病程服务闭环数据,持续推动医疗AI从传统的信息获取、健康咨询,进一步走向复杂病种辅助决策、多学科协同诊疗等更接近临床核心的应用场景,打造主动服务式AI大模型。

平安科技介绍,北大医疗AI-MDT Pro智能会诊系统已落地北大医疗、平安好医生等机构真实场景,可充分考虑患者信息,给出化疗、靶向治疗、放疗、内分泌治疗的全流程建议,并明确用药剂量、周期、顺序。内部数据现实,平安的AI诊疗方案采纳率达到85%;在乳腺癌等重症领域,AI诊疗方案和主任专家一致性达到92.5%以上。平安首席技术官王晓航表示,平安的目标是将顶级的多学科诊疗能力,从中心城市大医院的稀缺资源,转化为触手可及的规模化普惠供给。

值得一提的是,2026年3月,中国平安金融大模型PingAnGPT-Qwen3-32B 在CNFinBench大语言模型公开榜单上综合排名第一,超越DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等开源大模型,以及GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro等领先的闭源商业模型,在金融事实推理与计算、金融专业知识问答、金融合规与风险控制等多项关键指标表现卓越。2026年4月,中国平安升级AI“快捷服务”,为2.52亿客户打造“一句话能办事”的专属金融AI助手,能交易、能融资、能理赔、能救急,满足“一个入口、一站式解决”客户需求。该AI助手将300余项数字化服务全面封装,构建了主动服务能力,能够理解客户的个性化需求,让服务从“被动响应”走向“主动打理”。

打造领先科技能力,专业服务守护心中的平安。中国平安表示,公司将坚持深化“综合金融+医疗养老”双轮并行以及科技驱动战略,秉承“AI in ALL”原则,深度扎根金融、医疗、养老等核心主业,持续推进模型优化迭代,进一步打造领先AI能力,深化场景化应用落地,重构业务效率、变革服务体验,不断满足人民群众对美好生活的向往。