百川智能发布新一代医疗大模型Baichuan-M4,幻觉率降至3.3%
百川智能在清华大学举办的“AI医疗新范式”论坛上,展示了新一代医疗大模型Baichuan-M4及AI家庭医生“百小医”。该模型在三大权威医疗榜单中位列第一,事实性幻觉率降至3.3%,并通过原创强化学习算法解决通用模型在医疗场景下的幻觉、循证和追问缺陷。
百川智能创始人兼CEO王小川在清华大学百川楼举办的“AI医疗新范式”学术论坛上,展示了即将发布的新一代医疗大模型Baichuan-M4与AI家庭医生“百小医”。该模型已与北京儿童医院、中国医学科学院肿瘤医院、上海交通大学医学院附属瑞金医院等三家医院联合开展临床研究。
王小川指出,医疗对大模型有三条刚性要求:低幻觉、强循证、会提问。通用模型在严肃医疗场景下均不达标。例如,《BMJ Open》2026年研究显示通用模型医疗问答约50%“有问题”,近20%“高度有问题”;《JAMA Network Open》2026年评测显示通用模型在鉴别诊断阶段的错误率普遍超过80%;《Nature Medicine》2026年研究揭示AI读标准化病历准确率94.9%,但真实患者自助使用时骤降至34.5%,因模型不会追问。
Baichuan-M4通过原创的事实性感知强化学习算法,将裸模型的事实性幻觉率降至3.3%,在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一,超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro等模型。
即将发布的AI家庭医生“百小医”基于微信生态运作,主动引导用户添加企业微信“百小医@百川家医”,拉入家庭群后自动为每位成员建立独立健康档案,在对话中捕捉并结构化身体状态、用药历史和检查数据,识别日常闲聊中的高危信号,主动提醒复诊和用药。
