1.百川智能发布了全场景深度思考模型Baichuan-M1-preview,具备语言理解、视觉识别和智能搜索三大领域的推理能力。
2.该模型配备了医疗循证模式,实现从医疗证据检索到深度推理的完整端到端服务。
3.与此同时,百川智能发布了行业首个开源医疗增强大模型Baichuan-M1-14B。
4.Baichuan-M1-14B在权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct。
5.为提升医疗能力,百川智能收集了万亿级token的严肃医疗数据,涵盖了千万级的专业医疗论文、院内真实病例等。
以上内容由腾讯混元大模型生成,仅供参考
1月24日,百川智能发布了全场景深度思考模型Baichuan-M1-preview,该模型同时具备语言理解、视觉识别和智能搜索三大领域的推理能力。作为专注医疗领域的大模型公司,百川此次推出的深度思考模型还特别配备了医疗循证模式,可实现从医疗证据检索到深度推理的完整端到端服务。目前,Baichuan-M1-preview已在百小应平台正式上线,同时百川智能还发布了行业首个开源医疗增强大模型Baichuan-M1-14B。
Baichuan-M1-preview:探索医疗场景的端到端
作为一个全场景深度思考模型,Baichuan-M1-preview具备语言推理、视觉推理及搜索推理能力。根据百川智能公布的测试结果显示,在语言推理方面,其在AIME和Math等数学基准测试,以及LiveCodeBench代码任务上的成绩超越了o1-preview等模型。
视觉推理方面,在MMMU-val、MathVista等权威评测中的成绩,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。
为实现Baichuan-M1-preview的医疗循证模式,根据官方介绍,百川智能自建了涵盖亿级条目的循证医学知识库,囊括了国内外医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容,且以天为单位进行动态更新,及时收录医疗领域的新突破、新进展。
众所周知,医学知识多样性强、因果关系复杂。因此,即使构建了庞大的医疗知识库,在调用其中的医学知识,尤其叠加了互联网上搜索到的医疗信息时依然会遇到部分医学数据、医学理论不一致的情况。
针对这一问题,根据百川医疗介绍,医疗循证模式能运用医学知识和证据评估标准,对证据进行多层分级,并对不同权威等级的证据进行专业分析与整合,识别各类权威信息的来源和可信度,从而避免因信息混杂导致的误判,然后基于这些医学证据进行医学推理。
通过“医疗循证模式”,Baichuan-M1-preview实现了从证据检索到深度推理的完整端到端服务,目标为解决医疗场景中信息过载、不确定性和碎片化等痛点。
开源医疗增强通用大模型Baichuan-M1-14B
百川还推出了首个开源医疗增强通用大模型Baichuan-M1-14B,根据官方公布的评测结果,它不仅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct,并且与o1-mini也相差无几。
为了提升Baichuan-M1-14B的医疗能力,百川智能面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。
在此基础上,百川智能还针对病例、医学教材、医学指南等不同类别的高质量医疗数据生成了超千亿 token 的多样化数据,包含了医疗复杂决策推理链条、决策依据以及问答对等多样化形式。这些合成数据拥有丰富的知识呈现形式以及与医生一致的思维过程,进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。
进入到模型训练阶段,百川智能运用行业首创的多阶段领域提升方案,将整个训练过程分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,依次提升模型的基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO强化学习法,优化思维链路径,避免传统奖励模型偏差,目的为提升模型的生成质量与逻辑推理能力。(腾讯科技特约作者 郭晓静)