【环球网科技综合报道】360集团智脑团队近期发布14B、7B推理模型Light-R1。其中14B模型在数学(AIME 24/AIME 25)和科学推理(GPQA Diamond)测试中,得分大幅超过DeepSeek发布的14B版本,同时稳超目前行业中同级别推理模型,能力甚至比肩DeepSeek R1 32B版本。行业人士认为,360发布14B和7B模型,可推动大模型在本地设备部署,有助于推动大模型的全面普及和使用。
根据业界权威基准测试的结果,Light-R1 14B数学能力测试达到了满血版DeepSeek 671B的92%,推理和科学知识达到了DeepSeek满血版的86%。这意味着14B模型以DeepSeek R1满血版仅2%的参数量,在一些领域实现了其90%关键性能。同时,Light-R1 7B模型的数学能力可以达到DeepSeek 70B蒸馏版本的84%,科学知识和推理达到70B的75%。
当前一些政企机构在使用DeepSeek满血版时,面临着数据安全问题,既想让大模型更懂企业,又不造成核心数据面临泄露风险,本地部署大模型已成为众多政企用户的实际需求。但一个现实是,能运行DeepSeek R1 6710亿参数满血版的一体机,动辄需要数十万上百万元成本,这在很大程度上制约了大模型的本地化部署进程。
在360智脑的14B、7B模型开源之后,无论政企单位还是个人,仅通过平民级显卡就可以在普通电脑上实现部署。例如,英伟达3060显卡支持7B模型流畅运行,这款显卡的售价目前仅有一千多元,而售价六千多元的3090显卡可以运行14B模型。这意味着一年前还需要数千万元成本的大模型,目前只需要几千元成本就能落地部署。业界判断,随着7B、14B这样的小参数大模型陆续开源,大模型的私有部署还将进一步普及,中小企业和个人用户只用极小成本,就可以轻松拥有一个个头小、能力大的一流推理模型。
当前,政企组织对大模型的需求多种多样,需要响应快速,跟政企知识库连接,还得保证数据安全,成本可控。企业在接入360智脑的14B、7B模型后,将实现大模型能力在每个部门甚至每个小组的应用,各类需求都将匹配到专属场景的大模型。
对个人用户而言,只需要一台普通家用电脑,搭配上玩游戏的显卡,就能把14B、7B模型装到家里,用户可以将大模型用于学习和工作场景,满足个性化需求。
360集团创始人周鸿祎表示:“希望14B、7B模型能进入千家万户,深入百行千业,让每个人都能拥有一个强大的AI,实现人人AI,加速中国AI的普惠进程。”
据了解,360智脑还将推出多种参数的大模型,为用户本地部署大模型提供更多选择。(古雨)