消息称雷军千万年薪招揽95后AI天才少女,大模型人才转向场景应用?

多知12月30消息,今日,“雷军千万年薪招揽95后AI天才少女”冲上热搜。据证券时报报道,小米创始人雷军亲自出手,以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队,罗福莉将就职于小米AI实验室。对此,小米暂未回应。


公开资料显示,罗福莉出生在四川小城一个普通家庭,本科毕业于北师大计算机专业,后保研至北京大学计算语言学研究所。硕士毕业后,她因是“ACL 8篇论文作者”火爆网络,随后加入了阿里达摩院机器智能实验室。


2022年,罗福莉离开阿里达摩院,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。此后,罗福莉加入北京深度求索人工智能基础技术研究有限公司(旗下有DeepSeek大模型),担任深度学习研究员,并参与了MoE大模型DeepSeek-V2的研发。


今年5月,在DeepSeek-V2发布以后,罗福莉在知乎撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。


12月26日,Deepseek通过官方公众号称,全新系列模型DeepSeek-v3首个版本上线并同步开源,该模型的多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。


比如,在百科知识、长文本、代码、数学、中文能力上的表现,超越其他模型,尤其是在数学上,在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3 大幅超过了所有开源闭源模型。


图片


同时,通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从20 TPS大幅提高至 60 TPS,相比 V2.5 模型实现了3倍的提升。


该模型的训练成本仅600万美元,成本降低10倍,资源运用效率极高。


相比一个大模型公司,小米则是有很多应用终端,手机、汽车等。根据2024年Q3财报显示,小米集团的AIoT平台已连接的IoT设备数超8.61亿,同比增长23.2%。


雷军亲自挖人,意味着小米将重点投入AI。



  

图片