消息称雷军千万年薪招揽95后AI天才少女，大模型人才转向场景应用？

多知网

2024-12-30 19:07发布于广东教育领域优质自媒体

多知12月30消息，今日，“雷军千万年薪招揽95后AI天才少女”冲上热搜。据证券时报报道，小米创始人雷军亲自出手，以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉，领导小米AI大模型团队，罗福莉将就职于小米AI实验室。对此，小米暂未回应。

公开资料显示，罗福莉出生在四川小城一个普通家庭，本科毕业于北师大计算机专业，后保研至北京大学计算语言学研究所。硕士毕业后，她因是“ACL 8篇论文作者”火爆网络，随后加入了阿里达摩院机器智能实验室。

2022年，罗福莉离开阿里达摩院，加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。此后，罗福莉加入北京深度求索人工智能基础技术研究有限公司(旗下有DeepSeek大模型)，担任深度学习研究员，并参与了MoE大模型DeepSeek-V2的研发。

今年5月，在DeepSeek-V2发布以后，罗福莉在知乎撰文，发表了对于DeepSeek-V2的看法。她表示，“单论DeepSeek-V2模型的中文水平，是真实处在国内外闭源模型的第一梯队”，“外加1元/百万输入Tokens的价格，只有GPT4价格的1/100，性价比之王”。

12月26日，Deepseek通过官方公众号称，全新系列模型DeepSeek-v3首个版本上线并同步开源，该模型的多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

比如，在百科知识、长文本、代码、数学、中文能力上的表现，超越其他模型，尤其是在数学上，在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上，DeepSeek-V3 大幅超过了所有开源闭源模型。

同时，通过算法和工程上的创新，DeepSeek-V3 的生成吐字速度从20 TPS大幅提高至 60 TPS，相比 V2.5 模型实现了3倍的提升。

该模型的训练成本仅600万美元，成本降低10倍，资源运用效率极高。

相比一个大模型公司，小米则是有很多应用终端，手机、汽车等。根据2024年Q3财报显示，小米集团的AIoT平台已连接的IoT设备数超8.61亿，同比增长23.2%。

雷军亲自挖人，意味着小米将重点投入AI。

查看原图 83K