3月10日,欢迎收看《ToB话聊室》。在这里,小编将跟你唠一唠科技领域的新鲜事儿。
Manus基于阿里千问大模型开发
Manus创始人季逸超在社交平台透露,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。Manus是由创业公司Monica发布的首款AI Agent产品,最近在社交媒体火爆出圈。
豆包又一技术开源
字节豆包大模型团队官宣开源一项针对MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。
“小米人形机器人CyberOne即将量产”消息不实
有消息称,小米机器人团队宣布,CyberOne正分阶段落地亦庄产线,并计划于3-4月公示量产进展,4-5月开放参观,下半年做PR宣发。据《科创板日报》记者获悉,前述消息不属实。
阿里研究院:DeepSeek是对开源大模型价值的强有力支持
阿里研究院3月10日发表观点文章称,DeepSeek以相对较小成本实现高性能大模型的发展创新,不仅证明了人工智能技术发展路径的多元性和动态性,更重要的是推动开源大模型发展实现了新的跃迁。
在DeepSeek之前,围绕人工智能是否应开源的争议日趋激烈,在此背景下,DeepSeek是对开源大模型价值的强有力支持:正是站在LLaMa、千问等开源大模型的基础上,DeepSeek通过更巧妙的工程设计挖掘了大模型的内在潜力、实现了性能上的超越。但另一方面,如果开源需要真正成为大模型的主导性发展模式,不可回避的另一重要问题仍然是开源大模型风险治理的改革,即我们能否创新开源治理机制以回应大模型开源后所可能引发的风险担忧。
字节对MoE模型训练成本再砍一刀,成本可节省40%
字节豆包大模型团队官宣开源一项针对MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据悉,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。