当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。

因受到DeepSeek人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。
据悉,DeepSeek应用程序已取代竞争对手OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且设计成本不到600万美元。
分析称,DeepSeek推出的低成本人工智能模型可能会使推动牛市的科技估值难以为继。

当地时间1月27日, DeepSeek团队正式发布两款多模态框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。
JanusFlow是一款通过生成流(Rectified Flow)与自回归语言模型融合实现统一的框架。它不仅在理解任务中表现优异,还能生成高质量图像,展现了框架设计的极简与强大。北京时间1月28日凌晨,就在美国科技股暴跌之际,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态人工智能模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。页面显示,Janus-Pro是一种新颖的自回归框架,统一了多模态的理解与生成。它通过将视觉编码分离为独立的路径,解决了以往方法的局限性,同时仍然采用单一的统一Transformer架构进行处理。视觉编码的分离不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还提升了框架的灵活性。Janus-Pro不仅超越了之前的统一模型,还能匹配或超越任务专用模型的性能。其简单性、高灵活性以及高效性使Janus-Pro成为下一代统一多模态模型的有力候选者。Janus-Pro是一款统一理解与生成的多模态大语言模型(MLLM),通过对多模态理解与生成的视觉编码进行解耦来实现功能。Janus-Pro构建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入。在图像生成方面,Janus-Pro使用了来源于此的分词器(tokenizer),其下采样率为16。