我们让这些 AI 大模型推选了 “2024年10大AI产品”

作者Jimmy
来源AI先锋官

眼瞅着2024已经接近尾声了,各家公司也是趁着年关岁末,把自家的新产品纷纷拿了出来,给各位看的那叫一个眼花缭乱。
下面小编就本着看热闹不嫌事大的原则,让各家公司的当家大模型评选出年度十大AI产品,看看ai怎么总结这一年自家圈子的产品。
我们分别向ChatGPT,文小言,豆包,Kimi,通义千问,Gemini投喂了下面的问题
“请总结出你认为的2024年10大AI领域产品”
-下面有请1号选手,ChatGPT-

1. OpenAI ChatGPT Enterprise


特点: 专为企业设计的AI助手,提供增强的隐私保护、更高的性能,以及与公司内部工具集成的能力。

应用场景: 企业内部知识管理、客户服务自动化。


2. Anthropic Claude 3


特点: 高度注重安全性和对话质量,能够处理复杂的任务并生成上下文相关的回答。

应用场景: 高级自然语言处理、研究辅助。


3. Google Gemini


特点: 集成了Google搜索和生成式AI技术,具备多模态能力(支持文本、图像和视频输入)。

应用场景: 内容创作、搜索优化、生产力工具。


4. Meta Llama 3


特点 :开源的大规模语言模型,提供了高度可定制的AI能力。

应用场景: 开发者平台、学术研究。


5. MidJourney V6


特点: 专注于图像生成的AI平台,支持更高分辨率、更精细的艺术创作。

应用场景: 视觉艺术、品牌设计、影视制作。


6. Runway Gen-2


特点: 强大的生成式视频工具,可以从文本生成高质量的视频。

应用场景: 内容创作、影视后期。


7. Microsoft Copilot


特点: 集成于Office 365的AI助手,提供文档、电子表格、演示文稿的智能生成与协作功能。

应用场景: 办公自动化、团队协作。


8. Adobe Firefly 2


特点: 专注于图像和视频生成,集成于AdobeCreative Cloud,支持快速原型设计和创意增强。

应用场景: 平面设计、广告创意。


9. Hugging Face Transformers 5.0


特点: 更新了多语言支持和高效的模型优化技术,是AI研究和开发的核心工具。

应用场景: AI模型开发、学术研究。


10. Tesla Dojo Platform


特点: Tesla推出的AI超级计算机平台,为自动驾驶和机器人开发提供了强大的算力支持。应用场景: 自动驾驶、AI训练。



(向下滑动查看)


可以看出,ChatGPT的总结多聚焦于AI大模型方面,特别是生成式AI。
-下面是二号选手,文小言-

1. OpenAI o1模型:这款新一代大模型的核心亮点是引入了“强化学习+思维链”的训练架构,试图解决生成式AI长期以来在复杂推理上的短板。o1模型的出现无疑是划时代的,它指明了生成式AI的下一个发展方向,即智能不再止步于“生成”,而是迈向深层次的“学习”和“推理”。


2. 华为HarmonyOS NEXT:这款操作系统采用全栈自研架构,包括用鸿蒙内核完全替代Linux内核,不再兼容Android应用,标志着中国操作系统迈入全新阶段。它不仅实现了自主可控,还提供了一个面向万物互联的全新生态。


3. 荣耀MagicOS 9.0:该系统通过系统级AI——YOYO智能体,开启了手机“自动驾驶”时代。它采用了全新的四层AI架构,YOYO智能体具备了自然语义理解、用户行为习惯学习、意图识别及决策等核心能力,还能基于纯AI视觉驱动规划复杂任务,实现自主操作手机。


4. OPPO Find X7系列:这是全球首个部署端侧应用70亿参数大模型的AI手机,它的发布直接推动了智能手机行业迈入“AI手机”时代。Find X7系列不仅为用户带来了全新的交互体验,更引领了主流手机厂商风向的转变。


5. Sora:这是OpenAI推出的能将文字直接转化为视频的生成模型,它采用了类DiT(Diffusion+Transformer)架构,通过扩散模型完成视频生成,同时引入Transformer增强了文本与画面之间的关联。Sora的发布彻底改写了AI视频生成的技术路径。


6. 宇树科技G1量产版人形机器人:这款人形机器人高约127厘米,体重35公斤,可完成小跑、舞棍等复杂动作,甚至能精准做到开瓶、焊接等精细任务,且售价仅9.9万元,更加逼近消费者和中小企业可以承受的范围。


7. 文心一言:作为原生AI应用,文心一言逐渐普及,被AI重构到搜索、输入法、浏览器、支付、办公软件、电商等领域,从高高在上的技术工具真正融入到了每个人的学习、工作和生活中。


8. 科大讯飞T30 Pro:这款AI学习机搭载了全方位的学习健康系统,包括超大屏幕、类自然光&纳米类纸技术、坐姿检测系统等,可以最大程度降低对学生视力、体态的不良影响。同时,它还强化了AI在一对一辅导和学科精准学等方面的表现。


9. 小猿学练机:作为国内首个提出学练机概念的品牌,小猿学练机更加强调边学边练的学习过程。它采用了新一代电子墨水屏技术,以“0蓝光、0频闪”为核心打造新一代护眼屏,并凭借猿辅导多年积累的海量题库,在“学+练”的赛道上有着更好的表现。


10. 有道词典笔X7 Pro:这款词典笔接入了有道最新的“子曰”教育大模型,同时在硬件层面做了许多优化。它采用了4.1英寸的超大屏幕和3.2cm的超宽扫描笔头,支持一次扫描多行文字,配合后置摄像头可以同步拍摄图案、作文等题目素材。结合AI大模型的全学科解读能力,有道词典笔X7 Pro成为一款全科通用随身学习工具。


(向下滑动查看)




可以看到,文小言在生成式AI之外,更多青睐国产AI产品,也聚焦于智能终端,操作系统,当然,也包括自己在内。
-下面是三号选手,豆包-

OpenAIo1模型


9月12日推出,引入“强化学习+思维链”训练架构,能将复杂问题分解为逻辑清晰的步骤,解决生成式AI在复杂推理上的短板,开启了以强化学习为基础的AI进化新方向,推动全球大模型从单纯追求生成能力转向强化推理能力。


HarmonyOS NEXT


10月22日由华为正式发布,采用全栈自研架构,用鸿蒙内核完全替代Linux内核,不再兼容Android应用,摆脱了对Android的依赖,实现自主可控,为万物互联提供全新生态。


荣耀MagicOS 9.0


10月23日荣耀发布,采用全新四层AI架构,YOYO智能体具备自然语义理解、用户行为习惯学习等核心能力,可基于纯AI视觉驱动规划复杂任务,实现手机“自动驾驶”,推动手机操作系统进入智能化新阶段。


OPPO Find X7


1月8日OPPO发布,全球首个部署端侧应用70亿参数大模型的AI手机,带动主流手机厂商风向转变,引发行业“AI竞赛”,推动智能手机行业迈入“AI手机”时代。


Sora


2月16日OpenAI首次发布,12月正式面向公众开放,采用类DiT架构,能将文字直接转化为高分辨率视频,改写了AI视频生成的技术路径,推动行业全面转向融合Diffusion和Transform的架构设计。


MidJourney


作为2024年最受关注的AI绘画工具之一,可根据用户输入的文本描述生成高质量艺术作品,能激发创意并大幅缩短创作时间,支持多种艺术风格选择。


DALL-E 3


由OpenAI开发,通过深度学习技术,能从句子描述中生成各种风格的图像,在产品设计、品牌形象构建、个人艺术创作等领域表现出色。


Kimi探索版


专注于解决复杂的搜索问题,交互体验友好,用户可进行多种DIY玩法,更新频率高,具有较强的推理能力,能一次精读超过500个页面。


海螺AI


8月推出视频模型,生成质量和稳定性居第一梯队,图生视频功能便捷智能,在视频生成市场中表现出色。


智谱清言


基于中英双语对话模型chatglm2,经过大量预训练和有监督微调,具备通用问答、多轮对话、创意写作、代码生成等多种功能,能在多场景为用户提供智能化服务。

,引入“强化学习+思维链”训练架构,能将复杂问题分解为逻辑清晰的步骤,解决生成式AI在复杂推理上的短板,开启了以强化学习为基础的AI进化新方向,推动全球大模型从单纯追求生成能力转向强化推理能力。


HarmonyOS NEXT


10月22日由华为正式发布,采用全栈自研架构,用鸿蒙内核完全替代Linux内核,不再兼容Android应用,摆脱了对Android的依赖,实现自主可控,为万物互联提供全新生态。


荣耀MagicOS 9.0


10月23日荣耀发布,采用全新四层AI架构,YOYO智能体具备自然语义理解、用户行为习惯学习等核心能力,可基于纯AI视觉驱动规划复杂任务,实现手机“自动驾驶”,推动手机操作系统进入智能化新阶段。


OPPO Find X7


1月8日OPPO发布,全球首个部署端侧应用70亿参数大模型的AI手机,带动主流手机厂商风向转变,引发行业“AI竞赛”,推动智能手机行业迈入“AI手机”时代。


Sora


2月16日OpenAI首次发布,12月正式面向公众开放,采用类DiT架构,能将文字直接转化为高分辨率视频,改写了AI视频生成的技术路径,推动行业全面转向融合Diffusion和Transform的架构设计。


MidJourney


作为2024年最受关注的AI绘画工具之一,可根据用户输入的文本描述生成高质量艺术作品,能激发创意并大幅缩短创作时间,支持多种艺术风格选择。


DALL-E 3


由OpenAI开发,通过深度学习技术,能从句子描述中生成各种风格的图像,在产品设计、品牌形象构建、个人艺术创作等领域表现出色。


Kimi探索版


专注于解决复杂的搜索问题,交互体验友好,用户可进行多种DIY玩法,更新频率高,具有较强的推理能力,能一次精读超过500个页面。


海螺AI


8月推出视频模型,生成质量和稳定性居第一梯队,图生视频功能便捷智能,在视频生成市场中表现出色。


智谱清言


基于中英双语对话模型chatglm2,经过大量预训练和有监督微调,具备通用问答、多轮对话、创意写作、代码生成等多种功能,能在多场景为用户提供智能化服务。

(向下滑动查看)




豆包和文小言相比,在同样青睐国产AI产品的同时,也没忘了外国同行的产品,在生成式AI之外也纳入了智能终端和操作系统进来
-下面是四号选手,Kimi-

1.  阿里云AI产品:阿里云在AI相关产品收入持续五个季度三位数增长,全球领先。

2.  具身智能产品:具身智能逐渐从概念走向落地,玩家们纷纷推出自己的首款人形机器人。

3.  空间智能产品:空间智能指的是机器在三维空间和时间中感知、推理和行动的能力,将空间计算操控虚拟世界的本领和具身智能触达现实世界的能力结合起来。

4.  AI智能助手:AI智能助手是表现最突出的AI原生类产品,豆包取得了断层式领先。

5.  AI陪伴产品:虽然广受关注,但目前整体增长乏力,星野、猫箱等Top产品和Killer APP之间仍有相当距离。

6.  百度文库:百度文库全面升级为一站式AI内容获取和创作平台,整合百度网盘,让内容创作的门槛降至最低。

7.  支小宝:从AI金融助手到AI生活管家,支小宝正在基于蚂蚁百灵大模型,覆盖用户生活的方方面面。

8.  豆包:作为字节跳动推出的AI助手,豆包在尝试直接接入耳机、玩具、手机等硬件,为用户提供全天候、全场景的AI助手服务。

9.  ChatGPT:连续4个月保持10%以上增长,11月月活用户MAU达2.87亿,超过Twitter的一半。

10.  C.AI:角色扮演类AI应用在用户日均使用时长上依然领先,C.AI用户日均使用高达1个半小时,接近抖音用户日均时长。


(向下滑动查看)




Kimi与以上几位选手不同的是,Kimi似乎不太青睐生成式AI,对AI+领域,包括智能机器人,智能管家等产品情有独钟
-下面是五号选手,通义千问-

1. **Tome** - 自动生成PPT的高效工具,能够根据用户输入的标题或描述智能生成完整的演示文稿。


2. **Canva** - 结合AI技术提供智能设计建议,帮助用户轻松创建视觉作品,适用于社交媒体海报和商业宣传资料等。


3. **Grammarly** - 利用AI进行实时语法和拼写检查,为英文写作提供风格和语气建议,是提升写作质量的好帮手。


4. **Google AI** - 作为全能语音助手,它不仅能够帮助用户进行语音搜索、设置提醒,还能通过学习用户的习惯提供个性化服务。


5. **Jasper** - 市场营销人员的理想选择,利用GPT-3模型提供高质量文案写作建议,缩短内容创作时间。


6. **Kimi智能助手** - 被评为智媒体生态联盟2024年度“AI应用十大标杆产品/案例”之一,提供了智能化的生活辅助功能。


7. **每经AI电视智创传播平台** - 实现了一键成稿、10秒成片的高效创作,并在多个大型会议上展示了其强大的传播能力。


8. **星火快答** - 面向智能展示及数据快答场景的产品,可以通过人机对话的方式实现快速应用,如迎宾接待、品牌宣传等。


9. **派生万物开放平台-录音AI转写** - 支持实时和离线语音转写,准确地将录制的语音转换为文字,具有高准确率和多语种支持等特点。


10. **OpenAI/ChatGPT-4o** - 这款旗舰模型集成了视觉、听觉和实时对话功能,显著提升了多模态理解与生成的能力,以及响应速度。


(向下滑动查看)




阿里家的大模型,在回答中又把橄榄枝抛给了现在主流的生成式AI,和一号选手ChatGPT所见略同
-下面是最后登场的选手,Gemini-
1.自然言处理 (NLP)

 OpenAI ChatGPTEnterprise 

 提供企业级对话AI解决方案,增强隐私保护与团队协作。


 Anthropic Claude 3

 高效处理复杂对话任务,注重安全性和上下文理解。


 2多模态AI  


 Google Gemini 

 支持文本、图像和视频输入,广泛应用于搜索和内容生成。 

 

 Runway Gen-2

 从文本生成高质量视频,为创意内容制作提供突破性工具。


3 图像与设计AI


 MidJourney V6

 在艺术创作和品牌设计领域表现卓越,生成高分辨率图像。


 Adobe Firefly 2

 无缝集成于CreativeCloud,专注图像和视频生成的生产力工具。


 4开源与开发者工具 


 Meta Llama 3 

 领先的开源大语言模型,助力开发者构建AI应用。


 Hugging Face Transformers5.0  

 支持多语言和模型优化,是AI开发和研究的核心工具。


 5. 办公与生产力AI  


 Microsoft Copilot 

 集成Office365,实现文档、表格和演示的自动生成与优化。


 6. 自动驾驶与高性能计算 


 Tesla Dojo Platform

 AI超级计算平台,专注于自动驾驶与AI模型训练。

(向下滑动查看)




Gemini选手的回答则要天马行空一些,不仅按领域划分了AI,也加入了前几位都没有提到过的智能驾驶系统

看了上面各家选手的回答,相信各位心中差不多已经有了自己的答案。

那下面小编就来说说自己心目中的2024年度10大AI产品

1. 谷歌 Veo 2
Veo 2 是 Google DeepMind 开发的最新文本到视频生成工具,能够生成高质量的短视频(最高支持4K分辨率),以真实的动作模拟和视觉细节著称。相比前代,Veo 2 在镜头角度控制、动作自然度和风格多样性方面有显著改进,适用于电影制作、内容创作等
2. 英伟达 Jetson Orin
Jetson Orin 是英伟达推出的边缘计算平台,专注于机器人、无人机和物联网设备的 AI 应用。它搭载高性能 GPU 和支持多种神经网络框架,可处理计算密集型任务,例如实时视频分析和自动驾驶算法 
3. 亚马逊 “Q” 大模型
亚马逊 Q 是一款面向企业的超大规模 AI 模型,擅长自然语言处理和生成。其核心功能包括智能客户服务和文本内容创作,整合了 AWS 云生态,以便企业灵活部署
 4. 谷歌量子芯片
谷歌的最新量子芯片专注于解决复杂的计算问题,其在材料科学和优化算法方面表现卓越。量子芯片的推出标志着计算能力的重大飞跃,尤其适用于 AI 模型训练和数据分析
 5. 谷歌DeepMind GenCas
DeepMind 开发的 GenCas 是一种基于扩散模型和Transformer架构,能高效处理多种气象数据的大模型。在生成预测时,它采用集合预测方法,即提供一组略有不同的预测结果,帮助科学家评估天气事件的概率。这种方法优于传统单一预测模型,在精度和灵活性上均有显著提升
6. 特斯拉 Robotaxi
Robotaxi 是特斯拉推出的全无人驾驶出租车,基于其先进的自动驾驶系统和AI芯片,可实现完全自主的城市交通服务。这款产品展示了AI在智能交通领域的前景 
ChatGPT-o3 是 OpenAI 最新推出的 生成式AI 聊天工具,以生成更自然的对话和更复杂的多轮问答能力为特点,适用于教育、商业沟通和个性化助手
8. 宇树科技 B2-W 全地形机器狗
B2-W 是宇树科技推出的一款全地形轮足机器人,结合轮式和足式移动模式,可用于勘探、物流和搜救任务,展现了机器人技术的新高度 
 9. 可灵AI大模型
可灵AI大模型是快手AI团队自主研发的视频生成大模型,于2024年6月6日正式上线,可灵大模型能够生成大幅度的合理运动,模拟物理世界特性,如光影反射、流体运动等,这使得生成的视频更加逼真、生动。
10. Sora
Sora 是一款高性能的 AI 驱动视频生成平台,专注于实时创作和高质量视频生成,适用于教育、娱乐和内容创作
看完了小编心目中的2024年度10大AI产品,也欢迎各位把自己心目中的2024年度10佳AI产品打在评论区,小编和大家一起交流。


 .END.

往期文章回顾