9 条新鲜资讯
5 个有用工具
2 个有趣案例
4 个鲜明观点本周,OpenAI 高管参与了一场 Reddit AMA 活动。Altman 表示,由于模型的复杂性和计算资源的限制,OpenAI 无法像预期那样同时推出多项产品,团队目前的工作重点主要是推出 o1 及其后续版本。据他透露,OpenAI 今年不会推出名为 GPT-5 的产品,但公司仍计划在 2024 年底推出一些优秀的产品。OpenAI 首席产品官 Kevin Weil 则表示,o1 模型的完整版本将很快面世。有趣的是,这几天,完整版 OpenAI o1 模型也疑似提前遭到泄露,接下来让我们来看一下会有哪些大的改进:完整版 OpenAI o1 模型最大的亮点或许在于新增视觉识别功能。比如 X 网友 @legit_rumors 让其描述图片信息,它能准确指出这是与「Bing」进行聊天对话的截屏,并展开描述具体的细节。再比如 X 网友 @anaghnairr 分别向 OpenAI o1 与 GPT-4o 甩出了一道三角形图像题,OpenAI 思考 1 分 39 秒得出了答案。X 网友 @op7418 测试了一道高中数学联赛的几何题,结果模型轻松地给出了正确答案。面对高中奥赛数学题,Claude 3.5 和 o1-preview 都无法正确解答,而该模型也答对了。X 网友 @ananayarora 在体验后则表示,o1 完整版不仅可能具备处理和理解图像内容的能力,在处理请求时的速度非常快,能够迅速给出响应。泄露后不久,OpenAI 很快终止了该模型使用权限。同期,OpenAI CEO Sam Altman 在 X 平台发文称:「我听说 o2 在 GPQA 评估中得到了超过满分的表现,达到了 105%。」🔗 https://x.com/sama/status/1852781569775485117
➕ 阿里公布姜萍事件调查结果 ,竞赛老师违规提供帮助刚刚,2024 阿里巴巴全球数学竞赛获奖名单正式公布。
本次竞赛共有 86 名选手获奖,其中金奖 5 名,银奖 10 名,铜奖 20 名,优秀奖 51 名。
针对姜萍事件,阿里达摩院发布情况说明。
在本届竞赛中,江苏省涟水中等专业学校教师王某某和其指导的学生入围决赛,引发社会关注。根据决赛阅卷结果,二人未获奖。
据调查了解,王某某在预选赛中对其指导的学生提供帮助,违反了预选赛关于「禁止与他人讨论」的规则。这也暴露出竞赛赛制不够完善、管理不够严谨等问题。
对此,阿里达摩院表示诚挚的歉意。
阿里巴巴全球数学竞赛作为一项旨在为数学爱好者提供交流平台的民间赛事,组委会将认真听取各方的批评和建议,吸取教训,优化规则,让竞赛活动更加规范。欢迎社会各界继续关心、支持和监督。
🔗 https://damo.alibaba.com/events/32024103017302751632776529?language=zh
🔎 OpenAI 上线 ChatGPT AI 搜索功能OpenAI 终于推出 ChatGPT search 功能。该功能先上线付费版 ChatGPT Plus 和 Team,未来几个月内面向所有免费用户,但预计会有次数限制。该搜索模型为 GPT--4o 微调版本,后训练得到 o1--preview 输出支持。ChatGPT 可根据用户询问搜索网络,用户也可手动搜索。提供天气、体育比赛、股票、地图等搜索信息。聊天中包含新闻报道等来源链接,点击来源按钮可打开包含参考资料的侧边栏。此外,后续 OpenAI 还宣布,ChatGPT 的高级语音模式现已登陆 Windows 和 Mac 平台。🔗 https://openai.com/index/introducing-chatgpt-search/近日,引起广泛关注的神秘模型 red_panda 身份终于揭晓。该模型实际上是由英国 AI 初创公司 Recraft AI 推出的最新图像生成模型 Recraft V3。据悉,Recraft V3 以其强大的长文本图像生成能力而著称,不再局限于单个或少量词语的图像生成。用户可以精确控制文本大小和位置,从而创建专业品质的视觉效果,特别适用于品牌推广、营销以及复杂的图形设计领域。此前,该模型以 red_panda 的称号在 Artificial Analysis 排行榜上拳打 Midjourney,脚踢 Flux,以 1172 的 ELO 评分遥遥领先。现在,用户可以通过访问 Recraft 的官方网站体验 Recraft V3 模型。🔗 https://x.com/recraftai/status/1851706399631224939据外媒 The Information 报道,Meta 为减少对 Google 和微软的依赖,正在开发一款 AI 搜索引擎。该搜索引擎将在 Meta AI 聊天机器人中提供由 AI 生成的时事搜索摘要。Instagram 和脸书内置的 Meta AI 机器人,目前还在使用 Google 和微软必应,来回答有关近期新闻和事件的问题。报道称 Meta 早在 8 个月前组建了专门的团队,通过网络爬虫收集了大数量网页数据,并为这个聊天机器人建立了一个信息数据库。上个月,Meta 还宣布与路透社达成了一项多年协议,允许其聊天机器人在回答问题时使用路透社的新闻文章。🔗 https://www.theinformation.com/articles/meta-develops-ai-search-engine-to-lessen-reliance-on-google-microsoft🍎 iOS 18.1 正式发布,Apple 智能同步上线苹果本周宣布面向用户推送了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1。此次推送的系统中,包含了第一波 Apple Intelligence 功能。目前,用户可以享受的 Apple Intelligence 功能有:写作工具、通知摘要、Siri 的新视觉更新、照片增强功能等等。可使用 Apple Intelligence 功能的设备包括:iPhone 15 Pro、iPhone 15 Pro Max、iPhone 16/Pro 系列,以及所有带有 M 系列或 A17 Pro 芯片的 iPad。不过,想要使用 Apple Intelligence 功能,用户需要将设备的语言及 Siri 语言设置为美式英语。苹果表示,更多的 Apple Intelligence 功能将在 12 月推出。那苹果 AI 完全体好用吗?我们也用一台港版 iPhone 体验到了🔗 https://mp.weixin.qq.com/s/Ixx\_ln-Dzfyx4dQiA4C2BA开源促进会(OSI)本周在 All Things Open 大会上发布了开源 AI 定义(OSAID)1.0 版。根据新的定义,一个 AI 模型若要被视为开源,需要满足以下条件:披露有关训练数据的相关详细信息,包括来源和处理方法据悉,这一版本经过与学术界、工业界和开源社区两年的合作,旨在为评估 AI 系统是否真正符合开源提供标准。值得一提的是,新定义明确开源 AI 模型需提供设计信息、披露训练数据、允许无许可使用等要求,还涉及训练数据的争议问题。与此同时,该组织认为诸如 OpenAI 和 Meta 等 AI 公司的公开发布的产品并未达到 OSAID 的评级。🔗 https://thenewstack.io/the-open-source-ai-definition-is-out/👀 曝 OpenAI 将与博通台积电合作打造首款芯片路透社独家报道,OpenAI 正在与博通公司以及台积电进行合作打造首款芯片,计划于 2026 年推出。芯片将用于处理自家大量的 AI 任务,特别是推理工作的负载。据报道,OpenAI 组建了一个大约 20 人的芯片团队,其中包括曾经负责 Google Tensor 处理器的工程师。除了自研芯片的进展,OpenAI 也将计划在微软 Azure 云服务中使用 AMD 的 AI 芯片,同时也会继续使用英伟达芯片来满足更多基础设施的建设需求。有消息人士透露,OpenAI 对是否要从英伟达处挖角人才持谨慎态度,因为这家公司希望能继续和英伟达保持良好的合作关系。目前英伟达的 GPU 占据了超过 80% 的市场份额,但由于供给短缺和成本的上升,导致微软、Meta 和 OpenAI 等 AI 公司正在探索解决方案,例如自研或者寻找其他合作伙伴。🔗 https://www.reuters.com/technology/artificial-intelligence/openai-builds-first-chip-with-broadcom-tsmc-scales-back-foundry-ambition-2024-10-29/近日,《时代周刊》(TIME)揭晓了「2024 年度最佳发明」榜单。在 AI+机器人领域,Google DeepMind 的 AlphaFold 3、Runway 的 Gen-3 Alpha、Google 的 NotebookLM、Figure 02 机器人、Digit 机器人入选该榜单。值得一提的是,在消费电子领域,荣耀 Magic V3 凭借最薄的可折叠手机和华为 Mate XT 非凡大师三折叠屏同时上榜。🔗 https://time.com/7094584/huawei-mate-xt-ultimate-design/AI 初创公司 Anthropic 旗下 AI 聊天机器人 Claude 推出了桌面应用程序。用户可以在官网上免费下载 Mac 和 Windows 版本,目前仍处于测试阶段。Claude 桌面应用和网络版本没有太大区别,用户可以正常进行提问,访问聊天记录,并查看收藏的对话。除了桌面客户端,Anthropic 也正在向 Claude 的 Android 和 iOS 应用推出对听写功能的支持。此外,Claude 现在除了可以查看文本外,还能查看 PDF 中的图像。这意味着,Claude 3.5 Sonnet 将更准确地理解复杂文档,比如带有图表或图形的文档。🔗 https://x.com/AnthropicAI/status/1852393688451653849Physical Intelligence 公司开发了名为 π0 的通用机器人基础模型。π0 使用互联网规模的视觉语言预训练、开源机器人操作数据集和自有数据集进行训练,能执行各种任务,通过零样本提示或微调适应新任务。作为一个 3B 参数的大模型,它能够控制机器人,自主执行诸如折叠衣物、清理餐桌和组装盒子等家务,甚至适用于不同种类的机器人。从预训练的视觉语言模型继承语义知识和视觉理解,π0 通过流匹配方法为模型增加连续动作输出,实现高频灵巧控制,适用于复杂机器人操作任务的微调。据悉,Physical Intelligence 公司 CEO 曾担任 Google 大脑机器人操作研究主管一职,而包括 OpenAI 在内的 6 家公司参与了今年的 A 轮融资。🔗 https://www.physicalintelligence.company/blog/pi0本周,Etched 和 Decart AI 联手推出全球首款 AI 实时生成游戏 Oasis。Oasis 每帧由扩散模型实时预测,以 20 帧每秒速度渲染且零延迟,代码和模型权重开源。该游戏体验独特,内容能够随玩家行动实时塑造,但也存在一些问题,比如鼠标操控困难、文字显示不清等。Oasis 技术基于 Transformer,由空间自编码器和潜在扩散模型结构组成,采用 Diffusion Forcing 训练方法,在性能上有优势,能以较快速度生成实时输出。Etched 是硅谷 AI 融资神话,2022 年两位 00 后创始人退学创业开发专用芯片 Sohu,今年 7 月发布且完成 1.2 亿美元 A 轮融资。Decart 则是一家以色列公司,推出 Oasis 同时获 2100 万美元融资,此前主要提升大模型速度和可靠性。🔗 https://www.etched.com/blog-posts/oasis🥳 Gen-3 Alpha Turbo 推出精确相机控制功能继发布 Act - One 后,Runway 为 Gen-3 Alpha Turbo 模型推出精确相机控制功能。该功能可让用户以六种方式控制相机运动的方向和强度,包括水平移动、绕拍主体、快速缩放、缓慢滑动等。每种运动类型可微调,还能与文本提示协同工作,确保相机移动时 AI 生成的场景内容一致。目前,相机控制功能已在 Runway 网络界面上线。🔗 https://www.maginative.com/article/runway-adds-precise-camera-controls-to-gen-3-alpha-turbo/微软再次推迟 Copilot Plus PC 的 Recall 功能推出。Recall 功能可以使用内置的本地 AI 模型来记录用户在电脑上看到或做的几乎所有内容。用户可以通过一个可探索的时间轴查看这些快照,回顾特定日期的活动。多次推迟原因包括完善安全问题、使其成为可选体验及允许用户完全卸载等,如确保 Recall 数据库完全加密等。此外,本周早些时候微软再次澄清 Recall 在 Copilot Plus PC 上非强制,可完全删除。🔗 https://www.theverge.com/2024/10/31/24284572/microsoft-recall-delay-december-windows-insider-testing「妙刷」可以给我们上传/拍摄的每张图片配上文案,每张都很有梗,有些像之前走红的汉语新解。另外,「妙刷」还有一些风格滤镜,包括万圣节、萌趣风、像素风、诺贝尔画像风等。比如,我随手上传了一张苹果本周发布的新款 Mac mini,效果如下:📀 Midjourney +Runway→单词素描动画Midjourney 和 Runway 的结合或许是不错的选择,比如轻松地将简单的单词草图转化为动画。首先,你需要构建一个有效的 Midjourney 提示词:
technical sketch drawing of the word(s) "[insert word(s)]", pencil sketch work, cad, --ar 16:9 --stylize 50 --v 6.1请注意,[insert word(s)]是你想要动画化的单词或短语。然后,使用 Runway ,你可以添加动态效果,使静态的草图动起来。Runway 提示词:
sketch drawing of the word "[insert word(s)]", starting with a blank page and being created line by line🔗 https://x.com/Ror\_Fly/status/1837871329720115455⬆️ 孙正义:2035 年有望实现「超级 AI」,英伟达股价「被低估」当地时间 10 月 29 日,软银 CEO 孙正义在沙特阿拉伯利雅得的会议上重申对超级人工智能(ASI)到来的信念,称其智能程度将比人脑聪明 10000 倍。他坚信且 ASI 将在 2035 年到来,而实现它需数千亿美元投资。其中,孙正义还预测未来生成式 AI 在数据中心和芯片方面将需要 900 万亿美元累计资本支出,并认为英伟达当前的市值被低估。孙正义透露正在筹集资金,为下一步「重大行动」做好准备。作为补充,今年 6 月,他曾在软银年度股东大会上懊悔过早清仓了英伟达股票,导致错失了高达 1500 亿美元的潜在收益。小罗伯特・唐尼最近在参加一档播客节目时,明确拒绝自己被人工智能「复制」。他态度强硬地表示,漫威高管不会用 AI 重现他对钢铁侠这一角色的刻画。我并不担心他们劫持我角色的灵魂,因为反正有三四个男人和女人在那里做所有的决定,无论我在不在,他们都永远不会那样对我。当被问及漫威高管未来也会被替换时,小罗伯特・唐尼给出的方案是,即便自己未来去世,也会让律师按照规范起诉漫威高管。🍽️ Linux 之父:AI 市场现状= 90% 营销+10% 现实Linux 之父 Linus Torvalds 在维也纳开源峰会上接受采访时表示,AI 虽然非常有趣且会改变世界,但目前 AI 市场现状是 90% 营销和 10% 现实。他认为围绕 AI 的整个科技行业处于糟糕境地,目前的解决方案是忽略 AI,直到其变得强大和个性化到足以发挥作用。Torvalds 认可 ChatGPT 等在特定用例中的有用性,但认为 AI 更广泛的应用仍有限,不过他对五年后的 AI 发展持乐观态度。峰会上,他建议技术工作者避免被感觉像随波逐流的行业趋势左右,从而专注于可以真正实现的有意义的创新。本周,ICPC 北京总部官网公布任正非与 ICPC 主席、教练及获奖选手座谈会纪要。任正非在这次座谈会上表示,世界走向人工智能的潮流是不可阻挡的。由于芯片、算力……各种技术的发达,促进了智能时代的到来,就像英国发明了火车、纺织机械、轮船一样,它产生了时代的转折点。现在这个时代的转折点是人工智能的应用。如果有机会去参观中国的天津港,从装船、运输、堆垛,包括通过海关,一百多平方公里的土地上,几乎没有一个人。炼钢是很苦的,火很烤,现在炼钢炉前没有人,轧钢机前也没有人;以前要舀出钢水来检验钢铁的成份,现在戴眼镜就可以判断钢水是否合格。说到煤炭,几百多米深的地下,可以用人工智能挖煤了。同时他也表示,未来进入信息世界,需要更高的哲学层面来研究世界的实现。我对人工智能不了解,尤瓦尔·赫拉利说会产生灵魂,他的书太超前了,讲的是两千年以后的事情,可能是说人工智能会产生智慧灵魂。如果人工智能可以自我再造的话,我们人类怎么办?前沿到底前到哪里去,我不知道。但我认为,三十年内不会出现,还是要靠人来创造这个世界,只是用人少了。