苹果发布VisionPro!AI辅助的哈佛计算机课;Google生成式AI课程;AWQ让模型更小更快|Daily Summary

图片
图片
产业资讯
 Apple在WWDC23上正式发布空间计算设备 Vision Pro
刚刚 Apple 在 WWDC23 上发布了最新的空间计算设备 ——Vision Pro!借助 Vision Pro,你将拥有无限的画布,可以改变使用 App 的方式,将 App 安排在任何地方并将它们缩放到完美的大小,让梦想中的工作空间成为现实——同时让你置身于周围的世界中。在 Safari 中浏览网页,在备忘录中创建待办事项列表,在信息中聊天,一眼就能在它们之间无缝切换。
哈佛教授利用 AI 辅助教学全球最受欢迎的在线计算机课程
哈佛的CS50计算机科学入门课程计划使用 AI 来评分作业、教授编码并个性化学习建议。尽管拥有100多名真实的助教,但与来自世界各地的日益增长的学生完全互动已变得困难。教学团队正在为该课程调整 AI 系统。团队希望该 AI 系统能让人类助教有更多时间进行面对面或基于Zoom的办公时间。
英伟达 Voyager 机器人借助GPT-4解决Minecraft问题
Nvidia的一个团队创建了一个名为Voyager的机器人,它使用GPT-4来解决Minecraft中的问题。该机器人使用GPT-4生成目标和代码,帮助代理探索游戏并提高其技能。它通过API直接看到游戏的状态,所以它的游戏方式并不完全像人类。Voyager能够建立一个代码库,随着时间的推移学习游戏。它的表现比其他类似的 AI 代理要好得多。Voyager展示了语言模型在计算机上执行有益行为的巨大潜力。
苹果正在寻找生成式AI工程师
苹果正在呼吁在生成式 AI 方面有经验的专家,与该公司的“最先进技术”一起工作,包括增强现实和虚拟现实等。这是苹果发布的新工作列表。
图片
工程研究
AWQ:让大型AI模型变得更小更快
本论文介绍了激活感知权重量化(AWQ),一种更高效地压缩大型语言模型(LLM)的新方法,克服了硬件需求高、令牌生成速度慢的问题。AWQ有选择地保护模型中最重要的权重,可以更好地泛化到不同领域,并且在性能上超越了现有的方法,实现了更快、更高效的模型部署。
Brainformer:以效率为代价的简洁性
Transformers 是强大的模型,是近年来 AI 成功的基石。它们遵循一种相对简单的方法,交替使用全连接和注意力块。谷歌的团队利用遗传搜索算法和大量的TPU,找到了一个模型,收敛速度比传统模型快5倍,推理速度提升2倍,它使用了MoE(Mixture of Experts)块和其他一些巧妙的技巧。
ArtGPT-4的崛起及其艺术视觉
AI 的最新进展导致了ArtGPT-4的诞生,这是一个新的语言和图像理解模型,专门用于理解和创建艺术图像。尽管模型规模较小且需要的数据较少,但在艺术图像的理解和创作方面表现出色,在某些测试中甚至接近人类艺术家的水平。
BlendFields:面部建模的新方法
创建逼真的人脸可视化是一项复杂的任务,需要捕捉到大大小小的细节。一种受传统计算机图形学技术启发的新方法已经被开发出来,通过使用少量的极端姿势来准确建模看不见的表情,然后将其应用于新的表情中,从而产生更精细、更逼真的面部细节。
图片
效率资源
Google的生成式AI课程
尽管领域发展迅速,生成式机器学习的基础已经相当成熟。这门由9个部分组成的课程涵盖了该领域的很多内容。最终目标是将新用户引入他们的ML云产品Vertex。即使如此,对于希望更深入了解这项技术的人来说,这里仍然有很多有用的信息。
Poe - Midjourney Bot
这是一个简单的 AI 应用,可以帮助改善Midjourney的提示。
Zeda
Zeda是一款旨在提高客户团队产品发现能力的 AI 工具。
StyleDrop
StyleDrop通过使用单个参考图像,提供了任何风格的文本到图像生成功能。它是DreamBooth研究的下一个步骤。
图片
延伸阅读
Stable Diffusion创始人夸大其词的历史
对Stable Diffusion创始人Emad Mostaque过去夸大其词的声明进行深入调查。
AI写的代码对公司来说是好还是坏?
生成式AI编码工具承诺为开发人员带来巨大的效率提升,但一些技术领导者担心产生过多的代码过快可能带来的后果,因为降低了代码创作的门槛,可能导致日益复杂的程度、技术债务和混乱,使他们难以管理不断增长的软件堆栈。
扫码获取资讯链接 
图片
图片
图片
图片
图片
图片