写新闻、写影评、写论文、写诗歌、写代码、写策划、写报告……
ChatGPT 太全能了!
更厉害的是,它可以007,可以不休息,没有病假产假和年假,它自律、高效、每分每秒都在学习。
那么……有多少人的工作要被取代了呢?
万氪高科技行业研究小组联合外部智囊团告诉你,AIGC 已经走进了哪些产业领域。
AI ,是工作的掠夺者?还是新工种的创造者?
#1
研发
写代码
前段时间,一篇名为“ChatGPT 通过谷歌 L3 工程师入职测试”的稿子,让ChatGPT首次大规模出圈。微软投资、OpenAI 发布的 ChatGPT 去年底爆红后,“传统搜索引擎要亡”的言论甚嚣尘上,搜索巨头谷歌也拉响了“红色代码”警报,内部正在进行各种开发测试,应对这个看起来可能是几十年来谷歌价值 1490 亿美元搜索业务的第一个显著威胁。
我们先来看看ChatGPT自己是怎么看待这个事情的:
看起来还蛮乖的哈~
那么ChatGPT的代码水平到底如何呢?我做了两个简单的测试:
第一个是让它编写一个俄罗斯方块游戏的代码测试。
第二个问题:如何用rust生成一个无重复的随机整数集合。该问题是leetcode的第一题,号称算法中的hello world,也可以理解为考研单词中的abandon~
经过测试,我发现它不仅会答,且可以通过刷新得到不同思路的解答~
看到这里,我们可能会有一种感觉:算法工程师是不是要被取代了?或者说初级算法工程师是不是要被取代了?于是我又想到用一些目前算法领域比较难以解决,或者没有解决的问题去考一下它。于是我请教了一位算法朋友,他建议我提问ChatGPT如何精确求解三维装箱。
看了ChatGPT的代码后,我朋友是这样回复我的:
看样子ChatGPT所谓的“写代码”能力就是集成大搜索引擎的一个“小偷”。它仍然没有能力去解决那些业界里难以解决的问题。算法工程师们短期内不需要担心自己的失业问题了~
编写测试用例
我们以自己动手部署一个微信(or公众号)聊天机器人为例。(该用例的部分理论及内容参考引用了Ai赋能指南以及部分研报~)
概念理解:所谓的"部署ChatGPT"是指在服务器/电脑上安装一个微信消息处理服务,作为用户和ChatGPT官方之间沟通的桥梁纽带。它可以将用户的提问通过映射传递给ChatGPT官方,并在收到回答后自动回复给微信用户。通过部署ChatGPT,我们不仅可以制作一个回复消息的小机器人满足自己的乐趣,也可以有其他很多应用场景:如社群运营的小伙伴可以让机器人代替我们回复绝大部分的问题等等。
前期准备
1.注册一个ChaiGPT账号
2.一个实名认证后的微信号/公众号
3.一台可以部署代码的电脑
(节点非大陆、香港、台湾)
4.从代码仓库—chatgpt—on—wechat 下载代码
5.从ChatGPT后台获取API Key,流程如下
第一步:挑逗一下ChatGPT~
第二步:在自己的openai主页里找到API Keys。单击Create news secrect key即可获得API key。
6.定制机器人聊天配置
打开4.中下载的压缩包,open_ai_api_key配置项必须修改,改为上文提到的API Key其他配置项可选
7. 安装及启动(Mac)
下载Python安装包并搜索Mac中的终端。
执行以下命令
8.注意事项:目前通过微信部署机器人有账号被限制风险,最近几乎两小时筛查一批!建议使用小号部署,以免影响正常的工作和生活。
回答问题
ChatGPT 在网络上很一下火到出圈,各大社交平台上充斥着大量的无厘头问题和巧妙的答案。如“谁才是湖北第一高校”、“中国top3的大学是哪三所”之类的问题。
//(浙大复旦dbq)
//(武大dbq)
足以看出在特定语境中,ChatGPT 的回答非常出色,对于封闭域和具有确切答案的问题也能表现得十分流利。然而,ChatGPT 的优势在于基础性问题,对于人类具有的认知、动机、情绪、判断、决策和预测等能力,人工智能仍然存在难以克服的技术瓶颈。
在回答一些常识性问题时,ChatGPT 能够给出高质量的答案,让人们为其的准确性和流利的语言称赞不已。甚至对于一些常见的情感问题,它也能提供详细的解决方案。
但是,众所周知,目前的ChatGPT有一个明显的短板就是无法回答2021年9月之后的问题。由于训练ChatGPT的语料是既往网页中的数据,这也注定让它无法回复时效性特别高的问题。它或许能够告诉你乔丹的职业生涯中一共打进了多少粒进球,但是却无法回答你詹姆斯是在哪一天成为了历史得分王。
可以看出,关于乔丹的问题它回答的很好,但是关于詹姆斯的问题它就在一本正经的胡说八道了,东拼西凑出来一个错误答案。
那么有没有办法可以解决这个问题呢?有!且有两种办法,第一种我们可以给他安装一个浏览器插件!它可以让你在于ChatGPT对话时同步收集互联网信息,帮助生成具有时效性的回答。第二种其实就是把学术模型产品化~会在推荐内容部分详细介绍。该插件的核心原理是读取和指引。先通过插件预设的能力,读取搜索引擎多条搜索结果,提取对应问题的信息片段,再通过合适的prompt,指引 chatGPT根据这些信息片段进行文本分析,从而回答你提出的问题。
注意事项 提问语言:强烈建议使用【英文】提问,因为插件数据来源大概率是外文引擎,因此想要有高价值的原始数据,英文提问的准确率、效率更高。
明辨是非:生成的内容具有欺骗的可能性,请自行批判筛选信息。
综上:少问充满主观臆测的问题、少问专业性知识极强的问题、少问实时性太高的问题,即是用好 ChatGPT的基本前提。
推荐内容
在考虑到把ChatGPT产品化,或者尝试让他去给我们做一些推荐和指引时,我们往往会遇到一个很严重的问题:这东西数据和信息不准啊!(也包括实效性较差)。我们就需要重新搜索一次,甚至多次,效率岂不是大大降低?
// 在汉口跳舞明显就是它在胡说八道~
那么,工业界的产品如何才能把学术界的模型完美融合呢?(部分内容参考新智元~)
比如如何解决ChatGPT经常胡说八道给出一些无厘头的回答这种情况呢?微软和谷歌最近都在尝试做这件让搜索引擎大地震的事情。(New Bing最近就在做这件事)
刚刚结束的谷歌发布会,透着一股「赶鸭子上架」的味道。不仅毫无亮点,效果拉跨,Bard还被爆出存在事实性错误,发布会一结束,谷歌的股价直接一泻千里,开盘即暴跌8%,市值蒸发1020亿美元。
而微软发布了由加强版ChatGPT提供支持的全新搜索引擎必应Bing和Edge浏览器,发布会上一通操作秀到谷歌没眼看,市值也在一夜间涨超800亿美元。微软首席执行官Satya Nadella甚至在发布会上激动地表示「这是搜索的新时代」(This is a new day for search)。
其实原理并不难理解,ChatGPT拥有极强的算力、信息处理、信息认知能力。而Bing拥有时效性很高的大量信息流。我们只需要用产品化的流程把两者用映射关系串联起来,就可以实现。
我们先在Bing上搜索一件事情,Bing会先用自己的搜索引擎得到一个庞大的信息数据库。我们可以简单的设置它只读取2021年9月之后的数据,把这些数据通过某种映射方式传递到ChatGPT的数据库中。ChatGPT就会综合所有数据,整理之后给你一份有时效性、逻辑性的较为准确的答案。
#2
客服
海外目前对话机器人领域领先的公司为Character.ai,可以自定义或使用模板来定义角色的家庭、职业、年龄等,在此基础上保持一贯的设定和符合设定的对话风格。
客服领域的对话机器人如今还未成熟。主要出现的问题有二:其一,客服、销售行业遇到的客户往往情绪状态不稳定,AI 难以对情绪进行适应并调整对话内容;其二,AI 的多轮对话能力较弱,无法保证持续有效的跟进问题。
对于国内智能客服企业而言,大模型最直接的成本便是能源成本(energy cost),GPT-3 发布时的训练成本在千万美元级别。难以在短期内衡量 ROI ,因此目前大科技公司才能训练大模型。同时。大模型有明显的先发优势,来自巨大的隐形成本:智能成本。前期快速积累用户反馈数据能帮助模型持续追新优化,甩开后发的竞争者,达到模型性能的规模效应。AI 的进化来自于数据的积累和充分吸收。深度学习,乃至当前的所有机器学习都是基于历史预估未来,基于已有的数据给到最接近真实的可能。
在国内智能客服领域,除了网易七鱼、腾讯企点等背靠头部互联网公司的几家客服公司,其余公司的收入规模普遍在1亿左右,利润较低甚至常年处于亏损状态。加之客户数据隐私、政策对于外呼的限制等因素影响,导致诸多上市客服企业,如天润融通、容联等公司的收入结构多为号码费、流量费和本地部署费用,SaaS软件的占比不断下降,也致使这部分传统的智能客服企业面对AIGC时显得力不从心。
对于模型供应商而言,AI 计算的需求不同于传统上所说的“云计算”:AI 训练一般会占满物理机,并不要求特别强的虚拟化,需要更高的性能和带宽,同时很多任务是离线的。换言之,如果客服企业不论是选择自主训练标准模型提供给客户,还是将定制化客服AI模型部署到客户本地,都未必能直接使用公有云平台,这将大大提升企业的运营成本。
在过去两年半里,类似 GPT-3 等模型的训练成本下降了 80% 以上,目前仅需要 140 万美元(首次训练开销约为 1200 亿美元),高性能大语言模型的训练成本将进一步降低。因此,等待训练成本的下降恐怕是传统智能客服企业自主布局AIGC的唯一解,除此之外,探索与已有成熟模型的企业间的合作机会也是较好的途径之一。
因此,笔者预测未来客服格局或将发生变革,头部AIGC对话类机器人,例如小冰机器人、追一科技将取代传统客服企业,进一步帮助企业实现降本增效。
#3
游戏产业
以腾讯AILab在游戏制作领域的布局为例,人工智能在游戏前期制作、游戏中运营的体验及运营优化、游戏周边内容制作的全流程中均有应用。我们将其中的核心生成要素提炼为AIBot、NPC相关生成和相关资产生成。
游戏策略生成
2021年之前,AIGC生成内容仍局限在文字。2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者提交AIGC绘画作品《太空歌剧院》,参赛者没有绘画基础但是却获得了此次比赛“数字艺术/数字修饰照片”类别一等奖,引发多方争议。2022年10月,Stability AI获1亿美元融资,估值近10亿美元;发布开源模型Stable Diffusion。
AI生成NPC逻辑、剧情
此前,NPC具体的对话内容及底层剧情需要人工创造驱动脚本,由制作人主观联想不同NPC所对应的语言、动作、操作逻辑等,这种动态的个性化匹配背后依旧是不同的静态分支,创造性及个性化相对有限。
而以rctAI的智能NPC为例,其NPC能够分析玩家的实时输入,并动态地生成交互反应,从而构建几乎无限且不重复的剧情,增强用户体验并延长游戏生命周期。特别是在养成类游戏中,AI所提供的个性化生成能够带来画面、剧情及具体交互的个性化全新游戏体验。而实时剧情生成则有助于在特定框架内生成全新的可能性,增加游戏整体的叙事可能性。
目前,NPC逻辑自动生成技术已经应用在《黑客帝国:觉醒》(MassAI,车辆行人等将独立于玩家操控变动)、RedDeadRedemption2、MonsterHunter:World等大型游戏中。长期来看,NPC的灵活自主将引领其成为重要的社交节点,有效填充元宇宙的内部架构。
代表公司:RCT AI
//图片引用自RCT AI官网:rct AI
数字资产生成,也即结合其他模态生成能力,落地为具体场景
NPC相关资产:
据腾讯AI Lab介绍,AIGC能够使相关资产的生成效率提高5-10倍,并同时增加用户内容的个性化。
人物外观生成
不同的NPC需要有不同的面孔、服饰、声音甚至性格特征。传统方法生成NPC成本高,需要逐个进行原型设计、多次建模及渲染等。借助AIGC有助于实现低成本大规模生产NPC,实现千人千面。
人物动画生成
腾讯AI Lab整合文字转语音的前沿研究,生成自然语音,同步驱动嘴型、表情等面部变化,达到高度通真。传统方法成本极高,且制作一分钟的人物动画需要耗费数天,基于AI生成技术可以将原本数周工作量减少到几个小时。
人物动作生成
利用相位神经网络技术控制人物运动,将原本数周工作量减少到几小时。AI在大量的运动数据集上学习人体动作,将捕获的运动数据与场景地形数据相匹配,完成准确、流畅的动作反应,如行走、跑步、跳跃等。
地图、官卡设计
创建游戏关卡也称为程序内容生成(PCG)。这些技术采用复杂的 A 算法来生成巨大的开放世界环境、新游戏关卡和其他游戏资产。在腾讯AILab自研的2D小游戏中,只需要不到一百个训练关卡作为输入,AI即可在几个小时内生成一千多个可玩的、高质量、多样化的关卡。A生成3D关卡相较之下较为复杂 (A生成3D关卡内容则要复杂得多,3D关卡涉及地形起伏、元素之间的关联、不同分辨率的元素、路线与区域规划等,更考验A的生成能力),但目前腾讯AI Lab已实现基于约200个训练关卡及人类的标注编辑的输入,生成超过一万个3D关卡。
场景生成
具体包括3D环境生成等。例如GAN Theft Auto中汽车移动时的阴影均是由A生成的。该部分目前的技术仍有较大进步空间。
//图片引用自RCT AI官网:rct AI
#4
AI 绘画
文章配图
//来自国产 AI 绘画工具「盗梦师」官网
AI画的每一幅图都完全不一样。你输入同一组关键词,它可以每分钟给你生成一张不同的图。每一张都是全新,每一张都是原创。就好像才华和创意不要钱似的。
头脑风暴
你们团队接到任务,产品的官网设计太过老旧,要更新一版新的封面。但新风格现在尚未确定,你们团队需要进行几轮头脑风暴来进行确定。
在以前,你们的流程是,大家先分头搜集各类图片素材,将其放到一个白板上,并根据这个白板进行头脑风暴,并确定好最终的设计风格。
//来自:Fabrie-设计师在线设计协作平台 | 融合表格在线白板工作台
比如你可以用AI生成一个蒸汽朋克世界中的、带有中国古代元素的修仙城市。人类艺术家从中获得创意素材,再把那个素材用于游戏或者电影。
//来自:艺术展 - 画宇宙 Creator
PPT设计
//来自即刻用户莱森的个人说明书 2.0
左右滑动查看
UI 设计
即时设计插件 —— 即时 AI
2021年之前,AIGC生成内容仍局限在文字。2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者提交AIGC绘画作品《太空歌剧院》,参赛者没有绘画基础但是却获得了此次比赛“数字艺术/数字修饰照片”类别一等奖,引发多方争议。2022年10月,Stability AI获1亿美元融资,估值近10亿美元;发布开源模型Stable Diffusion。
//来自「即时设计」官网
在即时设计中,有一款用于 AI 绘画的插件,叫做【即时 AI】。
它最大的特点在于,可以将 AI 绘画的能力嵌入一个设计师的工作流中。
比如,此时一个设计师正在设计 UI 一个 App 的产品界面,它需要一张「圣诞」主题的配图。
这时,设计师可以启动即时 AI 的插件,并且用这个插件来根据描述词用 AI 绘画生成需要的配图。
点击左边工具栏中的【AI】的按钮,就可以启动插件。
我们选择【文字模式】,输入好描述语,选择好风格和尺寸,点击【开始创作】。
图像完成生成后,我们点击【生成到画布】,AI 做的图就生成到画布中央了。
稍加编辑后,就可以将 AI 生成的图片应用到我们的 UI 设计中了。
以前,当你在做设计工作需要素材时,你得中断当前的工作流程,去设计素材网站中搜索找到你想要的素材,下载到本地再上传到你的设计工具中,再继续你的设计工作,整个过程非常割裂,很容易分心。
而现在,假如你用「即时设计」这款工具来完成设计工作的话,当你需要素材时,可以直接通过【即时 AI 】的插件快速生成你需要的设计素材,并将其融入进你的设计作品中。
Midjourney 生成 UI 设计图
手机 APP 设计
Notion 仪表盘
电商配图
特色 AI 绘画工具介绍
Microsoft designer:用文字生成营销物料
Yuan 初:用 AI 修图
//来自 Yuan 初官网
经测试,这个功能用来更换背景和更换任务的着装是很优秀的,不过用来换脸还不太行。
这是我的朋友的一张自拍:
原图
AI修图后
如果你此刻被 AI 激发出了别的灵感,可以根据 AI 生成的图片进行二次修改,进一步优化。
比如,我们根据将图二的背景和衣服都擦除,并且在输入框中输入:女孩是个穿着西装的杀手,坐在酒吧里,手里拿着一杯酒。
AI 就能进一步地带给我们惊喜。
Yuan 初:用 AI 修图
画宇宙(Nolibox)的定位是一款专业级的 AI 绘画工作台,这个工具里几乎集成了上面提到的工具里的所有功能。
和很多的 AI 绘画工具不同,画宇宙(Nolibox)的主界面是一个画板,可以在上面看到各种不同的功能组件。
下面我们来用一个完整的绘画流程,带你体验一下再画宇宙中的创作过程。
某一天,你接到了公司的任务,你需要设计出一张充满未来感的赛博朋克风格的高质量图片。
在以往,这是一个无比艰难的任务,但现在,你熟练地掌握着 AI 绘画的技能,你有充分的把握做出一张高质量的图片。
首先,我们打开画宇宙,先通过最简单的生成工具,输入一段最简单的文字:踢足球的男人,风格选择 CG,看看 AI 能帮我们画成什么样子。
于是我们得到了这么一张图
行,第一步完成了,现在我们有了一个踢足球的人了,那么下一步就是让它变得赛博朋克一点。
我们点击右边工具栏的【垫图】,并将上面这张图选中作为参考图,在下方的输入框中输入:穿着带有金属光泽的机甲踢足球的男人,风格选择「赛博朋克」,点击生成,就能得到下面这张图
科技感已经拉满,但你要求比较高,还不够满意,还想再精进一点,让它更有赛博朋克的感觉。
你感觉自己此刻没什么思路,于是打开了右侧的【灵感】那一栏,在搜索框中输入“赛博朋克 运动员”,想通过别人的作品来找点灵感。
很快,你搜索到了很多幅类似的作品:
你感觉其中一幅很是不错,于是点开了这幅画,得到了一张这样的作品
你点击【复制 Prompt】,这幅画对应的描述词复制到了你的剪贴板。
再按照上面的步骤使用一次【垫图】功能,将原来的那张图作为垫图,并在输入框中粘贴刚刚复制的描述语(Prompt),点击最下面的转换并添加,就能得到这张图啦
好的,任务完成啦,你向上级交付了最终的作品,早早下班。
曾经,需要画几千块钱,找一个专业的原画师花费几周才能完成的作品,被你一个没有任何美术经验的人,在一个小时之内完成了,是不是很有成就感?
当然,这个过程并没有那么容易,还是需要做很多次不同的尝试,才能找到正确的方法的。
在这个尝试的过程中,画宇宙的画板能大大提高你迭代画作的效率。
在这个过程中,唯一有缺陷的地方是,每张图生成的速度并不是很快,如果你在没有购买加速服务的情况下大量生成图片,会花费非常多的时间。
在这一点上,画宇宙团队还是给了一个很棒的解决方案。
画宇宙支持私有化部署,你可以用自己的电脑或者显卡的算力来完成 AI 绘画,这样就可以免费且快速地大量生成图片了。
画宇宙团队还贴心地给了一个私有化部署的教学文档,来方便你进行更好的操作。
为了让你更好地使用 AI 绘画,画宇宙团队用飞书多维表格做了一张超详细的【AI 绘画风格 + 关键词】的数据表,上面收录了超级详细的画家风格以及对应在 AI 绘画中应用的描述词,并且每个风格后还配了四张图来方便你理解。
未来职业展望:AI 画师
在测评国产的专业级 AI 绘画工具「画宇宙 Nolibox」的过程中,有一个按钮叫作【高级模式】。
里面内置了关于专业画师需要了解的各种艺术风格和知识类型。
//艺术家风格
//艺术媒介
//镜头和视角
显然,这样的功能,并不是为普通的 AI 绘画用户设计的。
要用上这些功能,需要用户拥有大量的艺术专业知识储备,甚至可能需要是一名从业多年的画师。
回溯历史,在相机没有被发明之前,所有的人物肖像是通过画师来创作完成的。
在相机被发明出来之后,人物肖像画师并没有被完全取代,而是与新诞生的职业——摄影师共存在社会中。
结合着 2022 年 8 月,AI 绘画作品《太空歌剧院》获奖的新闻,我们可以预测,在未来,会有很一批人,他们会拥有走足够的艺术知识储备,同时又熟练掌握如何用 AI 来帮助他们更高效地创作、创作出更具艺术性的作品,这部这样的人越来越多之后,会诞生一种新的职业——AI画师。
公司动态
一些思考:
知道这些公司在发展这些技术,跟我们,个体从业者的关系是什么?
上游-技术从业者行业培训。
中游-行业供应商向应用企业销售。
下游-现有企业AI可行性研究、战略规划、测算。
市场-海外产品复制落地,变现。
AIGC最能解决哪些行业的痛点?
创作密集、素材密集、人工密集、决策密集、模拟预测。
知识教育、咨询类、内容平台、C端销售、销售主播、企业号。
如果这个行业是趋势,那这个行业最缺什么?
知识:让机器的素材与人的描述匹配,算法,给开发者的知识转译。
开发者:能编程的人。
技术:需要大量的数据、参数以及强大的算力支撑。GPT-3在微软提供的Azure AI超算基础设施(由V100GPU组成的高带宽集群)上进行训练,总算力消耗约3640 PF-days(即每秒一千万亿次计算,运行3640天)。ChatGPT的持续升温为AIGC带来全新增量,对AI模型训练所需要的算力支持提出了更高要求。云计算基础设施作为算力底座,其重要性日益凸显,包括高性能芯片、数据中心、网络等基础设施建设为算力、应用以及产业发展提供可持续发展的保障。
创业者:技术门槛+行业想象+工具化。
一张图看懂产业链
在AI产业链,国内外市场的进程不同,根据所找到的资料,呈现出的产业分布,有很大不同。
感受上来说,国外呈现的,像是互联网技术已经开始普及后的应用领域百花齐放。
国内呈现的,像是互联网刚普及时,还在大力发展程序员阶段。
国内划分
AIGC上游主要包括数据供给方、算法机构、创作者生态以及底层配合工具等;
中游主要是文字、图像、音频和视频处理厂商,其中玩家众多;
下游主要是各类内容创作及分发平台以及内容服务机构等。
根据AI在国内的发展趋势,我们也通过资料,分析到AIGC发展下,可能受益的公司:
具备算力基础的厂商;深度神经网络由于其网络结构难度和海量训练数据,运算量巨大,因此对于处理器或芯片的算力、效率(能耗)要求极大;
AI商业算法商业落地的厂商;AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势。算法上,数据标注属于AIGC算法的生成关键步骤,而在自然语言处理、机器视觉等方面,AIGC已经对此方向应用产生深远影响,例如已经实现的虚拟人与自然人的对话、AI作图、AI底层建模;
AIGC相关技术储备的应用厂商;相关娱乐、传媒、新闻、游戏、搜索引擎等厂商具备海量文本创作、图片生成、视频生成等需求。
具备算力基础的厂商:寒武纪、商汤、海光信息、浪潮信息、中科曙光、景嘉微等;
具备AI算法商业落地的厂商:科大讯飞、拓尔思,其他受益标的为:汉王科技、海天瑞声、云从科技等;
AIGC相关技术储备的应用厂商:百度、同花顺、三六零、金山办公等。
国外分布
海外市场不仅有独角兽公司出现,还形成了更为完善的产业体系。
独角兽公司,将在下个章节,简介其业务。这里,我们先看看海外的产业分布:
文本、图片、音频、代码、聊天机器人、视频、机器学习平台、搜索、游戏、数据,10个类别。
各领域AI布局概览
国内AIGC概念股
海外投资方:
国内投资方:
大厂积极布局
技术支持
ChatGPT是由OpenAI公司在2022年11月30日发布的一种聊天机器人模型,是由人工智能技术驱动的自然语言处理工具。
GPT系列模型是一种基于互联网可用数据训练的文本生成深度学习模型,完成文章生成等任务并不需要有监督学习进行模型微调,但需要大量的数据、参数以及强大的算力支撑。
GPT-3在微软提供的Azure AI超算基础设施(由V100GPU组成的高带宽集群)上进行训练,总算力消耗约3640 PF-days(即每秒一千万亿次计算,运行3640天)。
ChatGPT的持续升温为AIGC带来全新增量,对AI模型训练所需要的算力支持提出了更高要求。
云计算基础设施作为算力底座,其重要性日益凸显,包括高性能芯片、数据中心、网络等基础设施建设为算力、应用以及产业发展提供可持续发展的保障。
代码编写+AIGC
内容素材平台+AIGC
需要内容的平台,都有应用可能。游戏、视频、音乐、文本创作的内容。
需要内容的平台,都有应用可能。游戏、视频、音乐、文本创作的内容。
内容审核+AIGC
教育公司+AIGC
咨询公司Gartner对AI发展的预估
值得了解的公司
海外市场
OpenAI
OpenAI是研发出ChatGPT的公司。
非营利性机构OPENAI的钱从哪来?
《财富》有一篇关于OpenAI股权结构的文章。如果你有兴趣,也不妨找来读一下。里面有很多关于“创造性”的细节。我试着简单说一下。
首先,Sam有一个非营利机构A(OpenAI实验室),想做点理想主义,造福人类的研究。但是后来发现,算力得花钱,人工得花钱,哪哪都得花钱。实在是扛不住了。怎么办?
于是,Sam创立了一个盈利机构B,并用A“控制”B。同时,许诺那些愿意奉献的企业,在B里,有机会获得除了名誉之外的本金(以及封顶收益)回报,以此来降低奉献门槛。
然后,微软加入了。微软加入的条件是,要有技术的优先使用权。另外,本金要回来,收益要有(但被限定在了10倍以内)。
最终,A就有了一个先回本金,再回10倍收益,最后把所有股份完全退还给A的“资助”计划。微软也为此先后向B投入了10亿,20亿,100亿美元,分批降低风险。失败了,这笔钱就是“捐赠”。等微软收回约定的封顶收益,B的所有股权(包括微软的和其它的),就回归给A。
这就是最精妙的地方。非营利性机构不能分红,那么资助者的收益,就几乎只有自我社会责任感的满足。“社会责任感的满足”,可能值100元,可能值1万,可能值1亿,但很难价值130亿美金。但我需要130亿美金才能改变世界,怎么办?给它除了社会责任感满足之外的其它收益,和它更想要的东西。对微软来说,就是技术和收益。但限定范围。技术有时间限制,收益有上限限制。这样,会有更多的人来帮你。即便帮你的原因不纯粹了。但是,你的梦想也得到了帮助。AB公司,就是这种初衷下的创造性解决方案。
然后,我斗胆猜测,B这个主体也许有朝一日会消失。此时,A具备了强大的盈利能力。Sam会用这种强大盈利能力,继续创造“通用人工智能,造福人类”的梦想。
这就是,创造性地找钱。
如果你对这个投资方案的具体内容感兴趣,我没有更具体的资料。目前有限的内容,来自《财富》。简单来说,就是微软会分享B公司利润的75%。直到收回130亿美元的分批投入(10亿+20亿+100亿)。然后,微软对B的持股比率,会下降到49%,继续分红。直到获利达到920亿美元为止(其他股东同时获益)。然后,微软和其它股东的股权,全部还给A。
我知道,我知道。也许有一天,这种盈利能力就像魔戒一样,会反噬主人。一旦B能非常赚钱,Sam会不会反过来放弃A,从此在B里享受名利双收,也说不准。
但不管怎样,这是一个非常独特的资助(捐赠+投资)结构。是几乎所有投资机构没见过的,创造性的结构。所以,我估计各方的投资部、法务部、ESG部门,没少来回讨论。一个大公司,是不会为一个普通项目,创造一个如此复杂的结构的。
实在是OpenAI的技术,太诱人了。
Stability AI(图片)
美国东部时间2022年10月17日,英国开源人工智能公司Stability AI宣布获得1.01亿美元融资,Stability AI将利用这笔资金加速开发面向全球消费者和企业用例的图像、语言、音频、视频、3D等开放AI模型。
DreamStudio是Stability AI面向消费者的产品,注册用户已经超过100万,他们来自全球50多个国家,共同创建了超过1.7亿张图像。
Midjourney(图片)
Jasper(文案)
美国东部时间2022年10月17日,英国开源人工智能公司Stability AI宣布获得1.01亿美元融资,Stability AI将利用这笔资金加速开发面向全球消费者和企业用例的图像、语言、音频、视频、3D等开放AI模型。
Grammarly(写作)
日常英文写作辅助工具
Ada(客服)
智能聊天机器人公司,目标客服市场。
Glean(搜索)
Copy.ai 提供了很多场景的模版,比方说如何写博客、写社交媒体推广文案、写邮件以及产品上线该如何写等等,几乎涵盖了企业各种需要文案的场景,你可以通过这些模版快速上手,并且这些精心设计的模版也更适应客户的需求。
Copy.ai(文案)
Copy.ai 提供了很多场景的模版,比方说如何写博客、写社交媒体推广文案、写邮件以及产品上线该如何写等等,几乎涵盖了企业各种需要文案的场景,你可以通过这些模版快速上手,并且这些精心设计的模版也更适应客户的需求。
有分析者推测:Copy.ai 的增长路径会跟 Grammarly 非常类似,甚至它也可能会切入 Grammarly 的业务,毕竟在写作时,语法方面直接解决了效率不是更好,当然不排除 Grammarly 直接做这块或者做一些收购。
微软(投资者、Copilot)
GitHub,微软旗下的全球最大开源代码托管平台。
微软 GitHub AI 编程工具 Copilot 在经过了近一年测试后,2022年6 月 22 日已正式上线,定价每月 10 美元(约 66.9 元人民币)或每年 100 美元(约 669 元人民币),对学生用户和流行开源项目的维护者免费提供。
据官方介绍,Copilot 能够帮助开发者在 Visual Studio、Visual Studio Code、Neovim 和 JetBrains IDE 等开发环境中写代码时自动提供建议。
GitHub Copilot 支持 Python、JavaScript、TypeScript、Java、Ruby 和 Go 等编程语言。可以根据上下文自动写代码,包括文档字符串、注释、函数名称、代码,只要用户给出提示,就可以写出完整的函数。
微软将ChatGPT视为新一代技术革命,将ChatGPT整合进Bing搜索引擎、Office全家桶、Azure云服务、Teams程序等产品中,微软近期宣布推出视频会议及远程协作平台的高级付费版Microsoft Teams Premium,订阅者可享用OpenAI提供支持的大型语言模型技术,用AI自动生成会议笔记,此举或对Zoom、谷歌会议等平台形成巨大冲击。
英伟达
Buzzfeed(美国新媒体)
美国新媒体巨头Buzzfeed踩准ChatGPT风口,两天内股价飙升3倍。
1月29日,美国新媒体巨头Buzzfeed宣布计划采用ChatGPT协助内容创作,其股价一夜间暴涨近120%,两天内飙升逾300%,成交量突破4.38亿股(其月平均成交量不足2500万股),消息公布后同类型公司股票成交量也迎来历史高峰:C3.ai本月成交量超过7200万股,为自去年6月以来最多;语音AI软件公司SoundHound AI的成交量约为6450万股,几乎是其月平均值的三倍。
谷歌
在ChatGPT发布后,谷歌CEO在公司内部发布了“红色警报”(Code Red),敦促团队解决ChatGPT对公司搜索引擎业务构成的威胁,同时批准了在谷歌搜索引擎中加入AI聊天机器人的计划。
2月4日,谷歌资3亿美元投资ChatGPT竞品--Anthropic,谷歌将获得约10%的股份,Anthropic计划将次轮资金用干购买公歌云计算部门的计算资源;Anthropic开发了一款名为Claude的智能聊天机器人,据称可与ChatGPT相媲美(仍未发布)Anthropic和Open AI渊源颇深,其联合创始人曾担任OpenAI 研究副总裁。
最近,谷歌称生成式 AI 模型将很快与搜索结果集成。
谷歌子公司剧本写作
剧本写作AI-Dramatorn
英矽智能(医疗)
Jasper(文案)
将ChatGPT用于职能部门,如:回答面试问题、编写代码软件、创建培训文档。
《亚马逊的AIGC探索:让孩子入睡前的故事不再无聊》
Nothing,Forever(AI 生成的情景喜剧)
《Nothing,Forever》 是一部 AI 生成的情景喜剧,放在 Twitch 上直播。
画质上,给人上世纪 90 年代 PC 端游戏的感觉,背景饱和度很高;人物动态并不丝滑,声音也能明显听出是机器合成,剧情中添加的罐头笑声、音乐与人声音轨也有比较明显的割裂感。但一想到这全是 AI 生成的内容,还是会觉得很了不起。
国内市场
AI四小龙(商汤、旷视、依图、云从)
商汤科技:将人工智能基础设施、智能驾驶、人/物检测、SLAM、图像生成、智能決策为核心,应用领域涵盖智能驾驶、身份验证、城市管理、游戏Al VRIAR等,11月24日市值620亿港元。
旷视科技:专注于图像/视频的分析与理解,以人脸识别为核心,业务场景包括城市治理、楼宇园区管理、以人脸识别为核心,实名认证、通行考勤等,据胡润全球独角兽榜,2021年估值270亿元。
依图科技:聚焦于人脸识别、自然语言处理等领域,解决方紫包括城市管理、智慧医疗等据胡润全球独角兽榜,2020 年估值140亿元。
云从科技:建立视觉、语言、环境认知系统,应用于智慧交通、金融、教育等领域,11月24日市值131亿元。
联想,寒武纪
ChatGPT催生高算力需求,联想集团、寒武纪等成核心受益标的。
科大讯飞
公司近年重点打造面向不同场景的、各具特色的“虚拟人”,会综合运用各类AI技术,并结合具体场景对应实现相应技术的深度融合与贯穿,以期实现更接近于人类能力的软硬一体、个性化、善学习的虚拟人方案。
拓尔思-虚拟人Saas
服务对象更偏向政府、国企。
公司专注于NLP(语义智能)领域。人工智能包括计算智能(记忆、计算)、感知智能(语音识别、图像识别)、认知智能(语言理解、分析决策)、创造智能(想象、创造)四个层次,公司专注认知智能中的语义智能。
万兴科技
墨刀软件就是万兴旗下。
万兴科技为全球领先的新生代数字创意赋能者,公司致力于通过软件技术创新和产品能力提升助力新生代创作者高效、便捷创作。
目前公司已布局虚拟数字人、虚拟场景、虚拟直播等创新业务,并于近日在全球元宇宙大会论坛上宣布布局AIGC赛道,公司旗下首款AI绘画软件“万兴AI绘画”正式开启公测,用户输入关键词可30秒内智能生成绘画作品。
字节 AI Lab
据报道,字节跳动的人工智能实验室(AI Lab)正在开展类似CHATGPT和AIGC的相关研发。分析人士预计,字节AI Lab研发相关产品,将主要在VR内容生成上开展更多探索。据悉,字节AI Lab成立于2016年,研究领域主要涉及自然语言处理、数据挖掘、机器学习、语音与音频等。
长城证券(002939)分析指出,AIGC 有助于企业级创作降本增效,进一步降低边际成本。其中自动采编、NFT 作品自动生成、游戏建模及虚拟人辅助创造等领域有望最先受到 AIGC 赋能,未来相关领域有望从 AI 替代劳动力的浪潮中进一步受益。
A股公司中,吉宏股份(002803)与字节跳动双向合作,自主开发的AIGC技术贯穿了公司主营业务跨境电商运营的每个环节。
天龙集团(300063)是巨量引擎广告业务授权代理商,代理旗下产品包括今日头条、抖音、西瓜视频、火山小视频等互联网广告销售业务。
百度·飞桨
培训行业人才
百度·文心一言
百度在人工智能及自然语言处理方面有着深厚的技术储备,目前相关专利量已达到全国第一,世界第四,目前相关技术在电力、金融、制造、农业、教育、水务、交通等领域已经得到广泛应用。AIGC领域拥有文心大模型,不仅可以自然语言处理,还可以生成修复图片。
百度宣布将升级百度搜索的“生成式搜索”能力,智能解答用户的搜索提问:2月7日,百度宣布将在3月份完成其chatGPT产品的内测,面向公众开放,该项目名字为文心一言(ERNIE Bot)
百度指出,生成AI和搜卖引警是补关系而不是替代,据路选社报道,百度计划于 3 月将类似 ChatGPT 的 AI对活服务作为独立应用推出之后再逐步将其合并到搜索引擎中。
推出与ChatGPT类似的【基于语言模型的聊天机器人产品】——文心一言(ERNIE Bot),该产品计划在3月内测,之后,会逐步将其合并到【搜索引擎】中,智能解答用户的搜索提问。
阿里鲁班
AI人工智能设计师 — 让天下没有难撸的Banner!
完美世界
曾因AIGC概念股,当日涨停。
网易互娱
智能家居萤石网络(上市)
视觉中国
公司拥有中国最广泛的图片付费使用群体客户,客户涵盖了G端机关、C端个人以及广泛的大企业和中小企业和媒体;公司作为中国版权行业的领军企业,拥有海量的图片资源,同时很早就布局音视频资源以及区块链、数字认证等新技术。
蓝色光标
昆仑万维
成立于2008年,已经发展成为集精品自研游戏研发厂、全球精品游戏发行商、平台和软件商店三者为一体的互联网企业。
公司旗下AIGC研发团队,MusicX Lab致力于打造领先的人工智能音乐生成技术,目前已具备成熟专业的全链路音乐制作和全球音乐发行能力,并且在国内外各大平台再推新歌的基础上,也积极拓展了车企、教育、时尚、游戏、娱乐等行业的合作生态,达成了歌曲代销、车机音源、公播音乐、AI音乐辅学、品牌联名主题曲、有声书及视频配乐等落地业务。
2022年推出天公岳府Skymusic,商业级作曲AI模型。
中文在线AI主播
豪末智行
右脑科技
做专业的AIGC图像视频创作工具——奇绩被投。
项目简介:右脑科技旨在用人工智能赋能视觉创作,打造基于AIGC技术的平台和新型创作生态。创始团队来自北京大学,有丰富的视觉大模型研发与落地经验,迭代速度快,仅用时40天自研系列算法,推出了支持视频和图像的AIGC创作工具。
团队介绍:梁健:北京大学计算机科学硕士,曾在MSRA,长期从事视觉生成研究,代表作女娲系列NUWA、NUWA Infinity。史杰:北京大学智能系统硕士,曾在MSRA,女娲项目组从事Diffusion模型研究,曾任商汤研究员,负责扩散视频生成模型研究。周呈华: 北京大学软件工程硕士,曾在STCA、智源研究院,从事视觉生成研究,参与智源悟道·文生图模型、国画模型研发。
深言科技
深言科技(DeepLang AI)是一家前沿科技驱动的创业公司,致力于使用世界领先的人工智能和自然语言处理技术,尤其是超大规模预训练模型技术,打造中国首个工业级智能文本信息处理引擎,为中国的3亿脑力劳动者和数千万信息密集型组织重塑信息处理全流程。
后记
特别感谢跨界智囊团:来自互联网大厂的产品、战投、市场,Top3大学的战略研究员。
此报告打破传统线下团队模式以巴克球协作形式共创完成。
资料参考
小宇宙AIGC相关播客:ChatGPT会改变什么?
报告合集: AIGC专题
《【国外】Top 50 AIGC 初创公司和产品介绍:AIGC 企业库 Top50 》
《AIGC受益厂商》
《人工智能工具目录 Futurepedia - The Largest AI Tools Directory | Home》
《生成式人工智能:一个创造性的新世界》
《ChatGPT:一个人不管有多大的梦想,还是要有盖世武功》
《万字长文:AI产品经理视角的ChatGPT全解析》
《MuseArt 创作平台使用说明书》
《MuseArt: 打字就能生成一幅画,支持中文,且免费!快申请加入吧!》
《 你好,AI 艺术家》
《造梦日记 Printidea 用户手册》
《画宇宙(Nolibox Creator)帮助中心》
《上线一个月成为准独角兽、上万人排队注册,AI Art是下一个NFT?| 全球行业mapping-36氪》
《36氪专访|对话Nolibox:从AI生成艺术到AIGC,开源生态下的核心竞争力在于产品理解-36氪》
《 AIGC 企业库 Top50》
chatGPT 竞品:https://www.perplexity.ai/
《AI绘画火了,但商业化没那么容易》
《数读│AIGC商业化之路展望:AI正以越来越显性方式产生商业模式》
《ChatGPT出圈带火AIGC 你想看的全在这了》
《ChatGPT:受惊骇的巨头们与焦虑中的军备竞赛》
《OpenAI与AIGC:改变人类生产范式,通往“万物的摩尔定律”》
《“早期”的AIGC,已在“中途”》