一
当古老东方神话遇上现代新闻语境,会擦出什么样的火花?
让《华尔街日报》来报道“大闹天宫”的这个想法源于我多年前看的一本书:《剑桥倚天屠龙史》。
作者新垣平创造性地用剑桥严肃历史著作的风格来重新解构金庸的武侠经典,里边的目录是这样的——
“第五章:明教的复兴与武术界的分裂”、“第九章:武当的崛起及其与少林的冲突”。
里边的正文是这样的——
“每一次华山论剑都反映出武林中的权力分配关系,以“五绝”为名号的高手名单实际上映射出武林中权力秩序的现实逻辑。在某种意义上,我们可以称之为江湖世界的《威斯特伐利亚条约》,正是这次论剑确定了此后大半个世纪的武林秩序。”
这种严肃的笔调和娱乐的内容所形成的奇妙反差当年曾给我带来相当愉悦的阅读体验,以至于有时候我也会萌生创作类似作品的冲动。
但遗憾的是,我彼时有限的输入和训练并不足以让我游刃有余地驾驭两种截然不同的写作风格。
然而,大模型的到来改变了一切,其海量语料的预训练在理论上可以高度抽象出任何文本的内在特征,同时还能流畅地风格化生成。
需要说明的是,不同模型的能力差异是非常大的,为了实现更好的效果,我选择了AI圈在创作领域口碑出色的Claude,具体模型是Claude 3.5 Sonnet。
在我看来Anthropic公司是一家在AI世界声量和实力严重不匹配的公司。
事实上,该公司出品的Claude已经在多个例子中被证明了在创作层面有着惊艳的表现,我称之为“最强创作型AI”。
山姆*奥特曼2年前之所以让ChatGPT匆忙提前上线,就是害怕被Anthropic抢先发布夺走了“第一个预训练大模型产品”的心智。
二
废话少说,我们直接看结果:如果让《华尔街日报》来报道西游记重要戏份:“大闹天宫”,它最终的呈现会是怎么样的?
以下是Claude输出的全文,提示词相对复杂,我放到了后边的篇幅中——
《仙猴冲突升级,天庭安全体系被攻破》
昨日,自称齐天大圣的孙悟空闯入了玉皇大帝的天庭,这是一场前所未有的安全漏洞,动摇了天庭的行政核心,标志着天庭权威与日益叛逆的猴群之间持续的紧张关系在显著升级。
这一事件对天庭财产造成了广泛的破坏,并扰乱了天庭的正常运转,引发了人们对天庭维持其尘世臣民秩序能力的日益担忧。
“这是对我们天庭治理模式的根本挑战。”天庭行政部长李天盖说,由于此事的敏感性,他要求匿名。“我们正在与一个在无监督情况下掌握修仙技术的实体打交道。”
知情人士称,在将自己的名字从生死薄中抹去后声名狼藉的孙悟空此前曾拒绝担任弼马温一职——分析人士将此举解读为对天庭传统等级结构的直接蔑视。
这次危机在天庭官僚机构中引发了冲击波,几个部门报告了严重的运营延误。云管理部报告称,在关键基础设施受损后,效率降低了 40%。
事件发生后,天庭武器制造商的股价飙升,Phoenix Feather Armaments (PFA) 在早盘交易中上涨了 15%。“我们看到所有天庭各部门对加强安全措施的需求都在增加。” 永生证券首席分析师张娴说。
对于此次事件在经济层面的后续影响,天庭经济学家张云子分析认为:“短期内天庭GDP或将受到冲击,特别是在仙丹、蟠桃等高端消费品领域。但从长期来看,这或将推动天庭加大在安保科技领域的投资。”
此次危机引发了对天庭当前安全协议的严重质疑。据报道,孙悟空挥舞着从东海龙王那里获得的金箍棒,成功突破了多层天庭防御体系。
“我们现在的安全框架是针对传统威胁设计的,而不是为已经掌握了 72 种变身的挑战者设计的。”天兵天将司令托塔李天王说。此后,军方宣布对其防御战略进行全面审查。
接近玉皇大帝的消息人士透露,幕后谈判正在进行中,如来佛被作为潜在的调解人进行接触。然而,孙悟空作为白手起家的草根挑战者的独特身份让形势变得扑朔迷离。
“在与一个从根本上拒绝现有天庭秩序的实体打交道时,传统的外交方法可能被证明是无效的,”神治研究所(Institute of Divine Governance)的著名政治学者袁博士指出。
在天庭努力应对这场前所未有的危机之际,许多观察家认为,这一事件可能会迫使公众从根本上重新评估天体当局如何处理与强大的地球实体的关系。
“简单的自上而下的治理时代可能已经结束了。”一位要求匿名的高级官员说。“我们需要制定新的框架,与不适合我们传统类别的新兴大国进行接触。”
玉皇大帝办公室已宣布召开天庭议会紧急会议以解决这些问题,同时坚称局势仍“可控”。
本报将持续关注事态发展。
可以看到,Claude完美复刻了《华尔街日报》的写作风格——直观、专业、严谨、维度多、信息密度大。
当这些新闻专业主义的词汇和古老东方神话结合时,产生了一种奇妙的化学反应,花果山叛逆妖猴的逆天举动被其处理成一个关于治理、安全和制度改革的严肃议题,让人忍俊不禁。
(大模型也不是完全没有Bug,比如报道中把要求匿名人士的职位和姓名都爆出来了,这在现实中《华尔街日报》是看不到的。)
尽管这些年在互联网的冲击下,《华尔街日报》作为媒体的影响力在客观上有所下降,其政治倾向等多个方面也屡遭公众质疑,但其长期构建的简洁、严谨、专业风格的确对全球新闻业有着广泛而深远的影响。
我们之所以看上面的文字熟悉,并不是我们真正看过《华尔街日报》,核心在于我们曾经接触到不少国内严肃报道其实就有着《华尔街日报》的许多烙印。
这时候或许有人会问:潘寒,你到底写了什么提示词,让Claude能如此严丝合缝地输出超预期的结果?
三
咱们先不着急揭晓答案,我量大管饱地让大家看一看AI创作的表现,既然《西游记》可以写,那么《红楼梦》可以不可以?
当然可以!
让我们来看一看《华尔街日报》是如何将《红楼梦》第13章——“秦可卿死封龙禁尉,王熙凤协理宁国府”,转化成一篇关于京城家族企业人事重组的专业报道的——
贾氏家族核心高管意外离世,宁国府人事重组引发关注
北京讯 - 贾氏家族旗下宁国府分部营运总监秦可卿女士日前意外离世,终年24岁。知情人士透露,秦女士是在其私人居所遇难,具体细节尚未对外公布。贾氏家族发言人拒绝就此事发表评论。
人事变动引发连锁反应
秦可卿女士生前担任宁国府营运总监一职,与宁国府当家贾珍私下关系密切。其突然离世不仅给宁国府日常运营带来冲击,更牵动了整个贾氏家族的神经。据悉,荣国府当家贾政已临时任命其弟媳王熙凤女士兼任宁国府营运协理一职。
"这一任命显示了贾氏对于稳定宁国府局势的决心。"企业管理专家表示,"王熙凤作为荣国府的资深管理者,具备丰富的运营经验。"
皇室褒奖雪中送炭
与此同时,皇室方面已批准由贾珍接任龙禁尉一职,此举被解读为对贾氏家族的支持。分析人士认为,这一任命将有助于稳定贾氏家族的社会地位,缓解当前的危机。
"龙禁尉虽为虚衔,但具有重要的象征意义。"政经观察家指出,"这表明皇室仍对贾氏保持信任。"
财务状况引发关注
然而,有市场观察家对宁国府的财务状况表示担忧。据了解,近年来宁国府奢靡之风盛行,开支巨大。一位不愿具名的前雇员透露,府中日常开销已远超正常水平。
王熙凤此番就任协理,除稳定人心外,相信还肩负着理顺财务的重任。有分析认为,这可能预示着宁国府将开启新一轮的成本控制。
根据本报获得的多份内部文件显示,王熙凤在宁国府的降本增效计划会在本月下旬陆续执行,部分高管已提前结束休假返回集团金陵总部。
市场反应与展望
消息传出后,与贾氏有业务往来的多家商号反应谨慎。对此,经济学家表示:"贾氏家族作为帝都四大家族之一,其一举一动都会影响市场走向。短期内,市场或将持观望态度。"
截止到3月5日收盘,贾氏控股和贾氏地产分别微跌0.7%和03%。
至于宁国府未来发展,业内普遍认为王熙凤的管理能力将受到考验。有专家指出:"接下来的三到六个月将是关键期,王熙凤能否带领宁国府渡过难关,值得关注。"
不知道大伙看的感觉如何,我反正在震惊的同时多次笑出了声。
我们可以清楚地看到Claude不但在语言风格上还原了《华尔街日报》的神韵,同时对《红楼梦》本身的事实和逻辑关系理解异常准确,其解读的层次也非常多元。
比如《红楼梦》原著中没有明说但暗示了贾珍和儿媳秦可卿不可描述的关系,在报道中文本体现为“与宁国府当家贾珍私下关系密切”,其用词谨慎、准确、意味深长,确实很难相信这是AI写出来的文字。
(当然还是有一个小Bug,开头的“北京讯”表明大模型还是没搞清楚金陵、京城和北京之间的关系,同时封龙禁尉的并非贾珍)
四
好了,接下来说一下我是如何写这段创作的提示词的——
要想让AI写出原汁原味的华尔街日报的Style,我们首先得搞清楚“华尔街日报风格”到底是一种什么样的风格?
要将这份创办于1889年的古老报纸的写作风格总结起来其实并不容易,远非我们上面所说的“直观、严谨、多维度、信息密度大”等几个简单的词可以概况。
因此,我们需要组织一个维度足够丰富的框架来将《华尔街日报》日常报道最核心的特征囊括起来,这个框架应该既有表层特征,也有里层内涵。
经过大量的阅读与研究,我选取“皮、肉、骨、魂”这个由浅入深的框架,即“表征句式、语言特点、行文逻辑、价值取向”这四个维度来定义其写作风格。
最终输出XML格式的提示词如下——
好了,如果你这个时候正在仔细研究我以上提示词中的技巧和逻辑,在琢磨我为什么这么写,甚至准备复制、收藏以便赶紧去试一试,那么请先停一停。
事实上,以上并不是我真正的提示词,我真正的提示词如下——
1.请用《华尔街日报》的风格给“大闹天宫”写一篇报道
2.请用《华尔街日报》的风格重写红楼梦的其中一章——“秦可卿死封龙禁尉,王熙凤协理宁国府”
这个Case里的输出为中英混排,我修改了个别翻译不地道的词汇
没错,我真正输入的提示词确实就是上面这一句简单到不能再简单的自然语言,除此之外什么都没有了。
少,在某种意义上就是多;
简洁,有时候比复杂更有力量;
五
我们中的不少人看到优秀的输出本能会认为它的提示词一定很复杂,即便不复杂,也一定很精妙。
甚至我将上面的输出效果发给好基友看的时候,他判断我一定是给Claude喂了一个《华尔街日报》新闻源的长文档。
没错,当三天前我随手将这个创意丢给Claude的时候,我其实没抱什么希望,我当时的预期是:这种级别的提示词要想达到理想状态,怎么着也得迭代个十几遍吧。
然而,Claude以其强悍的实力打了我的脸。
这对于我而言是一个惊喜的Case,但对于如何更好地与AI对话的“提示工程”而言,它有着多种令人深思的启示——
第一、深刻地理解简单与复杂之间的关系;
对于性能强大的大模型而言,当你输入“华尔街日报的风格”这个词的时候,在它的向量空间中,它不是一个简单的东西。
它意味着极其丰富的内涵,海量的语料预训练的大模型知道那是什么东西,它不仅知道,而且它对这个词的理解比你的描述要深刻的多。
所以,此时任何额外的描述都可能因为大模型的“注意力机制”偏离“华尔街日报的风格”这一本身的需求。
没错,用简单几个词、十几个词甚至几十个词显然无法描述伟大的莎士比亚、伟大的马尔克斯、伟大的刘慈欣殿堂级的写作风格,怎么可能呢,这显然是无法实现的妄念。
但神奇而又合情合理的是:“莎士比亚风格”、“马尔克斯风格”、“刘慈欣风格”这三词在大模型居然可以。
复杂和简单的转换就是如此神奇而微妙。
一个真正简洁而直击需求的提示词最终的效果就是——“一支穿云箭,千军万马来相见”。
那支箭就是那一个或几个准确命中靶心的词,而千军万马则是那些原本散落在浩瀚语料中飘散的词,它们会如听到遥远的召唤一般:整齐出列、众神归位。
从这个意义上,语言学中的分支——语义学、语用学和计算语言学这三个子学科大概率会成为提示词工程师们可以高度参考的领域。
六
第二、提高信噪比是写提示词的核心目标
如果看了上面这一段,你认为我推崇极简的提示词,那么,你就错了。
事实上,我认为提示词该简单的时候应该简单,该复杂的时候应该复杂。
让我从信息论的角度来解释这一点——
我们如何写提示词,简单或者复杂,用自然语言或者代码风格,本质上意味着我们如何对自己的需求和想法进行编码。
有人用长的编码,有人用短的编码,从信息论告诉我们,如果表述足够准确,长编码和短编码在数学上是等价的。
但现实的问题在于,自然语言本身的特点容易让长的编码产生冗余和噪音,这就降低了提示词的信噪比。
什么意思?
比如,你要描述一个物体,你可以用形状、大小、颜色、密度来描述,这些不同维度在信息论上都是正交的,即一个维度和另一个维度没有任何关系。
但我们用自然语言描述的时候,往往很难做到正交。
比如我们经常写的提示词是这样的——
“请创作一篇关于AI的赛博朋克风格的科幻小说,要求简洁、明快、温暖。”
事实上“赛博朋克”本身就代表了一种符号化的风格,这种风格或许可以简洁、明快,但它内涵中“反乌托邦”的精神是不包含“温暖”这一取向的。
如果这样输入,信息不正交,就会产生噪音,降低提示词的信噪比,AI遇到这样不正交的提示词就会疑惑、懵B,最终输出的结果大概率会变成四不像。
因此,并不是一定要将提示词写短或写长,也并不是一定要用结构化或代码的方式,而是你的提示词的信息维度要尽量做到正交。
当我们输入“写一篇赛博朋克的小说”时,我们其实已经规定了主题倾向和风格。
那么额外的描述我们可以补充小说的“节奏”、“结构”、“人物关系”、“篇幅”等其他与“赛博朋克”正交的信息,这样的输入才是真正有效的输入。
关于这一点,从维特根斯坦的“语言图画论”也可以理解,他认为语言就是将世界的实际场景描绘出来的一幅画,语言是世界的映射。
同样,提示词也是一幅画,你可以画的简单、也可以画得复杂,但不能画成“五彩斑斓的黑”。
所以,重要的是用正交的信息编码来高信噪比地表达自己的需求:需求复杂,提示词维度就多一些,需求简单,提示词维度就少一些。
永远不要让形式大于内容。
七
第三、对一件事理解的深度是提示词效果的上限;
什么意思?
我们就以上面的例子作为说明,如果你是一位新闻学科班出身的同学,你大概率会在读到上面的文字时跳出来说——
“你这根本就不是华尔街日报的新闻报道风格,"华尔街日报体"作为一种新闻教科书中固定的文体早就已经是新闻学中的显学了。
它的基本特征是:首先以一个具体的事例(小故事、小人物、小细节)开头,然后自然过渡新闻主体部分,接着展开交待主题背景、深层逻辑,结尾再呼应开头,回归到开头的人物身上。
你上面的文字大概只能叫“倒金字塔”体,你明显是外行。”
(“倒金字塔体”据传源自南北战争电报经常断的时代,即把重要事实放前面,次要信息和细节依次放后边,这样电报在任何节点断掉都不太影响新闻效率。)
让我们来仔细讨论一下到底谁是外行?
的确,早在遥远的2013年,远没有今天火的马伯庸老师在知乎回答过一个问题——“什么叫做新闻写作中的「华尔街日报体」和「倒金字塔体」?”
(原贴地址:https://www.zhihu.com/question/21834756/answer/20410958 )
马亲王分别用“华尔街日报体”、“倒金字塔体”和“新华体”重新报道了“鸿门宴”这一历史事件。(本文创意的来源除了《剑桥倚天屠龙史》,另一个源头就是马亲王的这个无比惊艳的回答。)
其中“华尔街日报体”的开头是这样的——
“樊哙闯进鸿门宴会的时候,他的双手紧握着短剑和盾牌,头发直竖,眼角几乎要裂开。守门的持戟卫士试图要阻止他,但失败了。这位年轻时在沛县从事狗类屠宰业的的平民,此时正面对着天下最有权势的贵族项羽,高声发出严厉的指责,整个宴会现场鸦雀无声。”
没错,这样的文风确实是中国新闻教材中的“华尔街日报体”,但问题是——现实中的《华尔街日报》日常真的是这样报道新闻的吗?
当然不是!
事实上,上述原教旨主义的“华尔街日报体”一般只应用在非事件新闻的趋势特稿里,而现实中《华尔街日报》超过90%的日常报道依然像上面Claude输出的文字一样遵循简洁风。
我们用常识思考也会明白:一个正常的事件新闻,如果全都按以小见大的复杂套路来报道,而不是快速交待5W1H,那黄花菜都凉了,读者早跑光了。
马亲王当年精彩的回答只是示范不同文体在风格上的差异,在鸿门宴这个例子中,仔细阅读我们也会发现以小见大、细节颇多的“华尔街日报体”确实并不适合报道事件型新闻,其作可读性和效率远不如核心要素先行的“倒金字塔体”。
今天,我们《华尔街日报》的官网上看一看,通篇都是这样简洁、严谨符合“标题、导语、主体、结尾”这样主流格式的新闻。
真实《华尔街日报》日常新闻都是将最重要的信息放最前面
没错,我们如果只是拿着教科书上标签化的理论去套,那只在理解事物第一层,而理论和真实世界到底是如何映射的,这是理解事物第二层;
对于写提示词而言,其实还有第三层,那就是深刻理解目标任务和大模型训练逻辑之间的关系。
Claude理解中文语境中的“华尔街日报体”吗?
其实,并不理解。
我用“华尔街日报体”替代“《华尔街日报》风格”提问,出来的结果在风格上无差异,都是倒金字塔结构。
这背后的原因在于,中国新闻圈流行说的“华尔街日报体”其实国外讨论热度远不及国内。
以“Wall Street Journal Formula”、“Wall Street Journal Style”等相关关键词去Google搜索,结果并不算太多,而且英文语境中对这个词理解也不太一样,它们甚至给它取了另一个名字——钻石结构。
事实上,新闻领域著名的《华尔街日报如何讲故事》这本书中,也并没有公式化“华尔街日报体”这一概念,而是非常立体地讲述如何做采访、如何组织材料、如何让故事更具可读性。
但有一点,我们几乎可以肯定,Claude的训练语料中一定会有《华尔街日报》原始语料的。
作为在英语世界已经出版超过130年的报纸,Anthropic这样级别的公司大概率有100种方法绕过《华尔街日报》的版权限制,从而获得部分原汁原味的华氏语料,不然效果绝不会如此丝滑。
再回到本身的需求,在上面的Case中,我到底想要的是什么?
事实上,我非常清楚我想要什么,我当然不是想要原教旨主义的“华尔街日报体”。
这种文体除了不适合“大闹天宫”这种事件型大新闻外,例子篇幅太长也不符合本文“以小见大、一叶知秋”的初衷,我要的只是“双重陌生化”带来的反差感。
再思考一个问题:四大名著我为什么不选《水浒传》和《三国演义》?
这背后的原因在于:以《华尔街日报》动不动上价值的尿性,《水浒传》那些名场面生成的内容都会让我这篇文章分分钟过不了审。(不信你去试试)
而《三国演义》本身就属于政治领域,出来的反差感远不如前两者;我为什么不选择《西游记》、《红楼梦》中的其他章节?(留一道小小的思考题)
所以,在写任何一个提示词之前,我们应该问自己一句:我对这件事的理解足够深吗?
提示词真正的功夫,在提示词之外。
八
第四、模型比提示词重要100倍;
输入简洁版本提示词,输出在文风和用词上非常浮夸,而输入专业版提示词,输出在“形”上有所改善,但在“神”上差之千里。
所以,一个必须承认的事实是:至少在这个任务中,国内的大模型和Claude还有不小的差距。
当然,也必须客观说明的是,我猜测出现这种结果大概率和训练语料相关,事实上,在其他文字创作层面,国内模型和Claude差距就明显缩小,比如创作“古龙”小说风格的文字。
我前些天听了李继刚老师的一次分享,他在分享中列了一个公式——
输出效果=模型✖️(任务+提示词)
没错,我非常认可继刚老师对于模型和提示词在效果权重中的深刻洞察,这个公式最大的价值在于,它清晰地告诉我们获得理想输出效果的优化要素。
同时我也想在此基础上补充一点,从个人体验上看,在效果方差极大的文字创作领域,这个公式或许可以修改成——
输出效果=模型²✖️(任务+提示词)
所以,如果你想用AI创作出超预期的内容,请确保你所用模型的先进性;
在AI创作的世界,选择,真的远远大于努力。
九
到这里,既展示了有反差感强烈的例子,又挖掘了提示词背后的逻辑,文章本来可以结束了,但最后我还想引申出一个重要的推论——
AI的“消费型内容时代”已经来了!
什么意思?
在ChatGPT诞生后的两年,除了极少数AI极客群体,对于大部分人而言,至少在文字内容生产这一块,90%输出的是“应付型”内容。
单位要写一个通知、找AI;老板要求写一篇读后感、找AI;总结一个文档,找AI;这些内容的共同特征就是,它是“应付型”内容,它大部分只需要60分就行。
然而要做到“消费型内容”,即人们愿意花时间并且乐在其中的内容,60分是远远不够的,没有人愿意消费“首先.....其次.....总而言之”这种“AI味”扑面而来的、永远政治正确的文字。
而今天,无数传播甚广的案例表明,以Claude为代表的领先AI,在内容创作层面已经接近通过“艺术家图灵测试”。
即人们已经区分不了这些文字到底是AI生成的还是艺术家创作的,这就是标志着“消费型内容时代”到来。(当然,我指的是文本创造层面,图像领域早就做到了,但文本是远比图像要宏大得多的创作形式,篇幅原因不展开,有机会专门写长文章聊一聊这个。)
“AI消费型内容时代”意味着很多,意味着文艺逐渐进入“乱纪元”的新阶段,意味着旧的创意体系和生产结构会逐步瓦解,意味着内容领域依赖人“原创+优质+高频”的不可能三角开始松动,意味着复合科技和人文的“π”型人才可能比单一的“T”型人才拥有更多的结构性优势,意味着很多很多.....
但无论如何,人和人的创意,依然是一切内容生产的起点。
“降维实验室”这个账号建立的核心价值就在于:发掘AI创作的上限,用听得懂的语言和大家一起跟上AI的节奏,从容迎接“AI消费型内容时代”。
结语
塔西姆·辛是一位风格独特的电影导演,在电影之外,他拍广告片的开价也极高 。一次,一位广告主问他:你就拍一个30秒的广告 ,却要收超百万美元,是不是太贵了?
塔西姆·辛说——
“你花钱买到的不只是我做导演的这段时间,还有我喝过的每一口酒,品过的每一杯咖啡,吃过的每一顿美食,读过的每一本书,坐过的每一把椅子,谈过的每一次恋爱,去过的每一个地方,你买的是我全部生命的精华转化成的30秒,怎么会不贵?”
对于概率分布并不均匀的未来,我只有一句话——拥抱AI、拥抱生活!
—完—
作者:“降维实验室”主创潘寒,《三体》死忠,野生AI创作者,挑战AI的各种可能性。