破译近50年前的费曼点餐难题

问AI · 费曼的点餐困境如何启发决策论研究?

图片


图片


物理学家理查德·费曼(Richard Feynman)曾在手写笔记中描述了一个决策问题及其解法,但近50年来,这些笔记的含义一直是一个谜。


在一项新发表于《美国国家科学院院刊》的研究中,几名研究人员从费曼的笔记中破译出了这个问题及其解法,并从心理学与行为科学的角度,证明费曼给出的解法是最优的。



  点餐引发的数学题  


故事要从20世纪70年代末说起。一天,费曼和朋友拉尔夫·莱顿(Ralph Leighton)常去的一家泰国餐厅吃饭。那天,莱顿在犹豫:是点自己一直以来最喜欢的姜汁鸡,还是去试试菜单上的其他菜,看看是否能找到更好吃的选择。


于是,费曼开始在纸上写写画画,他把莱顿的“点餐困境”转化成了一个数学问题,并宣称自己找到了一个数学解法。在他对这个情境所做的简化模型中,他计算出了一个阈值在此之前,继续尝试新菜也许值得;但一旦超过这个阈值,最理性的做法就是停止探索,固定点目前最喜欢的那道菜


这个餐厅点菜的例子,其实可以代表许多情境下的决策。现实生活中的例子包括买房时如何选择、决定与谁合作,以及选择把车停在哪里。


费曼所做的,是把一个餐厅点菜的困境,转化成了决策论中的一个问题。更具体地说,费曼的问题属于决策论中一类更大的问题,叫作“最优停止问题”。这类问题对应着许多现实场景:一个人必须判断,眼前这个选择是否已经足够好,还是应该继续寻找更好的机会。


图片

费曼关于餐厅问题的手写笔记。图片由拉尔夫·莱顿提供。(图/Richard P. Feynman (estate). via PNAS


可惜的是,费曼从未发表过他的分析。这次谈话留下的唯一记录,就是费曼当时写下的手写笔记。莱顿碰巧把它保存了下来。但由于费曼的字迹颇为难认,其中一些内容长期以来并不清楚。



  把点餐变为实验  


费曼关注的是一家餐厅里的单个菜品,但在新的研究中,研究人员设想的是一座城市里的多家餐厅,这二者有着相同的数学表述。他们想要检验人们的实际选择是否会接近数学上的最优解,并把点餐问题转化成了一个由2520名参与者参与的在线游戏。


参与者需要想象自己来到一个陌生城市,停留时间从一周到四周不等,并且每天晚上都必须选择一家餐厅吃饭。在这个游戏中,每家餐厅都有一个于0到100之间的固定分数,代表它的质量;参与者会根据所选餐厅的质量获得分数。但在第一次尝试这家餐厅之前,这个值是未知的。研究人员假定,这些分数服从均匀分布,也就是说,在0到100的范围内,任何分数出现的可能性都相同。


参与者的目标是:应该如何决定每晚去哪家餐厅,才能让这些餐厅的值的总和最大?



  何时停止探索?  


研究人员发现,随着行程接近尾声,参与者越来越不愿意冒险尝试新餐厅简单来说,实验结果显示,虽然参与者并没有真的算出费曼的最优公式,但他们的行为很接近这个最优解一开始,他们更愿意探索新餐馆;越接近行程结束,他们越倾向于回到目前发现的好餐馆。


此外,研究还发现,与线性阈值模型的预测相比,参与者通常倾向于探索更多。这表明,在最优停止任务中,参与者会根据潜在分布来调整自己的阈值标准。总体来看,这是一种简单但行之有效的策略,其行为逻辑与费曼的最优公式非常相似。


不过,值得指出的是,虽然费曼的问题可能在经济学和市场营销中有所应用,但它并不能完整模拟人们在真实餐厅中的行为。尤其重要的是,这个模型没有考虑“厌倦”这一因素。因为在模型中,参与者的最优选择是一旦找到最佳菜品,就从此固定下来。


但在现实生活中,一个人可能会每隔一次点自己喜欢的那道菜,其他时候继续探索菜单上的新选择。不过,研究人员表示,这个问题确实把我们日常生活中非常熟悉的一种基本张力提炼到了最核心的形式:到底是继续做自己最喜欢的事,还是尝试一些新的东西。


#参考来源:

https://www.pnas.org/doi/10.1073/pnas.2509612123

https://www.nature.com/articles/d41586-026-00821-4

#图片来源:

封面图&首图:CERN PHOTOLAB (CC BY 4.0)