分布式学习、贝叶斯统计学
大规模的时间序列预测方法
……
在这些常人觉得专业甚至晦涩的术语中
李丰却“怡然自得”
找到了自己的追求
今年,李丰加入了
北京大学光华管理学院
担任商务统计与经济计量系副教授
他希望秉承“常为新”的北大精神
成为学术思想上的“新人”
做好研究,教好学生
通过自己的努力影响一些人
让社会变得更好一些
让研究成果真正落地
通过大数据预测某一个产品在天猫等平台的销量,以实现更精准的库存管理;通过大数据预测某一个区域在用餐高峰的外卖下单量,以帮助美团等平台做出更精准的外卖骑手的数量匹配;通过大数据分析本地股票投资者的公开发帖和情绪表达,不仅可以预测股票走势还能沟通投资者……这些都是李丰和团队进行的研究。
“以前我们只分析一条时间序列,但随着海量数据的涌现,几万条时间序列需要同时处理。我们将这种新的计算方法和预测范式,应用于管理实践中,进行大规模的时间序列预测。”李丰说。
如今,李丰致力于贝叶斯统计学、大规模的时间序列预测方法、大数据分布式学习等方向的研究。他的最新研究成果发表在统计计算与预测期刊Journal of Computational and Graphical Statistics , International Journal of Forecasting,管理与会计期刊European Journal of Operational Research,Contemporary Accounting Research等,著有《Bayesian Modeling of Conditional Densities》《大数据分布式计算与案例》和《统计计算》。
对于自己的研究,李丰以电商平台进行了举例。李丰表示,电商平台每天都有海量的产品销售,而这些企业每天要考虑的一件事情就是如何做到“零库存管理”——即在存储和销售之间实现平衡,不能把货物积压在仓库里。所以电商平台每天都要预测第二天的商品销量预期,这样就能及时保证预期的销量和仓库的库存是匹配的,进而保证物流和现金流转起来。而预测的准确率越高,企业的成本就能降的越低。
“如果电商平台只卖一个产品,那可能管理起来很简单。但现实是,这些电商平台有多少商品大类,大类下面又有多少小类,每一个小类的需求又都不一样,各类直接又有层级关系。有些东西可能一周买一次,有些东西可能每天都得买。在这样的需求下面,就会产生大量的时间序列,数以万计、千万计的时间序列累积在这里。”李丰说。
在进行研究的同时,李丰和团队开发出许多具有自主产权、适用于海量数据的开源统计和机器学习软件,被知名企业采用,直接应用于企业的产品线上。李丰和团队的每一篇论文,都会附带一个R或者Python的软件包,放在网上供大家免费使用。
“应用型研究的价值是什么?结果能不能复现,有没有公开的代码让大家使用?不然做了一个很花哨的东西,看着很好,却没法使用,甚至没办法让别人拿来测试,那这个东西的价值在哪里呢?要想让研究成果快速的用起来,就必须做成可用的产品供大家来实践验证。”李丰说。
通过这种方式,李丰和团队让他们的研究成果真正落地,为头部电商企业、能源公司和政府部门提供了实际解决方案。无形中,他们也形成了独具一格的研究特色:在提升学术影响力的同时,为社会创造了实际价值。
学成归国与光华结缘
李丰对数据和统计的探索,起源于大学期间。本科就读于中国人民大学统计学专业的李丰,在读书时出于兴趣就开始自学编程,将统计学与计算机结合起来。本科毕业后,李丰前往瑞典学习,主要研究方向为贝叶斯统计学,并在斯德哥尔摩大学取得博士学位,其博士论文也获评2014年瑞典最佳统计学博士论文。
“读博士的时候,我们要做计算,要算模型,当时我们遇到了很大的计算挑战,就在瑞典用他们的国家超算平台,把我们写好的算法放到这个平台上运行。我们发现居然一个小小的指令可以调动那么大的集群、那么大的算力,去完成一个复杂的计算。这也让我明白了,只要工具好,它就能解决实际问题。”李丰说。
回顾博士生涯,李丰说导师Mattias Villani给予了自己很大影响:他是经济学家,但在计算机和统计学方面有深厚的积累,将贝叶斯工具用在中央银行的一些政策制定上,解决了实际问题。
“所以,这么多年来,我也希望成为像他这样的人,能够将所学的知识组合起来,形成一个能解决实际问题的工具链。”李丰说。在他看来,导师这种复合型的背景影响了自己,让自己意识到做好学术研究,一定要运用好统计和计算的工具。
在李丰看来,读博不仅仅是为了获取学位,更是培养深度思考与研究能力的过程。对于那些希望在学术、科研或高度专业化领域发展的人来说,博士学位是深层次的职业投资。并且,读博是一个发现自我、探索未知的机会,是一个锻炼解决复杂问题能力和独立思考能力的宝贵阶段。
这样的成长经历,让计算成为李丰特有的优势。在2013年博士毕业后,李丰回国任教于中央财经大学,并成为国内较早开始给本科生与研究生讲述分布式计算、分布式集群的学者,强调计算的重要性。
应北京大学光华管理学院王汉生教授的邀请,李丰回国后的首场报告是在北大光华进行的。之后,他又在由北大、人大、央财等五校联合培养的大数据分析硕士项目中讲授《大数据计算》课程。2019年至今,李丰受邀为光华管理学院BA项目同学讲授《分布式计算》课程,连续上了五年。
李丰将自己的专业所学,通过课堂传递给了更多的人。或许是无形中的积累,或者是冥冥中的注定,李丰在今年正式加入了北京大学光华管理学院。对他来说,这意味着一个全新的开始。而这些年与光华的接触,也让他对这个学院有了更多了解,也更有底气担负起这份工作。
“可能对每个人来说,北大都是戴着光环的。北大是常为新的,我也希望成为一个学术思想上的新人,做些不一样的事情,形成一些有影响力的成果,通过自己的研究影响一些人。”李丰说。
让社会变得更好一些
新学期,李丰在北大光华开设的课程从只面向BA同学的《分布式存储与计算》,升级为一门面向更多管理类同学的《大数据技术与预测方法》。这门课中,他将告诉大家从人工智能的角度如何更好地理解数据、用好数据。
“其实我很喜欢给非计算机专业的同学讲计算机的课程,因为我会像storyteller一样给大家讲故事。这些学生将来可能会是管理者,而管理一百个人就像管理一百台计算机,如果连计算机都管理不好,怎么能管理好人呢?”李丰说。在他看来,计算机是人类最坦诚的伙伴,你给它下达指令,它就可以帮助完成任务,这样有助于学生更好地理解如何用新的计算范式来处理和运用数据。
而在课堂上,李丰强调统计概念的实际应用,特别是在大数据和人工智能领域。通过实际的例子、案例研究和实际项目,让学生不仅获得理论知识,还能够获取将统计方法应用于解决未来职业中复杂问题所需的技能。
对于学术研究,李丰认为最重要的是思考与合作。
“有时候,我们需要让自己停下来,专门进行思考。所有的知识点都是相通的,就像一个庞大的知识网络,你需要将过去与现在,将自己与他人,将不同领域的思想与研究串联结合起来,形成更深刻的内容。”李丰说。
至于合作,李丰表示,自己有新意的论文,一定是多与人合作的产物。当和别人合作的过程中,每个人都会讲自己领域的语言,了解在这一领域里别人是怎么表述的,有没有用到别人的某些思想,可能会对自己的研究有更好的帮助。
除了研究与教学以外,李丰还保持着看新闻、写代码的习惯。李丰的家乡是内蒙古,从内蒙古到北京再到瑞典,然后又回到北京,他一直在一条自己选择的路上慢慢地、坚定地向前,正如他很喜欢的电影《阿甘正传》一样。
“阿甘代表着我们每一个人,你可以不用跟别人比,而是专注于自己的事情,一直跑,不管跑的多慢,只要时间足够长,就能到达很远的地方。慢慢的,你就变成了自己想要成为的样子。”李丰说。在他看来,每个人都要有自己的节奏,不用担心别人怎么说,自己内心要有一种“inner peace”,然后才能够做有意义的事情,可能这就是规避“内卷”的途经。
对于未来,李丰期待在专业领域继续探索,用自己的研究和努力做出一些研究、解决一些问题、影响一些人。李丰也希望教授的光华学子,能用自己的实际行动让我们的环境和世界变得更加美好。
“我觉得一个老师要有自己的特点。我们做科研不只是为了发论文,而是希望它能够解决一些问题。尤其是在北大、在光华这样的地方,我们希望培养出来的学生,能够让我们所处的环境和世界变得更好一些,同时也希望他们能够影响到一些人,然后这些人一起让我们的社会变得更好一些。”李丰说。
李丰,北京大学光华管理学院商务统计与经济计量系副教授、研究员、博士生导师。本科毕业于中国人民大学,博士毕业于瑞典斯德哥尔摩大学(获瑞典最佳博士论文Cramér奖),研究领域包括贝叶斯统计学、大规模时间序列预测方法、大数据分布式学习等。最新研究成果发表在统计计算与预测领域的期刊,如Journal of Computational and Graphical Statistics、International Journal of Forecasting,管理运筹期刊 European Journal of Operational Research,以及金融会计期刊 Contemporary Accounting Research 等。主持了国家社会科学基金一般项目、国家自然科学基金青年项目,以及阿里巴巴创新研究计划等多个项目,同时开发出适用于海量数据的分布式计算和时间序列预测算法和软件( 详见 https://github.com/feng-li),著有 Bayesian Modeling of Conditional Densities、《大数据分布式计算与案例》和《统计计算》。
来源 | 北大光华学术资讯、北大光华对外关系部
编辑 | 王蒙