山河记得:用数据点亮烈士的足迹

今天是又一个烈士纪念日。

据不完全统计,近代以来约有2000万名烈士为民族独立、人民幸福英勇献身。

在这2000万人中,约有180万人留下了姓名,被录入《烈士英名录》。

这些烈士们从哪里来,又去向何处?

我们想对烈士进行一次特殊的纪念,使用数据,来追寻他们的足迹。

我们基于英烈网的数据,进行了一次跨越时空的探索。

在《中华英烈网》,我们能看到每一位烈士的信息。

图片
图片

这些信息包括烈士的籍贯、出生年月、牺牲日期、地点以及烈士事迹。

下图列出了烈士的年龄分布。烈士平均年龄仅为26.6岁,中位数为25岁。在100年前的今天,牺牲的烈士有一半正是“00后”。

图片

下图列出了烈士牺牲的年份分布,可以看到两个明显的高峰,1939年和1948年。

图片

下图列出了烈士籍贯所在城市的前20。赣州排名第一,共有10万余名烈士登记在册,排名第二的是吉安,第五名上饶,在册烈士故乡前五名中,有三个城市地处江西。如果计算占人口比例,赣州、吉安等地同样排名前列。

图片

下图列出了烈士的牺牲距离分布,即从家乡到牺牲的地点,有多少公里。得益于昨晚更新的Deepseek V3.2,我们从180万名烈士的事迹、牺牲原因、牺牲地点中抽取出了每一位烈士最后战斗的地点,并映射到城市层面。原本高度非结构化的烈士事迹数据,也能够被匹配到今天的每一座城市,

比如一名籍贯江西的烈士在1928年时“在攻打下埠战斗中牺牲”,那么大模型将能够从地名、年份和籍贯综合推测该烈士的牺牲地点,正是在江西省萍乡市湘东区的下埠镇,而不是其他地区带有“下埠”的地名。

使用大模型,我们使用4个小时完成了对120万名可以分辨牺牲地点的烈士的牺牲地点坐标计算。做完了人力在数个月内都不可能完成的工作。

下图中可以看到,一半以上的烈士的牺牲地点就在家乡,但另外一半则并非如此。烈士牺牲的地点距离家乡平均达到183公里,有超过10%的烈士牺牲在离家500公里以外的地方,最远处达到了4000公里。

图片

最后,使用烈士牺牲的地点,我们试图绘制出烈士们的足迹。

在计算距离时,我们算出了牺牲于每一年,每一座城市的烈士人数,接下来我们要从180万条烈士数据中抽取这座城市出现的最重要的事件——同样使用Deepseek V3.2。

例如一名牺牲于海丰县的烈士的事迹中提到“在海陆丰农民运动中于一九二七年十二月间参加革命战斗牺牲”,从中抽取出牺牲时的战斗或者运动“海陆丰农民运动”,再将这个地区的牺牲烈士参与的活动汇总,我们便知道某个地区的烈士在某一时刻主要是在哪一场战斗中牺牲的。

于是,就得到了下面的视频。

一寸山河一寸血,红色圆圈越大,说明这是战斗越激烈的地方。

当整个屏幕都出现了从小到大的红色圆圈时——我们仿佛听见了那穿越时空的隆隆炮声,感受到那份“青山处处埋忠骨”的炽热与决绝。

星星之火,可以燎原。

今天是又一个烈士纪念日,明天,便是国庆。
正如我们前面看到的那样,牺牲烈士最多的年份,正是1948年,也就是共和国成立的前夜。
假如没有烈士们的牺牲来刺破这浓重的黑暗,前夜,只会持续得更久;光明,也许更迟到来。
也许,这正是烈士纪念日和国庆紧密相连的最具象化体现吧。