8小时高铁,一堂最贵的AI课
五一旅途中的亲子AI实验
瓦叔 | 2026年5月
01
PHASE ONE/ 一道选择题
女儿的表姐远嫁沈阳,这个五一假期要去吃喜酒。
上海到沈阳,1738公里。摆在面前的选择题很简单:飞还是高铁?
飞机两个半小时。但你如果把"去浦东机场一个半小时、提前两小时到、安检排队、落地后再打车一个半小时到目的地"加上去——嗯,实际耗时也要近8小时。而且飞机座椅的靠背角度,对我的老腰是一种物理层面的不尊重。更别提五一的机票价格,那是直接劝退。
高铁呢?8小时出头,从上海虹桥直达沈阳北。车厢宽敞,可以站起来走走,有热水泡面——虽然时间差不多,但胜在体验感好。
综合权衡,选了高铁。
这也是孩子第一次出这么远的门。
02
PHASE TWO/ 第四个小时
出发前我们做足了准备:iPad下了电影和电视剧,Switch充满了电,零食塞了半个背包。心想8小时嘛,不就是看两部电影加睡一觉的事?
前四个小时确实还行确实还行——窗外风景新鲜,零食一包接一包,电影看了一部半。
但四个小时之后,新鲜劲过了。
女儿放下iPad,靠着窗户发了会呆。
我也放下手机,看了看窗外刷过去的电线杆。
然后不知道怎么就聊起来了。
"爸爸,你小时候也坐过这么长时间的火车吗?"
这一问,直接把我拉回了三十多年前。
03
PHASE THREE/ 绿皮车、K字头、和一段被颠碎的记忆
我是西安的。因为家庭的关系,往返上海的次数不少。
最早坐的是绿皮车。西安到上海,34个小时。你没看错——坐满一个白天、一整个晚上、再加一个白天,才能到。
车厢里没空调,夏天全靠开窗。到了夜里,过道上全是人——站票的、坐小马扎的、直接铺张报纸躺地上的。厕所的味道能飘半节车厢。火车路过每一个铁轨接缝处,都会发出"咣当、咣当"的声响,规律得像催眠曲,又吵得你刚睡着就被震醒。
后来有了K字头(快速列车),时间缩短到20多个小时。再后来T字头(特快)、Z字头(直达),一路缩到十五六个小时。
再后来就是动车、高铁。5个多小时。
我跟女儿讲:"你现在觉得8小时长,爸爸那时候34小时都熬过来了。"
她听得很入迷。但接下来她问了一连串问题,把我直接难住了——
"为什么以前的火车会'咣当咣当'响?为什么现在高铁不响了?"
"为什么以前火车起步和刹车都会晃得很厉害?"
"为什么运营过程中要停下来换火车头?"
"为什么以前的座椅是不能调节的?"
"从你那个时候到现在,火车一共升级了几次?"
"为什么现在还要保留慢车?不能全部换成高铁吗?"
前两个问题我还能答——铁轨有缝所以咣当,高铁是无缝钢轨;晃动是因为老式车钩是松连接的,一节一节被拽着走。
换火车头的事我也经历过——半夜火车停了,外面叮叮当当一阵响,问我爸,他说"在换车头"。因为有些路段没通电,电力机车跑不了,得换烧油的内燃机车继续走。
但"升级了几次"、"座椅是不能调节"这些——我自己都不是很清楚,更没法给她说清楚。
我说:"要不我们问问AI?"
04
PHASE FOUR/ 三个AI,一场现场实验
一开始我们就是随口问了豆包:"中国火车从上世纪90年代到现在经历了哪些速度升级?"
它给了个答案——对,但太浅了。就像百度百科的摘要,每个阶段一句话带过,说明不了什么问题。
这时候我想到了深度研究这个功能——不只是问一个问题,而是让AI去做一次系统性的调研,然后输出一份完整的报告。
豆包有这个功能,千问也有,Kimi也有。
我跟女儿说:"要不三个都试试?看看它们会给出什么不一样的东西?"
她一听来了兴致:"好!看谁更厉害!"
于是我们同时给三个AI布置了同一个"作业":
请深度研究"中国火车速度的发展历程(1990-2026)",包括每次提速的背景、技术变化、速度对比。
结果——
Kimi:直接拉跨。
明明显示有一次免费额度,但点进去就弹"当前使用人数过多,请升级为VIP后再继续"。试了好几次,每次都这样。要么正值五一假期高峰期嘛,能理解,但也确实让人没脾气。只能放弃。
千问和豆包:都顺利跑完了。
而且两个都不只是给了文字报告——还各自生成了一个网页交互版,读起来更直观。
豆包更绝——除了文字和网页版,还生成了一段播客。两个AI主播一搭一档地聊中国铁路提速的故事,听着就像在听一期知识类播客节目。
女儿说:"这个好!我可以戴耳机听!"
05
PHASE FIVE/ 当AI说的不一样
有意思的来了。
我们对比两份报告的时候,发现了一个问题:有些数据对不上。
⚠️ 数据打架现场
·第三次大提速后的平均速度:豆包说 59km/h,千问说 60.3km/h
·西安到上海高铁最快时间:豆包说 5小时50分,千问说 5小时39分
·千问在一个地方说郑徐高铁"2014年开通",另一处又说"2016年开通"——自己都前后矛盾
我跟女儿说:"你看,AI给的答案不一定都对。同一个问题,两个AI说的都不一样。怎么办?"
她想了想:"那就再找一个来判断?"
"对!这就叫'交叉验证'。"
于是我们把两份报告丢给了DeepSeek,让它来做一次对比分析——哪些数据是两边一致的(可信度高),哪些是有冲突的(需要进一步核实)。
DeepSeek给出了一份很清晰的对比表。我们发现:
✓大部分关键数据是一致的:六次速的时间、京津城际开通日期、CR450试验速度……两个AI都对上了
✗豆包犯了一个明显错误:在讲2000年第三次大提速时提到了"和谐号"——但"和谐号"这个名字是2007年才有的,2000年根本不存在
✗千问犯了更多小错:郑徐高铁开通时间自相矛盾,"中华之星"试验时间也搞错了
我问女儿:"那你觉得哪个更好?"
她说:"豆包讲得更细更深,但千问看起来更舒服。"
这个评价,说实话,和我后来仔细对比后的结论几乎一样——
豆包像一个严谨的工程师,什么都要讲透,但读起来费劲;千问像一个好记者,写得清楚漂亮,但有些地方不够深。
06
PHASE SIX/ 一堂关于"不信"的课
整趟旅程下来,女儿实际学到了什么?
铁路知识当然学了不少——她现在知道"咣当声"是因为铁轨有缝(每25米一截,热胀冷缩要留缝隙),知道高铁用的是500米长的无缝钢轨;知道以前火车停站换车头是因为有些路段没通电;知道中国铁路从1997年到2007年一共提了六次速。
但我觉得她学到的最重要的一件事,不是任何知识点。
是这个:
AI说的,不一定对。
不是说AI不好用——它确实好用。十来分钟出一份几十页的深度研究报告,这在以前是不可想象的事。但"快"和"对"不是一回事。
两个AI给出不同答案的时候,你不能随便信一个。你要做的是——
1 对比:让多个AI做同一件事,看看哪些信息是"共识"(大概率对),哪些是"分歧"(需要验证)
2 追问:发现不对的地方,接着问"你确定吗?依据是什么?"
3 质疑:看到一个结论,先问自己"这合理吗?"——就像女儿问"和谐号2000年就有了?那为什么我查到的说是2007年?"
这三步,其实不只是用AI的方法。这是独立思考的方法。
我跟女儿说:"你以后不管是问AI还是看书还是听别人说,都记住一件事——"
"什么?"
别人说的,先信一半。自己验证的,才信一整个。
她点了点头。
然后说:
"爸爸,那你说的也只能信一半咯?"
"……"
好吧。教育成功。
8小时的高铁,本来以为最难熬的旅程。
结果回过头来看,那段父女俩对着手机屏幕一起较真、一起吐槽、一起发现"AI也会犯错"的时光——比任何电影都精彩。
瓦叔 · 2026年5月
— END —
如果你也带孩子做过AI实验,来评论区聊聊?
欢迎点赞 / 在看 / 转发,让更多家长一起玩起来 🚀
点赞
在看
转发
THANKS FOR READING