划重点
01谷歌发布了Gemini 2.0 Flash Thinking,一款具有推理能力的聊天机器人,可在编程、数学、创意写作等方面取得优秀成绩。
02与OpenAI的o1-preview相比,Gemini 2.0 Flash Thinking在推理速度上具有明显优势,且在各项评测任务中均排名第一。
03该模型能准确识别视觉内容并进行数学推理,但偶尔会犯错,如无法正确识别包含多个“r”的单词“strawberry”。
04除此之外,Gemini 2.0 Flash Thinking还能理解和解答非常困难的问题,如三赌徒问题,成为首个正确解答该问题的模型。
以上内容由腾讯混元大模型生成,仅供参考
编辑:Panda、小舟
不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。
OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。
https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-1219
三赌徒问题:假设三个赌徒最初有 (a, b, c) 美元。每次试验都是随机选择两个玩家,让他们公平地掷一枚硬币;根据输赢,他们会正常地转手 1 美元。玩家一旦破产,就会退出。令 (S_1) 表示一名玩家破产所需的游戏局数。令 (S_2) 表示两名玩家破产所需的游戏局数。求 S_1 和 S_2 的期望。
查看原图 366K