还记得一年前的Claude 3.5吗?它还只能在宝可梦的世界里摸爬滚打,勉强到达常磐森林。而两个月前的Claude 3.7,虽然能击败道馆主,但离通关还差一步之遥。如今,Gemini 2.5 Pro横空出世,不仅成功通关了《宝可梦:蓝》,还成为了宝可梦联盟的冠军,简直让人刮目相看!
在直播过程中,我们可以看到Gemini每一步都深思熟虑。它先是通过截取屏幕截图并检索游戏状态数据,然后用网格覆盖处理图像,辅助空间推理。接着,将屏幕截图和游戏信息发送给模型,AI决定是直接响应还是调用专门的智能体。解析响应内容,确定按下哪个按钮,执行按钮按下操作,并等待游戏更新。这个过程,Gemini重复了无数遍,最终完成了通关大业。
虽然Gemini已经成为了联盟冠军,但在宝可梦这款主要面向儿童和青少年的游戏中,大模型的表现仍然明显不如人类。这主要是因为大模型视力不佳,难以解读Game Boy屏幕中展现出的低分辨率、像素化的世界。同时,游戏中的二维地图也对大模型构成了挑战。
在游戏中偏文本的部分,大模型已经展现出了惊人的表现。例如,在宝可梦对战中,Gemini能够迅速理解游戏提示,并将这些知识整合到自己的战斗策略中。这种能力,让人不得不佩服AI的强大。
Gemini和Claude都是宝可梦直播游戏界的佼佼者,但两者之间却有着不少差异。
首先,导航方式上,Claude有个自动导航工具,而Gemini则需要自主决定目的地,然后自己规划路线,或者调用一个路径规划智能体来寻找最优路径。这个智能体能独立思考,甚至用BFS(广度优先搜索)这类算法来规划。
其次,信息获取上,两者接收到的游戏信息和使用的工具也不同。Gemini需要自己分析游戏截图和游戏信息,而Claude则可能拥有更多的辅助工具。
思维模式上,每个模型思考方式不同,各有擅长。Gemini擅长逻辑推理和策略规划,而Claude则更擅长快速学习和适应。
Gemini的突破:为AI在游戏领域的应用开辟了新的道路
Gemini 2.5 Pro的成功通关,无疑为大模型在游戏领域的应用开辟了新的道路。未来,或许会有更多的大模型加入到游戏世界中,与人类玩家一较高下。而测试大模型的基准,也许真的会变成谁能更快通关宝可梦了。
当然,AI在游戏领域的应用还远不止于此。未来,我们或许能看到更多AI与人类玩家共同竞技的场景,甚至AI还能成为我们的游戏导师,帮助我们提升游戏技巧。
Gemini 2.5 Pro的宝可梦直播通关,无疑是一场科技与游戏的盛宴。让我们期待未来,AI在游戏领域的更多精彩表现吧!