国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

八月 5, 2025 - 23:36
 0  0
国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

IT之家 8 月 6 日消息,科技媒体 webpronews 昨日(8 月 5 日)发布博文,报道称谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平台上,举办“AI 国际象棋”比赛,邀请 OpenAI、Anthropic、谷歌、Kimi、Deepseek 在内的顶尖模型一较高下。

DeepMind 表示,本次“AI 国际象棋”比赛的目的,是检验顶级 AI 模型的推理能力。本次活动将于 8 月 5~7 日举行,每日举办一轮比赛,由国际象棋大师 Hikaru Nakamura 和流媒体播主 Levy Rozman 解说。

在 AI 发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估 AI 的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。

IT之家附上本次参赛选手如下:

  • Gemini 2.5 Pro(Google)

  • Gemini 2.5 Flash(Google)

  • o3(OpenAI)

  • o4-mini(OpenAI)

  • Claude 4 Opus(Anthropic)

  • Grok 4(xAI)

  • DeepSeek R1

  • Kimi k2(Moonshot AI)

根据首日战况,OpenAI 的 o4 mini 胜过 Deepseek-R1、OpenAI 的 o3 超过 Kimi K2 Instruct 模型、谷歌的 Gemini 2.5 Pro 胜过 Claude Opus 4、xAI 的 Grok4 模型超过谷歌的 Gemini 2.5 Flash。

你的反应是什么?

喜欢 喜欢 0
不喜欢 不喜欢 0
喜爱 喜爱 0
有趣 有趣 0
愤怒 愤怒 0
悲伤 悲伤 0
哇 0