如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-20 09:55:17
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19 22:15:16伊朗这次让以色列打惨了,这个国家还能挺过来吗?
- 2025-06-19 21:25:17如果让你设计攻打台湾地区,你会有什么好的想法和打法?
- 2025-06-19 22:10:16只能选一个,你选谁?
- 2025-06-19 22:40:16为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别?
- 2025-06-19 22:10:16为什么董明珠攻击小米空调,而公牛却没有攻击小米插座?
- 2025-06-19 22:30:16如何评价“寡姐”斯嘉丽·约翰逊的身材?
- 2025-06-19 21:55:16刘强东称「跨境电商的模式长期来看不可持续」,有依据吗?京东不走跨境电商模式,对其国际市场布局有何影响?
- 2025-06-19 21:50:16字节跳动会超越腾讯吗?
- 2025-06-19 21:25:172025年了 Rust前景如何?
- 2025-06-19 22:25:15单依纯的唱功有被过分吹捧吗?
推荐产品
-
买到烂尾楼到底该有多绝望?
1 见过发短***维权的,也见过发短***擦边的。 这是第 -
为什么广西盛产鬼火少年?
因为穷,因为留守儿童很多。 所以留给发展成黄毛小太妹的基数 -
有哪些事情是MacOS做不到但Linux可以做到的?
主持人 Paul 问:您认为新款苹果笔记本电脑如何? Lin -
如何看待《剑星》已登顶 Steam 全球热销榜?
制作人叫金亨泰——King Hentai,不对,Hentai
新闻动态
最新资讯