如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-20 03:05:14
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19 20:00:16既然富人财富占社会总财富的 80%,那么鼓励富人消费不就可以了吗?
- 2025-06-19 20:05:15你的亲戚提过什么过分的要求?
- 2025-06-19 20:25:16有没有一个时间段,自己乐在其中,可亲人或者朋友却觉得你很辛苦,很心疼你?
- 2025-06-19 20:20:16为什么他们可以闻出来我身上的穷酸味?
- 2025-06-19 20:35:16如何看待 2026QS 世界大学排名?
- 2025-06-19 19:45:16能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
- 2025-06-19 20:30:16夸克网盘有可能超越百度网盘吗?
- 2025-06-19 19:45:16PHP现在真的已经过时了吗?
- 2025-06-19 21:00:16大家猜猜伊朗的结局如何?
- 2025-06-19 19:30:17为什么中国企业几乎没有输出先进的管理理论?
推荐产品
-
有个少数民族的女朋友是什么体验?
她是我去南疆旅游时,在火车上偶遇的,当时运气好到爆棚,她竟然 -
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最 -
想给家里换个静音节能的燃气热水器,哪个品牌比较好?
现在市面上很多热水器都宣传“静音”,但不少其实是“伪静音”— -
为什么电影工业中很少使用Premiere剪辑?
2025 年 6 月更新 (25.3)Premiere Pr
新闻动态
最新资讯