于台烟

AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行河南“黑老大”宋留根:90年代资产过亿,曾率领部下剿灭外省黑帮

字号+作者:天音网-网赚博客来源:果洛藏族自治州2025-01-28 05:40:52我要评论(0)

【CNMO科技消息】近几天,各省2024高考成绩陆续公布,不少高分学霸也开始登上热搜受到网友们膜拜。而有媒体近日举办了一项“另类高考”,让近两年大火的AI大模型来模拟考生作答高考试题,看它们的表现究竟

【CNMO科技消息】近几天,各省2024高考成绩陆续公布,不少高分学霸也开始登上热搜受到网友们膜拜。而有媒体近日举办了一项“另类高考”,让近两年大火的AI大模型来模拟考生作答高考试题,看它们的表现究竟如何。

从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。根据介绍,本次大模型高考评测与河南省考卷完全相同,而河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI成功冲上一本线。根据最如此可爱的我们 新河南高考分数段统计数据,GPT-4o的562分在文科考生中排名8811名,相当于人类考生的前2.45%,豆包则处于前4.27%的位置。

语文作为文科的重要组成部分,是大模型与人类考生展开激烈竞争的舞台。国产大模型凭借对中文语言的独特理解和处理能力,表现可圈可点。百小应、字节豆包和腾讯元宝占据了前三的位置。英语考试中,大模型在阅读和语言运用等客观题上展现出了较高的水平,GPT-4o、百小应、通义千问等甚至获得了80分的满分,豆包和文心4.0也接近满分。但在40分的写作考试中,如此可爱的我们 最高分仅为29分,由GPT-4o和百小应获得。

不过在理科方面,大模型的水平相比人类顶尖考生的差距就有点过大了。大模型的理科最高分还不到480分,多数大模型的理科总分在400分以下。在数学考试中,9款大模型产品中仅有GPT-4o、文心一言4.0和豆包获得60分以上的成绩(满分150分)。在化学和物理考试中,情况更为严峻,平均分数分别只有34分和39分。化学单项最高分49.5分由豆包获得,而GPT-4o仅有42分。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 日本Rakuten Mobile直言:英伟达AI-RAN行不通!当你六十多岁时,还要照顾八九十岁的父母,就会看到三个家庭真相

    日本Rakuten Mobile直言:英伟达AI-RAN行不通!当你六十多岁时,还要照顾八九十岁的父母,就会看到三个家庭真相

    2025-01-28 04:29

  • ​男人不会轻视的女人,大多具备以下3种“顶级思维”!男女交往,即使再喜欢对方,你也要明白这4个潜规则

    ​男人不会轻视的女人,大多具备以下3种“顶级思维”!男女交往,即使再喜欢对方,你也要明白这4个潜规则

    2025-01-28 04:07

  • 带货不赚钱?辛巴撤了,小羊哥不怎么播了,两个头部主播要去搞AI期中总结:华为教育中心的 “宝藏” 功能别错过

    带货不赚钱?辛巴撤了,小羊哥不怎么播了,两个头部主播要去搞AI期中总结:华为教育中心的 “宝藏” 功能别错过

    2025-01-28 04:07

  • 闲鱼日均GMV破10亿,过去一年超1亿人发布闲置,95后用户最活跃判断男人爱不爱你,看他在这3种情况下,对你的态度就够了

    闲鱼日均GMV破10亿,过去一年超1亿人发布闲置,95后用户最活跃判断男人爱不爱你,看他在这3种情况下,对你的态度就够了

    2025-01-28 03:37

网友点评