当大模型参加高考:摊牌了,我就是个文科生

105 阅读2分钟

2024年的高考落下帷幕,当莘莘学子走出考场,收剑入鞘的时候,大模型拉出来溜溜,看看以今天大模型的水准,参加高考到底是什么样的表现。

近期,极客公园做了一次相当完整的测试,基本把主流的大模型全都牵了出来去做高科全科试卷,其中有大模型天花板的GPT-4o、 四个国内大厂的产品(百度、阿里、腾讯、字节)和四个新锐独角兽(百川、智谱、月之暗面和 MiniMax)的公开模型产品。相比于简单的写命题作文的方式,他们这次直接使用新课标I卷,提升了难度等级。

先看结果吧。

毫不意外,大模型做文科题几乎就是在**打表演赛,**语文、英语已经政史地主要的拿分点在于信息储备和总结概括,这正是大模型擅长的地方。按照河南省本科线的录取标准,前四个模型冲进了文科一本线,在这方面,国内的大模型和GPT-4o基本不相上下。

再来看看理科题,一个好消息,一个坏消息。坏消息是大模型做理科题基本就是车祸现场了,大部分模型连400都不到,没有一个达到河南省理科一本线。好消息是天花板的GPT-4o和国内的大模型也差不多,旗鼓相当的差。

中外大模型的长板很接近,短板也大差不差。很多科目里,国产大模型的表现超过了GPT-4o,GPT凭借先发优势、算力和芯片的优势并没有取得断崖式的领先,国内大模型还是有一战之力,也算是一个值得欣慰的消息。

最后,还是要为大模型辩解下,人类考生有至少一年时间在各科老师指导下学习专门针对高考优化答题策略和技巧,如果对大模型也做针对性的微调和训练,结果会是怎么样呢,值得期待!

文章来源:

AI大模型探索坊