精品色哟哟视频在线观看,小b艹干翻爽入大鸡视频,大奶女上位视频91蝌蚪,91自拍偷拍视频第一页

您的位置:首頁(yè) >觀察 > 正文

焦點(diǎn)快播:五大模型解高考數(shù)學(xué):阿里通義千問(wèn)、360智腦10題全錯(cuò)得0分;訊飛星火答對(duì)一半

一年一度高考季,高考試題是大眾關(guān)注的焦點(diǎn),也成為了AI能力的試金石。AI大模型數(shù)學(xué)功底到底如何?比人類“聰明”嗎?搜狐科技使用五款A(yù)I大模型對(duì)2023高考上海數(shù)學(xué)試卷進(jìn)行了同題測(cè)試。


【資料圖】

在測(cè)試中,搜狐科技選取了高考試卷前10道填空題,讓百度文心一言、阿里通義千問(wèn)、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT進(jìn)行回答。

測(cè)試結(jié)果顯示,這五款大模型在答數(shù)學(xué)題的能力上差異顯著。

最“聰明”的訊飛星火答對(duì)了5題,正確率50%。百度文心一言和ChatGPT“緊跟其后”,答對(duì)了4題,正確率為40%。

360智腦和通義千問(wèn)則“全軍覆沒(méi)”,一道題也沒(méi)答對(duì),交了白卷。

值得一提的是,昨天搜狐科技也用五款大語(yǔ)言模型產(chǎn)品,對(duì)高考作文全國(guó)卷(甲)進(jìn)行了測(cè)試,并邀請(qǐng)了5位語(yǔ)文名師打分。

打分結(jié)果顯示,ChatGPT高考作文得分最高,文心一言、訊飛星火得分稍低,但跟ChatGPT處于同一水平。360智腦和通義千問(wèn)得分最低。

雖然語(yǔ)文作文題和數(shù)學(xué)計(jì)算題,對(duì)大模型能力考察的維度并不盡相同。但巧合的是,不擅長(zhǎng)寫作文的360智腦和通義千問(wèn),似乎也不擅長(zhǎng)做數(shù)學(xué)題。

通過(guò)這兩次高考題測(cè)試,也能從側(cè)面反應(yīng)出各家大模型的能力確實(shí)是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學(xué)霸”,那么360智腦和通義千問(wèn)則是妥妥的“學(xué)渣”。

附測(cè)試中使用的高考數(shù)學(xué)題題目:

1.不等式|x-2|<1的解集為_(kāi)_

2.a=(2,3),b=(-1,2),則a·b=__

3.首項(xiàng)為3,公比為2的等比數(shù)列的前六項(xiàng)和S6=__

4.tanA=3,tan2A=__

5.f(x)={2^xx>0;1,x≤0}的值域?yàn)開(kāi)_

6.復(fù)數(shù)z=1-i,則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π,則m=__

8.三角形的三邊長(zhǎng)為a=4,b=5,c=6,則sinA=__

9.某地一年四個(gè)季度的GDP(億元),第一季度GDP為232,第四季度GDP為241,且四個(gè)季度的GDP逐季度增長(zhǎng),中位數(shù)、平均數(shù)相等。則該地一年的GDP為_(kāi)_

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正數(shù)k的最大值為_(kāi)_

責(zé)任編輯:

關(guān)鍵詞

熱門資訊

圖片新聞

堆龙德庆县| 湛江市| 陆河县| 东港市| 华安县| 洪洞县| 时尚| 西昌市| 永州市| 正宁县| 龙泉市| 德昌县| 洛浦县| 连山| 陈巴尔虎旗| 金昌市| 改则县| 隆昌县| 海南省| 深圳市| 江北区| 夹江县| 施甸县| 邵阳县| 辉县市| 沭阳县| 霍州市| 博湖县| 临邑县| 肃宁县| 通城县| 新绛县| 双柏县| 铁力市| 宁远县| 会宁县| 丹东市| 高邮市| 封丘县| 东乌珠穆沁旗| 陆河县|