首頁 行業(yè) 活動(dòng) 項(xiàng)目 快訊 文娛 時(shí)尚 娛樂 科技 汽車 綜合 生活

GPT-4解出難倒陶哲軒奧數(shù)題?語言IQ已達(dá)152,但空間推理巨差|當(dāng)前觀點(diǎn)

2023-05-23 10:25:13 來源:新智元公眾號(hào)

【新智元導(dǎo)讀】近日,一名外國(guó)小哥測(cè)出,GPT-4語言能力智商已達(dá)15編程客棧2,吊打絕大多數(shù)人類。好在,它的空間推理還不行。

GPT-4在語言能力上的智商,已經(jīng)吊打人類!


(資料圖片)

最近,國(guó)外的一位小哥測(cè)試了GPT-4的智商,結(jié)果顯示,它的語言智商已經(jīng)達(dá)到了152。

而根據(jù)調(diào)查,人類的平均智商是90-109,單論語言智商的話,人類是妥妥地被GPT-4吊打了……

GPT-4的能力,我們此前早已耳熟能詳。3月底,微android軟的一篇154頁的論文,震驚全世界。

在這篇論文中,微軟表示,GPT-4已經(jīng)顯現(xiàn)出了通用人工智能的火花,它可以被認(rèn)為是通用人工智能的一個(gè)早期版本。

論文地址:https://arxiv.org/pdf/2303.12712.pdf

通過測(cè)試,微軟的研究者證實(shí):GPT-4不僅精通語言,還能python在數(shù)學(xué)、編程、視覺、醫(yī)學(xué)、法律、心理學(xué)等多樣化和高難度的任務(wù)中表現(xiàn)出色,且無需特別提示。

最可怕的是,在所有這些任務(wù)中,GPT-4的表現(xiàn)都接近了人類水平,并且時(shí)常超過之前的模型。

下面,我們就來看看GPT-4在各方面能力上,哪些能吊打人類編程客棧,哪些暫時(shí)還無法趕超我們。

為GPT-4量身打造IQ測(cè)試

首先,這位小哥上網(wǎng)搜索了一下免費(fèi)的智商測(cè)試。

但他發(fā)現(xiàn)一個(gè)棘手的問題:這些智商測(cè)試,很多都是以圖像的形式。

然而GPT-4,目前可以被認(rèn)為還是一個(gè)「瞎子」+「聾子」,并沒有讀圖能力。

怎么辦呢php?這位小哥隨后意識(shí)到,肯定有專門為視力缺陷的人設(shè)計(jì)的智商測(cè)試。

他動(dòng)手試了試,果然搜到了。然而,這種測(cè)試非常昂貴,需要花1500多刀,沒法白嫖。

自己動(dòng)手,豐衣足食。這位小哥干脆一不做二不休,自己上手,為GPT-4量身打造了一版智商測(cè)試。

難得倒陶哲軒,難不倒GPT-4

首先要測(cè)試的,是GPT-4的數(shù)學(xué)能力。

全世界最流行、最頂尖的數(shù)學(xué)測(cè)試是什么?自然就是國(guó)際奧數(shù)比賽。

世界上最偉大的數(shù)學(xué)家之一陶哲軒,就是在1986年參加的國(guó)際奧數(shù)比賽。

那一年,試題中的第6題,連他也解不出。

那GPT-4可以么?

小哥把這道題輸給了GPT-4,結(jié)果是——它做了,但沒做對(duì)。

因此,我們并不能說,它勝過了世界上最厲害的成年人數(shù)學(xué)家。

另外,它也無法證明孿生素?cái)?shù)猜想。(要是能證明就有鬼了

關(guān)鍵詞:

上一篇:新疆沙雅縣舉辦鑄牢中華民族共同體意識(shí) 知識(shí)競(jìng)賽_播報(bào)

下一篇:險(xiǎn)資不愛房地產(chǎn)了?|氪金 · 房地產(chǎn)

責(zé)任編輯:

最近更新

點(diǎn)擊排行
推薦閱讀