【新智元導(dǎo)讀】近日,一名外國(guó)小哥測(cè)出,GPT-4語言能力智商已達(dá)15編程客棧2,吊打絕大多數(shù)人類。好在,它的空間推理還不行。
GPT-4在語言能力上的智商,已經(jīng)吊打人類!
(資料圖片)
最近,國(guó)外的一位小哥測(cè)試了GPT-4的智商,結(jié)果顯示,它的語言智商已經(jīng)達(dá)到了152。
而根據(jù)調(diào)查,人類的平均智商是90-109,單論語言智商的話,人類是妥妥地被GPT-4吊打了……
GPT-4的能力,我們此前早已耳熟能詳。3月底,微android軟的一篇154頁的論文,震驚全世界。
在這篇論文中,微軟表示,GPT-4已經(jīng)顯現(xiàn)出了通用人工智能的火花,它可以被認(rèn)為是通用人工智能的一個(gè)早期版本。
論文地址:https://arxiv.org/pdf/2303.12712.pdf
通過測(cè)試,微軟的研究者證實(shí):GPT-4不僅精通語言,還能python在數(shù)學(xué)、編程、視覺、醫(yī)學(xué)、法律、心理學(xué)等多樣化和高難度的任務(wù)中表現(xiàn)出色,且無需特別提示。
最可怕的是,在所有這些任務(wù)中,GPT-4的表現(xiàn)都接近了人類水平,并且時(shí)常超過之前的模型。
下面,我們就來看看GPT-4在各方面能力上,哪些能吊打人類編程客棧,哪些暫時(shí)還無法趕超我們。
為GPT-4量身打造IQ測(cè)試
首先,這位小哥上網(wǎng)搜索了一下免費(fèi)的智商測(cè)試。
但他發(fā)現(xiàn)一個(gè)棘手的問題:這些智商測(cè)試,很多都是以圖像的形式。
然而GPT-4,目前可以被認(rèn)為還是一個(gè)「瞎子」+「聾子」,并沒有讀圖能力。
怎么辦呢php?這位小哥隨后意識(shí)到,肯定有專門為視力缺陷的人設(shè)計(jì)的智商測(cè)試。
他動(dòng)手試了試,果然搜到了。然而,這種測(cè)試非常昂貴,需要花1500多刀,沒法白嫖。
自己動(dòng)手,豐衣足食。這位小哥干脆一不做二不休,自己上手,為GPT-4量身打造了一版智商測(cè)試。
難得倒陶哲軒,難不倒GPT-4
首先要測(cè)試的,是GPT-4的數(shù)學(xué)能力。
全世界最流行、最頂尖的數(shù)學(xué)測(cè)試是什么?自然就是國(guó)際奧數(shù)比賽。
世界上最偉大的數(shù)學(xué)家之一陶哲軒,就是在1986年參加的國(guó)際奧數(shù)比賽。
那一年,試題中的第6題,連他也解不出。
那GPT-4可以么?
小哥把這道題輸給了GPT-4,結(jié)果是——它做了,但沒做對(duì)。
因此,我們并不能說,它勝過了世界上最厲害的成年人數(shù)學(xué)家。
另外,它也無法證明孿生素?cái)?shù)猜想。(要是能證明就有鬼了
責(zé)任編輯: