《華盛頓郵報》發(fā)文稱,備受期待的新一代GPT-5大模型的性能沒有達到一些科技界人士的預(yù)期,這使得他們開始重新思考“超級智能”實現(xiàn)的速度,質(zhì)疑AI能否像一些高管所宣傳的那樣能夠快速趕超人類。
在OpenAI對ChatGPT進行這一重大升級前,科技工作者和AI發(fā)燒友們翹首以盼,已經(jīng)對它期待了好幾個月。
OpenAI決定將新系統(tǒng)命名為GPT-5,這不禁讓人們將其與2023年發(fā)布的GPT-4相比較。GPT-4當(dāng)年震驚了科技界,推動ChatGPT快速發(fā)展,目前周用戶量達到了7億。
然而,在GPT-5于8月7日正式發(fā)布,并在接下來幾天接受科技界人士評測后,一些業(yè)內(nèi)人士認(rèn)為,這次升級雖然是一次令人欣喜的改進,但并不算重大飛躍。
在AI行業(yè)常用的社交平臺X上,科技評測人士發(fā)布了截圖,顯示GPT-5在編碼或收集復(fù)雜主題研究等任務(wù)上,比之前的AI系統(tǒng)表現(xiàn)更好。但是,他們也分享了一些證據(jù),證明它仍然可能犯之前聊天機器人常見的錯誤,例如被謎題欺騙,或自信地聲稱事實錯誤的信息為真。
這種平淡無奇的表現(xiàn)促使一些科技圈內(nèi)部人士重新調(diào)整對AI能力提升速度的預(yù)期,并質(zhì)疑OpenAI CEO薩姆·奧特曼(Sam Altman)等行業(yè)領(lǐng)袖的說法。這些人曾表示,能夠在大多數(shù)任務(wù)上匹敵人類智能的系統(tǒng)已經(jīng)不遠(yuǎn)了。
AI快速趕超人類?
OpenAI分享的數(shù)據(jù)顯示,ChatGPT的升級確實讓它在許多任務(wù)上表現(xiàn)更好,并且隨著企業(yè)更廣泛地使用,它仍有望改變許多工作場所。但是近年來,AI行業(yè)高管們一直在宣傳AI的進步,讓科技工作者、立法者和消費者相信AI能夠取得快速突破,而不是逐步進展。
一些認(rèn)為AI發(fā)展速度極快、可能在幾年內(nèi)超出人類控制的人表示,GPT-5的表現(xiàn)讓他們推遲了對于這種情況發(fā)生的預(yù)期時間。科技行業(yè)的其他人士則認(rèn)為,這反而是新的證據(jù),表明這類擔(dān)憂并無根據(jù)。
特朗普總統(tǒng)的AI和加密貨幣業(yè)務(wù)負(fù)責(zé)人、大名鼎鼎的科技投資人大衛(wèi)·薩克斯(David Sacks)在自己的X賬號上寫道,OpenAI的發(fā)布是一個進步,但也證明了那些預(yù)測頭部AI系統(tǒng)會迅速超越其他系統(tǒng),并實現(xiàn)“超智能”、超越人類的說法是錯誤的。
“頭部模型在性能基準(zhǔn)上表現(xiàn)相近,它們?nèi)匀恍枰祟惛嬖V它們該做什么,并驗證其工作才能讓它們真正有用,”他寫道,“這正是偉大工程的體現(xiàn),應(yīng)該被慶祝,但這并非是那些末日論言論所描述的情形。”
期望過高
蘇穆克·沙希達爾(Sumuk Shashidhar)是伊利諾伊大學(xué)厄巴納-香檳分校的一名AI研究人員和博士生,曾與多家AI公司合作。他表示,業(yè)界許多人似乎對OpenAI的新產(chǎn)品預(yù)期過高。
“對于普通用戶來說,感覺變化不大。”沙希達爾說。他指出,在密切關(guān)注AI行業(yè)的人群中,大家原本期望GPT-5會像“與另一個非常聰明的人對話”,但實際情況似乎并非如此。
就連一些最擔(dān)心AI進步可能導(dǎo)致人類失去技術(shù)控制權(quán)的人,也認(rèn)為GPT-5未達預(yù)期。
“人們原本以為這是一次重大技術(shù)變革。”非營利組織Control AI的政策分析師馬克斯·溫加(Max Winga)表示。該組織倡導(dǎo)對AI開發(fā)制定更嚴(yán)格的規(guī)則,以防止企業(yè)創(chuàng)造可能自主行動并危害人類的超智能技術(shù)。
相反,溫加認(rèn)為GPT-5的發(fā)布“證明了那種會有某種重大突破的設(shè)想是不成立的”。他還指出,自己仍對AI所能實現(xiàn)的改進速度感到擔(dān)憂,因為社會“尚未做好準(zhǔn)備”去應(yīng)對那種能夠自我學(xué)習(xí)從而變得更聰明的AI。
軟件工程師兼博主西蒙·威爾森(Simon Willison)在GPT-5發(fā)布前兩周提前對其進行了測試。他表示,GPT-5表現(xiàn)不錯,但不足為奇。
“它與我們之前所使用的版本相比并沒有巨大突破,但它很少出錯,整體表現(xiàn)稱職,有時在我喜歡用模型做的事情上還會令人印象深刻。”他在GPT-5發(fā)布當(dāng)天的博客中寫道。
退步?
一些科技圈外的人甚至認(rèn)為GPT-5是一次退步。他們抱怨稱,與之前版本的對話體驗相比,新版本不夠溫暖。舊版本在GPT-5發(fā)布當(dāng)天就被OpenAI下線。
OpenAI很快改變了策略,讓付費用戶可以繼續(xù)使用舊版本GPT-4o。該公司在上周五表示,它正在根據(jù)反饋將GPT-5調(diào)整得“更溫暖、更友好”,因為用戶覺得它缺乏親和力。
有人認(rèn)為,GPT-5和之前技術(shù)相比并未實現(xiàn)重大改進。OpenAI CEO奧特曼在上周四晚間與記者共進晚餐時駁斥了這一說法。
他表示,在GPT-5發(fā)布后的48小時內(nèi),在自家產(chǎn)品使用OpenAI技術(shù)的企業(yè)需求翻倍,這迫使公司緊急尋找新的計算芯片以處理客戶對改進版聊天機器人的查詢。
奧特曼表示,要想真正理解OpenAI的最進步,需要與GPT-5在復(fù)雜技術(shù)問題上密切合作。“這是一個科學(xué)家稱其在研究能力上已經(jīng)達到了各自領(lǐng)域頂尖水平的模型。”他說。
奧特曼指出,這項技術(shù)在日常閑聊方面提升空間有限,因此那些主要用聊天機器人討論個人生活的人可能不會注意到GPT-5能力的增強。
GPT-5的推出也表明,OpenAI開始更加重視財務(wù)問題,試圖在燒掉超過300億美元風(fēng)投資金的同時,降低巨額成本。
這款新的大模型旨在根據(jù)用戶提問的復(fù)雜程度調(diào)整計算資源的使用,對于簡單問題嘗試使用更少的計算力,而對復(fù)雜任務(wù)則投入更多。這有可能讓OpenAI通過降低部分對話的成本來提高效率。
奧特曼堅稱,公司并沒有放棄打造更強大AI的目標(biāo),并表示未來仍將帶來更多突破,無論成本如何。“我們在某些方面可能會花費比任何公司以往都多的資金。”他說。