距離GPT-4的釋出只有兩個多月,但使用者已經開始期待GPT-5的釋出。我們已經看到GPT-4在各種測試和定性評估中的能力和實力。有了許多新的功能,如ChatGPT外掛和網際網路瀏覽能力,它已經變得更好了。現在,使用者正在等待了解更多關於即將到來的OpenAI模型、GPT-5、AGI的可能性等等。因此,要想深入瞭解GPT-5的釋出日期和其他預期功能,請跟隨我們下面的講解員。
GPT-5釋出日期
當GPT-4在2023年3月釋出時,人們預計OpenAI將在2023年12月之前釋出其下一代模型。Runway的CEO陳思齊也在推特上說,”GPT5計劃在今年12月完成培訓”。然而,在4月的麻省理工學院活動上,OpenAI執行長Sam Altman在被問及OpenAI是否正在訓練GPT-5時說:”我們沒有,而且一段時間內不會”。所以GPT-5在2023年底前釋出的傳言已經被推翻了。
也就是說,專家建議,OpenAI可能會在2023年10月之前推出GPT-4.5,即GPT-4和GPT-5之間的中間版本,就像GPT-3.5一樣。據悉,GPT-4.5將最終帶來多模態能力,也就是同時分析影象和文字的能力。早在2023年3月的GPT-4開發者直播中,OpenAI已經宣佈並展示了GPT-4的多模態能力。
GPT-4多模態能力
除此之外,OpenAI目前在開始研究GPT-5之前,還有很多事情要在GPT-4模型上解決。目前,GPT-4的推理時間非常高,而且執行成本相當高。GPT-4的API訪問仍然很難獲得。此外,OpenAI最近剛剛開放了對ChatGPT外掛和網際網路瀏覽能力的訪問,這些都還處於Beta階段。它還沒有為所有付費使用者帶來程式碼直譯器,這又處於Alpha階段。
雖然GPT-4已經很強大了,但我想OpenAI意識到,計算效率是可持續執行模型的關鍵因素之一。而且,再加上新的特性和功能,你就會有一個更大的基礎設施來處理,同時確保所有檢查點都能可靠地執行。因此,如果我們假設政府機構不設定監管障礙的話,GPT-5有可能在2024年問世,就在谷歌雙子座的釋出前後。
GPT-5的特點和功能(預計)
減少幻覺
業界熱議的是,GPT-5將實現AGI(人工通用智慧),但我們將在後面詳細介紹。除此之外,GPT-5還應該減少推理時間,提高工作效率,進一步降低幻覺,以及更多。讓我們從幻覺開始,這也是大多數使用者不輕易相信人工智慧模型的關鍵原因之一。
GPT-4準確性測試
根據OpenAI的資料,GPT-4在所有九個類別的內部對抗性設計的事實評估中,得分比GPT-3.5高40%。現在,GPT-4對不準確和不允許的內容作出反應的可能性降低了82%。在跨類別的準確性測試中,它非常接近於觸及80%的大關。這是在打擊幻覺方面的一個巨大飛躍。
現在,預計OpenAI將在GPT-5中把幻覺減少到10%以下,這對於使LLM模型值得信賴來說是巨大的。我最近一直在用GPT-4模型做很多工,到目前為止,它只給出了事實性的回答。因此,GPT-5極有可能比GPT-4產生更少的幻覺。
計算高效的模型
接下來,我們已經知道,GPT-4的執行成本很高(每1K令牌0.03美元),推理時間也較長。而較早的GPT-3.5-turbo模型則比GPT-4便宜15倍(每1K tokens 0.002美元)。這是因為GPT-4是在龐大的1萬億個引數上訓練的,這需要昂貴的計算基礎設施。在我們最近關於谷歌的PaLM 2模型的解釋中,我們發現PaLM 2的規模相當小,這導致了快速的效能。
CNBC最近的一份報告證實,PaLM 2是在3400億個引數上進行訓練的,這遠遠小於GPT-4的大引數規模。谷歌甚至還說,大的不一定是好的,研究創意是製造偉大模型的關鍵。因此,如果OpenAI想讓其即將推出的模型達到計算最優,它必須找到新的創造性方法來減少模型的大小,同時保持輸出質量。
OpenAI的一大塊收入來自於企業和商業,所以是的,GPT-5不僅必須更便宜,而且必須更快地返回輸出。開發人員已經在責備GPT-4的API呼叫經常停止響應的事實,他們被迫在生產中使用GPT-3.5模型。在即將到來的GPT-5模型中提高效能一定是OpenAI的願望清單,特別是在谷歌推出更快的PaLM 2模型之後,你現在就可以嘗試。
多感官人工智慧模型
雖然GPT-4被宣佈為多模態AI模型,但它只處理兩種型別的資料,即影象和文字。當然,這種能力還沒有被新增到GPT-4中,但OpenAI可能會在幾個月內釋出該功能。然而,隨著GPT-5的推出,OpenAI可能會在使其真正成為多模態方面有一個大的飛躍。它也可能處理文字、音訊、影象、視訊、深度資料和溫度。它將能夠把來自不同模式的資料流相互連線起來,創造一個嵌入空間。
Source: Meta
最近,Meta公司釋出了ImageBind,一個結合了六種不同模式的資料的人工智慧模型,並將其開源用於研究目的。在這個領域,OpenAI沒有透露太多資訊,但該公司確實有一些強大的基礎模型用於視覺分析和影象生成。OpenAI還開發了用於分析影象的CLIP(對比性語言-影象預訓練)和DALL-E,這是一個流行的Midjourney替代品,可以從文字描述中生成影象。
這是一個正在研究的領域,其應用還不清楚。根據Meta的說法,它可以用於設計和建立虛擬現實的沉浸式內容。我們需要拭目以待,看看OpenAI在這一領域的表現,以及隨著GPT-5的釋出,我們是否會看到更多跨越各種多模態的AI應用。
長記憶
隨著GPT-4的釋出,OpenAI帶來了32K代幣的最大上下文長度,每1K代幣的成本為0.06美元。我們在幾個月內迅速看到了從標準的4K tokens到32K的轉變。最近,Anthropic在其Claude人工智慧聊天機器人中把上下文視窗從9K增加到100K令牌。預計GPT-5可能會通過更大的上下文長度帶來長期記憶體支援。
這可以幫助製作人工智慧角色和朋友,他們記得你的角色和記憶,可以持續多年。除此以外,你可以在一個上下文視窗中載入書籍和文字檔案庫。由於長期記憶的支援,可以有各種新的人工智慧應用,GPT-5可以使之成為可能。
GPT-5釋出:對AGI的恐懼
2023年2月,薩姆-奧特曼寫了一篇關於AGI以及它如何能造福全人類的部落格。AGI(人工通用智慧),顧名思義,是下一代人工智慧系統,一般比人類更聰明。有人說,OpenAI即將推出的模型GPT-5將實現AGI,看來這有一定的道理。
我們已經有幾個自主的人工智慧代理,如Auto-GPT和BabyAGI,它們都是基於GPT-4的,可以自己做決定並得出合理的結論。完全有可能將AGI的某個版本與GPT-5一起部署。
在部落格中,奧特曼說,”我們相信我們必須通過部署不那麼強大的技術版本來不斷學習和適應,以儘量減少’一錘定音’的情況”,同時也承認在駕馭像AGI這樣巨大的強大系統方面存在 “巨大的風險”。在最近的參議院聽證會之前,薩姆-奧特曼也敦促美國立法者對較新的人工智慧系統進行監管。
在聽證會上,奧特曼說:”我認為如果這項技術出錯,它可能會出大錯。我們希望對此發表意見。” 此外,他還說:”我們希望與政府合作,防止這種情況發生。” 一段時間以來,OpenAI對有關將高度強大和智慧的較新人工智慧系統的法規頗有微詞。請注意,奧特曼正在圍繞令人難以置信的強大人工智慧系統尋求安全監管,而不是開源模型或小型初創企業開發的人工智慧模型。
值得注意的是,早在2023年3月,埃隆-馬斯克和其他知名人士,包括史蒂夫-沃茲尼亞克、安德魯-楊和尤瓦爾-諾亞-哈拉里等人,都呼籲暫停巨型人工智慧實驗,。從那時起,對AGI和較新的人工智慧系統–比GPT-4更強大–進行了廣泛的反擊。
如果OpenAI確實要將AGI能力帶到GPT-5,那麼預計其公開釋出會有更多延遲。監管肯定會啟動,圍繞安全和調整的工作將被徹底審查。好在OpenAI已經有一個強大的GPT-4模型,而且它正在不斷增加新的特性和能力。沒有其他人工智慧模型能接近它,甚至基於PaLM 2的谷歌Bard也不行。
OpenAI GPT-5:未來的姿態
在GPT-4釋出後,OpenAI對其運作變得越來越神祕了。它不再與開源社羣分享關於訓練資料集、架構、硬體、訓練計算和訓練方法的研究。對於一家以自由協作原則成立的非營利性公司(現在是利潤封頂)來說,這已經是一個奇怪的翻轉。
2023年3月,OpenAI的首席科學家Ilya Sutskever在接受The Verge採訪時說:”我們錯了。確切地說,我們錯了。如果你像我們一樣相信,在某些時候,人工智慧–AGI–將變得非常、難以置信的強大,那麼,開源是沒有意義的。這是一個壞主意……我完全預計,幾年後,對每個人來說,開源人工智慧是完全明顯的,是不明智的。
現在,為了在人工智慧競賽中保持競爭力,GPT-4和即將推出的GPT-5都不會是開源的,這一點已經很清楚。然而,另一家巨頭公司Meta一直在以不同的方式進行人工智慧開發。Meta公司一直在CC BY-NC 4.0許可下發布多個人工智慧模型(僅限研究,非商業),並在開源社羣中獲得牽引力。
看到Meta的LLaMA和其他人工智慧模型被大量採用,OpenAI也改變了其對開源的立場。根據最近的報道,OpenAI正在開發一個新的開源人工智慧模型,將很快向公眾釋出。目前還沒有關於它的能力以及它對GPT-3 .5或GPT-4的競爭力的資訊,但這的確是一個值得歡迎的變化。
總而言之,GPT-5將是一個前沿模型,它將推動人工智慧的可能邊界。似乎很可能某種形式的AGI將與GPT-5一起推出。如果是這樣的話,OpenAI必須準備好接受世界各地的嚴格監管(以及可能的禁令)。至於GPT-5的釋出日期,安全的賭注是2024年的某個時候。
評論留言