ChatGPT一週年:OpenAI開創性聊天機器人的發展史

ChatGPT一週年:OpenAI開創性聊天機器人的發展史

過去的一年就像是人工智慧衝刺科技革命新時代的一年。ChatGPT 終於滿週歲了,在此期間,我們看到了無數改變我們生活的新進展。從一個經常產生幻覺的簡單聊天機器人,到一個先進的多模態人工智慧系統,ChatGPT 在一年的時間裡取得了巨大的發展。

因此,在 ChatGPT 成立一週年之際,我們來回顧一下 ChatGPT 所經歷的所有進步和磨難。從它的釋出到目前提供的一系列功能,我們都一一收錄在文章中。

ChatGPT 正式上線

2022 年 11 月 30 日,OpenAI 向全世界免費釋出了 ChatGPT,作為研究預覽的一部分。在短短兩個月內,它就積累了超過 1 億的月度使用者,成為全球增長最快的服務,甚至超過了 Facebook。

與似乎遠離普通使用者的抽象人工智慧概念不同,ChatGPT 最終允許使用者在友好的網路介面上與人工智慧驅動的聊天機器人進行互動。

ChatGPT 經過會話訓練,建立在 OpenAI 的 GPT-3.5 模型之上。在某種程度上,它與 InstructGPT 相似,後者會根據使用者的指令做出迴應。不過,ChatGPT 被訓練成能與使用者對話,同時考慮到上下文。OpenAI 在其開篇部落格中指出

ChatGPT 有時會寫出聽起來合理但不正確或無意義的答案

幻覺(Hallucination)是基於 GPT-3.5 模型開發的 ChatGPT 最初版本面臨的一個難題。不過,隨著 GPT-4 模型的推出(下文將詳細介紹),OpenAI 已經成功地大幅減少了與事實不符的回答。

至於 ChatGPT 的炒作,在該服務推出之初,人工智慧聊天機器人似乎要扼殺谷歌搜尋和其他各種線上產品。我們甚至在 YouTube 視訊中將 ChatGPT 與谷歌搜尋相提並論。現在一年過去了,感覺這只是人工智慧時代的開始,還有很多新產品有待發現。

檢測AI生成內容的AI分類器問世

ChatGPT 很快聲名鵲起,尤其擅長撰寫學術論文、撰寫營銷郵件,甚至製造錯誤資訊等創造性工作。看到網路上人工智慧撰寫的文字激增,人們迫切需要人工智慧抄襲檢測器和文字檢查器。

於是,在 ChatGPT 釋出兩個月後,OpenAI 釋出了官方 AI 分類器工具,幫助人們區分 AI 和人工撰寫的文字。

然而,今年 7 月,OpenAI 以準確率低為由悄然關閉了這項服務。如果你需要這樣的工具,可以檢視我們的最佳 AI 抄襲檢查工具列表。不過,我們在其中明確提到,人工智慧驅動的剽竊工具經常會出現假陽性和結果不一致的情況。

因此,即使在 ChatGPT 釋出一年後,正確識別人工智慧撰寫的文字的努力仍在繼續。

推出 ChatGPT Plus 訂閱服務

ChatGPT Plus 訂閱服務

2023 年 2 月,在釋出四個月後,OpenAI 決定是時候趁熱打鐵,建立一個忠實的付費社羣了。於是,它推出了第一個名為 ChatGPT Plus 的訂閱計劃,每月收費 20 美元。

ChatGPT+ 剛推出時,使用者即使在高峰期也能訪問聊天機器人,而且響應速度更快。此外,ChatGPT Plus 使用者還可以提前使用未來幾個月的新功能和改進。最初,該訂閱計劃只面向美國使用者,後來擴充套件到全球大部分使用者。

面向開發人員釋出 ChatGPT API

2023 年 3 月,公司終於釋出了 ChatGPT API,讓開發者可以使用聊天機器人的強大功能。開發者可以使用 ChatGPT 的 API 構建各種產品。Snapchat 是首批使用其 API 建立可定製聊天機器人的公司之一,該聊天機器人可以為好友提供推薦和寫俳句。

我們還撰寫了一篇詳細的文章,介紹如何使用 ChatGPT API 自定義知識庫訓練AI聊天機器人。這項計劃最棒的地方在於,OpenAI 向所有免費使用者贈送了價值 5 美元的 API 點數。因此,開發人員和普通使用者都使用 ChatGPT API 建立了一些有趣的專案。

聊天 GPT 升級為 GPT-4 模型

2023 年 3 月,OpenAI 釋出了其聊天機器人進化的下一步,即下一代模型。它釋出了世界上最強大的大型語言模型 GPT-4,ChatGPT Plus 使用者從第一天起就可以使用它。

這是 LLM 發展史上的分水嶺之一。在消除幻覺方面,它比 GPT-3.5 模型要好得多。在所有類別的準確性測試中,GPT-4 的得分都超過了 80%。

GPT-4 模型

不僅如此,GPT-4 還是第一個能同時理解文字和影象的多模態模型。GPT-4 可以分析紙上潦草的筆記,並立即建立網站模型。當然,多模態功能是後來在 9 月份新增的(見下文),但 OpenAI 早在 3 月份就已經破解了這一祕訣。要知道,這距離釋出才過去 5 個月。

宣佈 GPT-4 為首個多模態 LLM,OpenAI 早在 3 月份就已經破解了祕訣。

除此之外,ChatGPT Plus 使用者的字數限制增加到了 25000 字,而免費版 ChatGPT(基於 GPT-3.5 構建)的字數限制為 8000 字。最後,GPT-4 還能更好地理解多達 26 種語言,包括世界各地的主要語言和地區語言。

儘管如此,它對世界大事的瞭解僅限於 2021 年 9 月。不過,GPT-4 標誌著人工智慧發展的一個拐點,許多專有和開源 LLM 仍在努力超越 GPT-4。

ChatGPT 外掛首次亮相

如上所述,GPT-4 擁有許多令人興奮的功能,但其知識仍侷限於 2021 年 9 月。此外,它還是一個孤立的黑盒子,無法與外部世界互動。對於一個擁有無限潛力的人工智慧聊天機器人來說,這是一個巨大的限制。

因此,OpenAI 找到了解決這一問題的方法,於今年 3 月推出了對 ChatGPT 外掛的支援。這些外掛允許 LLM 與第三方服務甚至網際網路互動,獲取實時資料。

ChatGPT 外掛

在外掛的幫助下,ChatGPT 可以使用由 Microsoft Bing(後更名為 Browse with Bing)提供支援的網路瀏覽器外掛訪問最新資訊。此外,它還可以使用程式碼直譯器外掛進行計算。

程式碼直譯器特別有用,因為你終於可以向 ChatGPT 上傳檔案,並要求 ChatGPT 使用沙盒 Python 直譯器執行各種任務。它還為 ChatGPT 帶來了資料分析和視覺化功能,所有人都為之瘋狂。有了這個工具,你可以在 ChatGPT 中生成圖形、圖表和示意圖

除此之外,在釋出會上,OpenAI 還推出了 11 個第三方外掛,包括 Zapier、Expedia、Instacart、OpenTable 等,目前已託管了數百個外掛。使用這些外掛,你可以查詢和預訂航班、在餐廳預訂餐桌等。

基本上,有了 ChatGPT 外掛、網頁瀏覽和程式碼直譯器,OpenAI 在擴充套件 LLM 的多功能性方面邁出了第一步。此外,它還讓我們看到了這個聊天機器人的真正潛力,現在它的基礎上又建立了一個功能外掛商店。

ChatGPT 聊天記錄洩漏

三月是 OpenAI 最繁忙的一個月。該公司推出了令人印象深刻的 GPT-4 模型,並通過外掛、網頁瀏覽和程式碼直譯器擴充套件了其實用性。然而,除了展示所有閃閃發光的新功能外,OpenAI 還因為 ChatGPT 上一個洩露使用者聊天記錄的 bug 而下線了 ChatGPT。

沒錯,這是OpenAI的第一個重大安全失誤。該公司進一步指出,其他使用者可能也看到了一些與支付相關的資訊,但受影響的使用者僅佔 1.2%。該公司很快修復了漏洞,並在部落格中解釋了技術細節

在 ChatGPT 中管理您的資料

ChatGPT聊天資料設定

事件發生後,OpenAI 採取了一些隱私保護措施來保護使用者的利益。它在 ChatGPT 中新增了一個完全關閉聊天記錄的選項。關閉聊天記錄後,您的聊天記錄將不會被用於訓練和改進 OpenAI 模型。

儘管如此,即使你關閉了歷史記錄切換,它並沒有真正關閉。OpenAI 在其博文中表示,即使關閉了聊天記錄,”我們也會將新對話保留 30 天,只有在需要時才會對其進行審查,以監控是否存在濫用行為,之後才會永久刪除“。

OpenAI 推出 iOS 版 ChatGPT 應用程式

iOS 版 ChatGPT 應用程式

ChatGPT 的躥紅引發了另一個巨大的問題。山寨和低質量克隆。由於 ChatGPT 目前僅限於網頁瀏覽器,這就給了不良分子宰割使用者和賺快錢的機會。

這一問題在手機上尤為嚴重,使用者會搜尋並下載黑心應用程式和惡意軟體克隆。為了解決這個問題,2023 年 5 月,OpenAI 首次為 iOS 釋出了一個原生的、從零開始構建的 ChatGPT 應用程式。

值得慶幸的是,它並不是一個網路封裝器。相反,該應用為使用 iPhone 的 ChatGPT Plus 使用者帶來了聊天記錄、語音輸入和 GPT-4 模型的支援。雖然 Android 應用程式沒有同時釋出,但公司表示很快就會推出。最後,公司於 2023 年 7 月釋出了安卓手機的 ChatGPT 應用程式。

現在,Android 和 iOS 版的 ChatGPT 應用程式功能相同,都支援 GPT-4、DALL-E 3、資料分析、影象分析和網頁瀏覽。

OpenAI 禁用使用必應外掛瀏覽

2023 年 7 月初,OpenAI 再次面臨重大挑戰,因為其 “Browse with Bing” 外掛在 ChatGPT 上顯示了付費網站的內容。由於擔心出版物提起訴訟,OpenAI 迅速禁用了該功能,並表示 “偶爾會以我們不希望的方式顯示內容“。

 "Browse with Bing" 外掛

禁用這一重要外掛意味著 ChatGPT+ 使用者沒有訪問網際網路並向聊天機器人提供實時資訊的官方選項。不過,通過第三方外掛,使用者仍然可以將 ChatGPT 連線到網際網路。終於,在三個月後的 2023 年 9 月,”使用必應瀏覽 “在 ChatGPT 上恢復了所需的修復功能。

自定義指令登陸 ChatGPT

自定義指令登陸 ChatGPT

在中斷了兩個月之後,OpenAI 在七月份繼續為 ChatGPT 增加新功能,即自定義指令。從根本上說,它允許 ChatGPT 更多地瞭解你以及它應該產生什麼樣的迴應。您可以輸入自己的偏好,ChatGPT 會在回覆您的詢問前記住這些偏好。

例如,如果你讓聊天機器人幫你找一款 100 美元以下的耳機,它就會從自定義指令中考慮你的位置,並根據你的位置和可用性給出量身定製的回覆。您還可以要求它減少廢話,給出簡明扼要的回覆。

ChatGPT 能看、能聽、能說

GPT-4V

2023 年 9 月,OpenAI 釋出了 ChatGPT 的重大更新。新更新首先在 iOS 應用程式上釋出,允許使用者與模型進行語音對話。此外,你現在還可以將圖片上傳到 ChatGPT,並就圖片提出問題。

基本上,三月份展示的多模態功能終於通過 Whisper(語音識別模型)和 GPT-4V(GPT-4 視覺模型)新增到了 ChatGPT 中。該更新於 2023 年 11 月向所有 iOS 和 Android 使用者廣泛釋出。

現在,即使是網路使用者也可以在 ChatGPT 上進行影象分析。不過,語音聊天功能仍僅限於移動應用程式。

推薦閱讀:如何使用 ChatGPT 語音聊天功能

GPT-4V 釋出

今年 9 月,OpenAI 單獨釋出了一篇研究論文,詳細介紹了其新的 GPT-4V 系統的工作原理。具有視覺功能的 GPT-4 模型可以分析上傳到 ChatGPT 的影象,並用自然語言推斷視覺資訊。其訓練工作已於 2022 年完成,OpenAI 採取了嚴厲的措施來馴服視覺模型,使其不會評估有害內容,包括驗證碼破解、人物識別、性別和種族識別、非法行為等。

GPT-4V模型被大力吹捧為醫學影象診斷的前沿模型,但OpenAI在其研究論文中表示:”鑑於該模型在這一領域的表現並不完美,以及與不準確性相關的風險,我們認為當前版本的GPT-4V不適合執行任何醫療功能,也不能替代專業的醫療建議、診斷或治療或判斷。

Dall-E 3 更新至 ChatGPT

Dall-E 3

DALL-E 一直是 OpenAI 專有的文字到影象模型,但在初始狀態下,它還無法與 Midjourney 競爭。不過,隨著 10 月份釋出最新的 DALL-E 3 模型,OpenAI 已經非常接近於理解文字的細微差別和抽象概念,並將其轉化為準確的影象。

最棒的是,你不再需要訪問不同的網站就能使用它。DALL-E 3 已整合到 ChatGPT 中。它能生成令人難以置信的人工智慧影象,最重要的是,它與 ChatGPT Plus 訂閱捆綁在一起。

此外,有了這一整合,就不再需要詳細的提示了。ChatGPT 可以使用 DALL-E 3 將您的基本提示轉化為詳細提示,生成多樣化的獨特影象。 請跟隨我們的分步指南學習如何使用 DALL-E 3 生成影象

釋出 GPT-4 Turbo 模型和 GPT

2023 年 11 月 6 日,OpenAI 在舊金山舉行了首次開發者大會 DevDay。該公司釋出了幾項重大訊息,包括具有更多功能、更大上下文視窗和更低價格的新 GPT-4 Turbo 模型

首先,Turbo 型號可以瞭解截至 2023 年 4 月的世界大事。其次,它擁有 128K 上下文視窗,高於 GPT-4 的 8K 和 32K 最大令牌。最重要的是,它的輸入令牌比 GPT-4 模型便宜 3 倍,鑑於 GPT-4 的執行成本非常高,這一點令人驚歎。

GPT-4 Turbo 模型

GPT-4 Turbo 模型尚未新增到 ChatGPT 中,但 OpenAI 已 “計劃在未來幾周內釋出穩定的生產就緒模型”。此外,GPT-3.5 Turbo 模型也已升級,現在支援 16K 上下文視窗。

此外,ChatGPT 網站已全面改版,在使用 GPT-4 模型時,您無需為不同的任務手動選擇不同的選項。您可以使用 DALL-E 3、網頁瀏覽和資料分析,而無需在選項間切換。它們都處於啟用狀態,會在需要時被呼叫。

最後,DevDay 的重頭戲是 GPT。現在,您可以建立一個自定義版本的 ChatGPT,其中包含您的自定義說明、通過 PDF 和其他文件提供的自定義知識,併為機器人分配特殊技能。這是一個功能強大的新工具,可讓您為特定任務建立量身定製的 ChatGPT 版本,您可以在這裡瞭解如何建立個性化的 GPT

OpenAI 正在推出一個 GPT 商店,您可以在那裡找到用於各種用途的公開可用 GPT。

GPT 商店

OpenAI 停止新的 ChatGPT Plus 註冊

DevDay 剛剛結束,OpenAI 就宣佈暫停 ChatGPT Plus 的新註冊。最初,該公司表示流量激增,尤其是在 DevDay 活動之後。然而,後來經證實,ChatGPT 正面臨著來自惡意行為者的密集 DDoS 攻擊

因此,ChatGPT 面臨了數小時的大規模中斷。OpenAI 在一份宣告中說:”我們正在處理因反映 DDoS 攻擊的異常流量模式而導致的週期性中斷。我們正在繼續努力緩解這一問題。” 最後,在 11 月 9 日,服務在問題解決後恢復。

我們將暫停新的 ChatGPT Plus 註冊🙁開發日後激增的使用量超出了我們的能力,我們希望確保每個人都能獲得良好的體驗。您仍然可以註冊,以便在重新開放時在應用程式中收到通知。—— SAM ALTMAN (@SAMA) NOVEMBER 15, 2023

在一年的時間裡,ChatGPT 發生了令人難以置信的變化,現在它擁有世界上最強大的大語言模型。此外,它還獲得了令人印象深刻的功能,如外掛、網頁瀏覽、程式碼直譯器、自定義指令、多模態功能、更大的上下文視窗、GPT 等。我們很期待 OpenAI 接下來在 ChatGPT 及其下一代模型上的表現,尤其是在 Sam Altman 重新掌舵的情況下。

推薦閱讀:OpenAI GPT-5:釋出日期、功能、AGI 傳聞、猜測及其他

ChatGPT 的未來會怎樣?

雖然 ChatGPT 已經變得相當強大,但我們要清楚,在人工智慧的下一次爆發之前,這 “僅僅是個開始”。許多專家認為,基於對話的會話聊天機器人並不是與生成式人工智慧互動的唯一介面。

未來,我們可能會擁有強大無比的多模態人工智慧系統,它可以理解文字、語音、視覺元素、環境資料以及來自人類大腦活動的感官資料,從而得出上下文推斷並實時執行操作。

除此之外,人工智慧還能與 AR 和 VR 介面緊密結合,創造出高度互動和身臨其境的體驗。此外,除了將人工智慧聊天機器人整合到應用程式中,智慧手機和裝置還將在作業系統層面執行人工智慧系統,以理解並自動執行量身定製的操作。

從管理電子郵件到根據您的使用情況和優先順序建立日程表,人工智慧都能自動為您完成。高通公司(Qualcomm)已經解釋了未來個性化、裝置上的人工智慧將如何工作。

別忘了,OpenAI 和許多其他公司已經在研究 AGI(人工通用智慧),它可以超越人類需要智力輸入和推理的能力。

事實上,ChatGPT 製造商已經在研究一種解決方案,通過生成高質量的合成資料來克服訓練資料的限制。至於它是否與目前正在討論的 “Q*專案”(Project Q*)有關,目前尚無定論。

總的來說,我認為 ChatGPT 作為一個對話式聊天機器人,已經從最初的侷限性發展到現在的廣泛應用,並像國王一樣穩坐頭把交椅。不過,如果我們把視野放大,從更大的角度來看,還是會感覺到它的侷限性,未來我們可能會看到無數新形式的人工智慧體驗。

評論留言