生成式人工智慧是一個新的流行語,以其新穎的應用而出現,如DeepFake和ChatGPT。生成式人工智慧利用人工智慧和機器學習演算法,使機器能夠根據其訓練資料生成人工內容,如文字、影象、音訊和視訊內容。
生成式人工智慧面臨某些挑戰,涉及資料隱私、用於欺詐或犯罪行為以及幻覺。
在這篇文章中,我們將探討什麼是生成式人工智慧,它是如何工作的,優點、缺點和應用,以及充分利用它的潛力所需採取的步驟。
什麼是生成式人工智慧?
生成式人工智慧是通過利用現有文字、音訊檔案或影象來創造新內容的技術。通過生成式人工智慧,計算機檢測與輸入有關的基本模式併產生類似的內容。
有各種技術,如:
Transformers:如GPT-4、LaMDA、Wu-Dao和ChatGPT模仿認知注意力,並對輸入資料部分的重要性進行不同的測量。它們被訓練來理解語言或影象,學習一些分類任務,並從大量資料集中生成文字或影象。
生成式對抗網路(GANs):GANs是兩個神經網路:一個生成器和一個鑑別器,它們相互對立,以找到兩個網路之間的平衡:
- 生成器網路負責生成新的資料或類似於源資料的內容。
- 鑑別器網路負責區分源資料和生成的資料,以識別更接近原始資料的內容。
變數自動編碼器:
- 編碼器將輸入編碼為壓縮程式碼,而解碼器則從該程式碼中重現初始資訊。
- 如果選擇和訓練正確,這種壓縮的表示法可以將輸入的資料分佈儲存在一個小得多的維度上。
生成式人工智慧的應用有哪些?
內容生成
文字生成:生成式人工智慧工具可以建立文字輸出並與使用者進行對話。ChatGPT是一個對話式生成型AI工具的例子。
從種子影象生成人臉、物體和場景的照片:生成式人工智慧可以產生真實外觀的照片。
名人頭像AI生成
文字到影象:它可以從對簡單物體如鳥和花的文字描述中產生逼真的照片。DALL-E是一個流行的文字到影象的翻譯工具。
StackGAN:利用堆疊生成對抗網路從文字到照片的逼真影象合成
其他內容的生成:生成式人工智慧也可以被用來
- 當通過3D列印、CRISPR和其他技術進行操作時,從頭開始渲染物品。
- 編寫軟體程式碼。
影象到影象的轉換
影象到影象的轉換:將一個影象翻譯成另一個影象。例子包括
- 黑白照片到彩色照片
- 白天的照片轉換為夜晚的照片
白天轉黑夜
- 照片轉特定藝術風格繪畫
將照片轉為藝術畫作
- 衛星照片轉為谷歌地圖檢視
衛星照片轉為谷歌地圖檢視
- 語義影象到真實照片:將輸入的語義影象或草圖轉換為照片的現實影象。
從草圖到現實影象
- 臉部正檢視生成:它從不同角度拍攝的照片中生成正面的照片,用於人臉驗證或人臉識別系統。
左邊是輪廓圖,中間是合成圖,右邊是真實正面圖。
- 照片到表情符號:將真實照片改成表情符號或小卡通臉。
一個具體的照片到表情符號和卡通臉的例子
- 臉部老化:從一張年輕的臉部照片生成老版的臉。
與視訊有關的應用
視訊到視訊的轉換(例如,電影修復):它可以通過將老影象和老電影提升到4K及以上的水平來改善它們。例如,它可以生成每秒60幀而不是23幀或更少,消除噪音,並增加色彩。
內容本地化:深度偽造技術被應用於內容的本地化(例如:配音和調節),同時在媒體和娛樂行業的全球發行。通過使用人臉合成和聲音克隆,藝術家/演員的原始聲音可以與脣語相匹配。
請隨時檢視我們關於生成式人工智慧的特定行業應用的文章:
或我們關於生成式人工智慧應用的綜合清單。
生成式人工智慧的好處是什麼?
- 總的來說:隨著能力的成熟,許多行業將受到生成式人工智慧的影響。生成文字、影象和視訊是目前人類工作的一個重要部分。即使是部分的自動化也有很大的潛力
- 身份保護:生成式人工智慧化身為那些不想在面試或工作時透露自己身份的人提供保護。
- 機器人控制:生成式建模幫助強化機器學習模型減少偏見,在模擬和現實世界中理解更抽象的概念。
- 醫療保健:生成式人工智慧能夠早期識別潛在的惡意,以創造有效的治療方法。例如,GANs計算X射線影象的不同角度,以視覺化腫瘤的可能擴充套件。
生成式人工智慧的挑戰是什麼?
- 安全性:有些人可以利用生成式人工智慧進行詐騙,如詐騙他人。
- 高估了能力:生成式人工智慧演算法需要大量的訓練資料來執行任務。然而,GANs不能創造全新的影象或文字。它們只是以不同的方式組合它們所訓練的內容。這就是為什麼一些電腦科學家把它們稱為 “隨機鸚鵡”。
- 幻覺:在一些像GANs這樣的生成式人工智慧模型中,模型可能產生意想不到的結果。
- 資料隱私:與健康有關的應用涉及個人層面資料的隱私問題。
- 版權:生成式人工智慧的版權是一個正在進行的立法和法庭訴訟的話題。
緊跟人工智慧熱潮的步驟
1. 在你的生活或你的企業中確定生成式人工智慧的使用案例。大多數白領活動都圍繞著創造新的文字、影象或視訊,所以應該有許多可能的活動。
2. 根據這些用例對生成式人工智慧的適用性進行排序。這些流程往往更容易用生成式人工智慧來實現自動化:
- 在公共或私人資料中是否有相關的資料(如文字或影象),可以為模型提供資訊?例如,你不能指望一個大型的語言模型來寫一個全新的技術,因為它不會攝入任何關於這個主題的文字。
- 輸出是主觀的還是客觀的?由於幻覺等問題,生成式人工智慧解決方案在面對可以用客觀標準評估的任務時,有可能會犯錯。例如,解決數學問題的生成式人工智慧模型可能會犯錯誤。
- 錯誤容忍度和錯誤緩解策略是什麼?如果模型的輸出可以被主觀或客觀地評價,就會有其結果令人失望的情況。這種情況需要由人類在環路中進行緩解,但如果這是一個機器需要在幾毫秒內做出反應的過程,這可能是不可能的。
3. 按投資回報率對這些用例進行排名。考慮到在你的業務流中使用生成式人工智慧的好處和成本,你可以確定最優先的專案
4. 設計新的流程。新的流程可能涉及到額外的人在環,或者簡單工作流程的整合。
5. 選擇要利用的生成式人工智慧工具
6. 執行一個有明確目標和衡量結果的試點。例如,你可能已經選擇了生成部落格文章作為試點的用例。為了瞭解生成式人工智慧是否帶來好處,你可能需要問:
- 在與你有關的方面,新的博文比人工博文好還是不好?
- 省了多少精力?
7. 識別改進,並推出新的流程:例如,你可能已經執行了試點,使用者線上使用生成式人工智慧應用程式,同時在內部桌面應用程式上完成了一項任務。螢幕切換可能會降低生產力,將生成式人工智慧整合到你的應用程式中,利用API可以釋放出更多的節約,在上線時需要考慮。
生成式人工智慧是有監督的學習嗎?
生成式對抗網路建模(GANs)是一個半監督的學習框架。半監督學習方法在監督學習中使用人工標註的訓練資料,在無監督學習方法中使用未標註的資料,以建立模型,通過利用標註的資料,可以在標註的資料之外做出預測。
GANs的半監督結構有一些好處,它是生成式人工智慧的一種應用,與監督學習相比,它包括:
- 過度擬合:生成式模型往往有較少的引數,所以更難過度擬合。另外,生成模型由於訓練過程中會接觸到大量的資料,使它們對遮擋物更加堅固。
- 人類偏見:在生成模型中,人類標籤不像監督學習方法那樣明顯。學習依賴於資料屬性,這可以避免虛假的相關性。
- 模型偏差:生成式模型不會產生與訓練資料中類似的樣本。因此,形狀與紋理的問題消失了。
評論留言