生成式人工智能——以不同方式更新舊內容的人工智能

已發表: 2022-04-20

即將到來的新的技術時代已經準備好為我們帶來一種技術,它不僅可以觀察舊內容的底層模式,還可以在前端產生與其基礎相似但不同的新內容。
“生成人工智能”是一種技術,它允許計算機理解與輸入相關的基本模式,然後根據該模式生成可比較的材料。

什麼是生成式人工智能?

生成式 AI 是一種人工智能算法,可以從文本、錄音或照片等現有內容中創建新的可信材料。 換句話說,它使計算機能夠抽像出與輸入相關的底層模式,然後使用它來生成類似的材料。

利用現有的文本、音頻文件或圖像創建新內容,使用的各種技術包括:

生成對抗網絡(GAN)

GAN 是生成模型,其中兩個神經網絡,一個生成器和一個判別器,相互參與。 生成器,也稱為生成網絡,是一種生成與源數據相似的新數據或內容的神經網絡。 判別器,也稱為判別網絡,是一種區分源數據和生成數據的神經網絡。

這兩個神經網絡都在交替循環中進行訓練,生成器學習生成更真實的數據,鑑別器學習區分假數據和真實數據。

就像小偷和警察之間的關係一樣,他們都在學習自己履行職責的新方法。 小偷試圖找出搶劫東西的新方法和警官,以減少盜竊行為。 由於他們的努力,他們每個人都逐漸改善了對方。

GAN 實現 MNIST 數據
GAN 實施 MNIST 數據(來源:Thalles Silva)

變形金剛

Transformer 是一種特殊類型的神經網絡架構。 總而言之,神經網絡是評估照片、視頻、音頻和文本等複雜數據類型的強大工具。

簡而言之,它們甚至可以復制甚至重寫人類手寫的書寫模式。

GPT-3、LaMDA 和 Wu-Dao 等 Transformer 通過以不同方式測量輸入數據片段的相關性來複製認知注意力。 他們被教導識別語言或圖像,執行一些分類任務,並從大型數據集中生成文本或圖像。

來自原始論文的變壓器圖
來自原始論文的變壓器圖

變分自動編碼器

編碼器將數據轉換為壓縮代碼,解碼器將其解碼並再現原始數據。
如果選擇和訓練正確,這種壓縮表示將輸入數據分佈存儲在顯著減少的維度表示中。

生成式人工智能的實現和應用

複製真實照片:

生成式 AI 可以通過照片中的一些變化來複製現實世界的複製品。 任何圖像都可以在類似的基礎上複製,但根據我們提供的輸入,看起來與原始圖像不同。

實施 GAN 以創建新的數據樣本
Ian Goodfellow 在 2014 年發表的論文“Generative Adversarial Networks”中討論了 GAN 為 MNIST 手寫數字數據集、CIFAR-10 小物體圖像數據集和多倫多人臉數據庫創建新數據樣本的實現。

他們可以製作看起來像手寫的數字和類似真人的面孔。

GAN 的逐步發展以提高質量、穩定性和變化
圖片:GAN 的逐步發展以提高質量、穩定性和變化,2017

Tero Karras 在他 2017 年發表的作品“用於改進質量、穩定性和變化的 GAN 的漸進式增長”中展示了人臉的逼真圖像的生成。人臉生成已經接受了著名示例的教育,這意味著一些人臉具有某些名人特徵因此顯得熟悉。

圖像的重新轉換

晝夜轉換
晝夜轉換
衛星視圖到普通視圖
衛星視圖到普通視圖
繪畫變化
繪畫變化
使用堆疊生成對抗網絡的文本到照片般逼真的圖像合成

使用堆疊生成對抗網絡 (StackGAN) 的文本到照片般逼真的圖像合成
從原始到真實,反之亦然
從原始到真實,反之亦然
素描到真實
素描到真實
人臉視圖生成
臉視圖生成左邊是輪廓,中間是合成的,右邊是真實的正面人臉
圖片轉頭像
圖片轉頭像
老化應用程序重新創建年輕圖像
老化應用程序重新創建年輕圖像

在娛樂世界中:當被 3D 打印、CRISPR 和其他技術觸發時,生成式 AI 也可以用於從頭開始創建產品。

Deep fake 技術用於本地化(配音和過濾)材料,同時將其分發到世界各地。 藝術家/原創演員的聲音可以通過面部合成和語音克隆與口型同步進行匹配。https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

優點和好處

生成式 AI 具有許多優勢,包括能夠通過從每組數據中自我學習來確保開發更高質量的輸出。
-將項目的危害降低到較低的水平
- 強化機器學習模型以減少偏見
- 無需傳感器的深度預測
- 使用 deepfakes 實現內容本地化和區域化
- 使機器人能夠在模擬和現實生活中理解更抽象的概念。

哪個是有益的

  • 身份保護:不想在面試或工作時暴露身份的人可以使用生成式 AI 化身來隱藏自己的身份。
  • 機器人控制:生成建模有助於強化機器學習模型在模擬和現實世界中理解更抽象的概念。
  • 醫療保健:生成式人工智能可以及早發現潛在的惡意並開發有效的療法。 例如,GAN 計算 X 射線圖像的多個角度以可視化腫瘤的潛在擴張。

一些挑戰

  • 安全性:有些人可能會出於邪惡的動機使用生成式 AI,例如欺騙他人。
  • 高估能力:為了完成任務,生成式 AI 算法需要大量的訓練數據。 另一方面,GAN 無法生成全新的圖像或短語。 他們只是以不同的方式將他們所知道的東西放在一起。
  • 意外結果:難以控制某些生成式 AI 模型的行為,例如 GAN。 它們行為不規律並提供了意想不到的結果。
  • 數據隱私:個人層面的數據隱私是健康相關應用程序中的一個問題。