生成式人工智能——以不同方式更新旧内容的人工智能

已发表: 2022-04-20

即将到来的新的技术时代已经准备好为我们带来一种技术,它不仅可以观察旧内容的底层模式,还可以在前端产生与其基础相似但不同的新内容。
“生成人工智能”是一种技术,它允许计算机理解与输入相关的基本模式,然后根据该模式生成可比较的材料。

什么是生成式人工智能?

生成式 AI 是一种人工智能算法,可以从文本、录音或照片等现有内容中创建新的可信材料。 换句话说,它使计算机能够抽象出与输入相关的底层模式,然后使用它来生成类似的材料。

利用现有的文本、音频文件或图像创建新内容,使用的各种技术包括:

生成对抗网络(GAN)

GAN 是生成模型,其中两个神经网络,一个生成器和一个判别器,相互参与。 生成器,也称为生成网络,是一种生成与源数据相似的新数据或内容的神经网络。 判别器,也称为判别网络,是一种区分源数据和生成数据的神经网络。

这两个神经网络都在交替循环中进行训练,生成器学习生成更真实的数据,鉴别器学习区分假数据和真实数据。

就像小偷和警察之间的关系一样,他们都在学习自己履行职责的新方法。 小偷试图找出抢劫东西的新方法和警官,以减少盗窃行为。 由于他们的努力,他们每个人都逐渐改善了对方。

GAN 实现 MNIST 数据
GAN 实施 MNIST 数据(来源:Thalles Silva)

变形金刚

Transformer 是一种特殊类型的神经网络架构。 总而言之,神经网络是评估照片、视频、音频和文本等复杂数据类型的强大工具。

简而言之,它们甚至可以复制甚至重写人类手写的书写模式。

GPT-3、LaMDA 和 Wu-Dao 等 Transformer 通过以不同方式测量输入数据片段的相关性来复制认知注意力。 他们被教导识别语言或图像,执行一些分类任务,并从大型数据集中生成文本或图像。

来自原始论文的变压器图
来自原始论文的变压器图

变分自动编码器

编码器将数据转换为压缩代码,解码器将其解码并再现原始数据。
如果选择和训练正确,这种压缩表示将输入数据分布存储在显着减少的维度表示中。

生成式人工智能的实现和应用

复制真实照片:

生成式 AI 可以通过照片中的一些变化来复制现实世界的复制品。 任何图像都可以在类似的基础上复制,但根据我们提供的输入,看起来与原始图像不同。

实施 GAN 以创建新的数据样本
Ian Goodfellow 在 2014 年发表的论文“Generative Adversarial Networks”中讨论了 GAN 为 MNIST 手写数字数据集、CIFAR-10 小物体图像数据集和多伦多人脸数据库创建新数据样本的实现。

他们可以制作看起来像手写的数字和类似真人的面孔。

GAN 的逐步发展以提高质量、稳定性和变化
图片:GAN 的逐步发展以提高质量、稳定性和变化,2017

Tero Karras 在他 2017 年发表的作品“用于改进质量、稳定性和变化的 GAN 的渐进式增长”中展示了人脸真实图像的生成。人脸生成已经接受了著名示例的教育,这意味着一些人脸具有某些名人特征因此显得熟悉。

图像的重新转换

昼夜转换
昼夜转换
卫星视图到普通视图
卫星视图到普通视图
绘画变化
绘画变化
使用堆叠生成对抗网络的文本到照片般逼真的图像合成

使用堆叠生成对抗网络 (StackGAN) 的文本到照片般逼真的图像合成
从原始到真实,反之亦然
从原始到真实,反之亦然
素描到真实
素描到真实
人脸视图生成
脸视图生成左边是轮廓,中间是合成的,右边是真实的正面人脸
图片转头像
图片转头像
老化应用程序重新创建年轻图像
老化应用程序重新创建年轻图像

在娱乐世界中:当被 3D 打印、CRISPR 和其他技术触发时,生成式 AI 也可以用于从头开始创建产品。

Deep fake 技术用于本地化(配音和过滤)材料,同时将其分发到世界各地。 艺术家/原创演员的声音可以通过面部合成和语音克隆与口型同步进行匹配。https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

优点和好处

生成式 AI 具有许多优势,包括能够通过从每组数据中自我学习来确保开发更高质量的输出。
-将项目的危害降低到较低的水平
- 强化机器学习模型以减少偏见
- 无需传感器的深度预测
- 使用 deepfakes 实现内容本地化和区域化
- 使机器人能够在模拟和现实生活中理解更抽象的概念。

哪个是有益的

  • 身份保护:不想在面试或工作时暴露身份的人可以使用生成式 AI 化身来隐藏自己的身份。
  • 机器人控制:生成建模有助于强化机器学习模型在模拟和现实世界中理解更抽象的概念。
  • 医疗保健:生成式人工智能可以及早发现潜在的恶意并开发有效的疗法。 例如,GAN 计算 X 射线图像的多个角度以可视化肿瘤的潜在扩张。

一些挑战

  • 安全性:有些人可能会出于邪恶的动机使用生成式 AI,例如欺骗他人。
  • 高估能力:为了完成任务,生成式 AI 算法需要大量的训练数据。 另一方面,GAN 无法生成全新的图像或短语。 他们只是以不同的方式将他们所知道的东西放在一起。
  • 意外结果:难以控制某些生成式 AI 模型的行为,例如 GAN。 它们行为不规律并提供了意想不到的结果。
  • 数据隐私:个人层面的数据隐私是健康相关应用程序中的一个问题。