Генеративный ИИ — искусственный интеллект, который обновляет старый контент по-другому
Опубликовано: 2022-04-20Наступающая новая технологическая эра готова принести нам технологию, которая не только может наблюдать базовую модель старого контента, но также может создавать новый контент, похожий на его основу, но отличающийся внешним видом.
«Генеративный ИИ» — это технология, которая позволяет компьютерам понять базовый шаблон, связанный с входными данными, а затем генерировать сопоставимый материал на основе этого шаблона.
Что такое Генеративный ИИ?
Генеративный ИИ — это алгоритм искусственного интеллекта, который позволяет создавать новый правдоподобный материал из существующего контента, такого как текст, аудиозаписи или фотографии. Иными словами, он позволяет компьютерам абстрагировать базовый шаблон, связанный с входными данными, а затем использовать его для создания аналогичного материала.
Для создания нового контента с использованием существующего текста, аудиофайлов или изображений используются различные методы, а именно:
Генеративно-состязательные сети (GAN) :
GAN — это генеративные модели, в которых две нейронные сети, генератор и дискриминатор взаимодействуют друг с другом. Генератор, также известный как генеративная сеть, представляет собой нейронную сеть, которая генерирует новые данные или контент, похожий на исходные данные. Дискриминатор, также известный как дискриминационная сеть, представляет собой нейронную сеть, которая различает исходные и сгенерированные данные.
Обе эти нейронные сети обучаются в чередующихся циклах: генератор учится создавать более реалистичные данные, а дискриминатор учится различать поддельные и настоящие данные.
Как отношения между вором и полицейским, каждый из которых учится на собственном опыте новым способам выполнения своих обязанностей. Вор пытается параллельно найти новые способы грабежа вещей и офицеров, чтобы уменьшить количество краж. Каждый из них постепенно улучшает другую сторону в результате своих усилий.
![GAN реализует данные MNIST](/uploads/article/2851/3FFwpFLMcCFLSEMF.png)
Трансформеры :
Трансформеры — это особый тип архитектуры нейронной сети. Подводя итог, можно сказать, что нейронные сети — это мощный инструмент для оценки сложных типов данных, таких как фотографии, видео, аудио и текст.
Проще говоря, они могут даже копировать или даже переписывать рукописные образцы, написанные человеком.
Преобразователи, такие как GPT-3, LaMDA и Wu-Dao, воспроизводят когнитивное внимание, измеряя релевантность входных данных различными способами. Их учат распознавать язык или изображение, выполнять некоторые задачи по классификации и генерировать тексты или изображения из больших наборов данных.
![Схема трансформатора из оригинальной статьи](/uploads/article/2851/V95VKAgyGslsZPhN.png)
Вариационные автоэнкодеры :
Кодер преобразует данные в сжатый код, который декодер декодирует и воспроизводит исходные данные.
Это сжатое представление сохраняет распределение входных данных в значительно уменьшенном размерном представлении, если оно выбрано и обучено правильно.
Внедрение и применение генеративного ИИ
Воспроизведение реальных фотографий:
Генеративный ИИ может воспроизводить реальную копию с некоторыми вариациями на фотографиях. Все, что является изображением, может быть воспроизведено в аналогичной базе, но выглядит иначе, чем оригинал, на основе предоставленных нами входных данных.
![внедрение GAN для создания новых выборок данных](/uploads/article/2851/auhLHbR0p6VLxHLj.png)
Они могут создавать цифры, которые кажутся написанными от руки, и лица, похожие на настоящих людей.
![Прогрессивный рост сетей GAN для повышения качества, стабильности и разнообразия](/uploads/article/2851/IYHlqEB7Ue9mjIb0.jpg)
Теро Каррас продемонстрировал создание реалистичных изображений человеческих лиц в своей работе «Прогрессивный рост GAN для повышения качества, стабильности и вариации», опубликованной в 2017 году. Поколения лиц были воспитаны на известных примерах, а это означает, что некоторые лица имеют определенные черты знаменитостей. и поэтому кажутся знакомыми.
Реконверсия изображений
![Преобразование дня в ночь](/uploads/article/2851/M0DzXg36Ob6LpU9u.png)
![Вид со спутника на обычный вид](/uploads/article/2851/zwOiP10LDjyIpDMU.png)
![Живопись в вариациях](/uploads/article/2851/guIAvlhBIGuQDYM1.png)
![Синтез текста в фотореалистичные изображения с использованием сложенных генеративно-состязательных сетей](/uploads/article/2851/o2XZYmoSwsFaHiAC.png)
Синтез текста в фотореалистичные изображения с использованием сложенных генеративно-состязательных сетей (StackGAN)
![Необработанное в реальное и наоборот](/uploads/article/2851/9f0gVQJ7IpfyyrvH.png)
![Эскиз в реальность](/uploads/article/2851/tnAKtSMO4Nb54KPz.png)
![Генерация вида лица](/uploads/article/2851/vv7ySlmVzqo5nF6T.png)
![Изображение для аватара](/uploads/article/2851/sMh13tfsShm1cBgE.png)
![Стареющие приложения, воссоздающие молодые образы](/uploads/article/2851/NPAAelp5WhbGxdUn.png)
В мире развлечений : при запуске 3D-печати, CRISPR и других технологий генеративный ИИ также можно использовать для создания продуктов с нуля.
![](https://s.stat888.com/img/bg.png)
Технология Deep Fake используется для локализации (дублирования и фильтрации) материала при его распространении по всему миру. Голос артиста / оригинального актера можно сопоставить с синхронизацией губ с использованием синтеза лица и клонирования голоса.
Преимущества и преимущества
Генеративный ИИ имеет множество преимуществ, в том числе возможность обеспечивать получение более качественных результатов путем самообучения из каждого набора данных.
- Перемещение опасностей проекта на более низкий уровень
- Укрепление моделей машинного обучения, чтобы сделать их менее предвзятыми
-Глубокий прогноз без использования датчиков
-Использование дипфейков для обеспечения локализации и регионализации контента.
- Предоставление роботам возможности понимать более абстрактные концепции как в моделировании, так и в реальной жизни.
Что выгодно в
- Защита личности: люди, которые не хотят раскрывать свою личность во время собеседования или работы, могут использовать генеративные аватары ИИ, чтобы скрыть свою личность.
- Управление робототехникой: генеративное моделирование помогает укрепить модели машинного обучения в понимании более абстрактных концепций в моделировании и в реальном мире.
- Здравоохранение: Генеративный ИИ позволяет на раннем этапе обнаруживать потенциальные злонамеренные действия и разрабатывать эффективные методы лечения. GAN, например, вычисляют несколько углов рентгеновского изображения, чтобы визуализировать потенциальное расширение опухоли.
Некоторые вызовы
- Безопасность: некоторые люди могут использовать генеративный ИИ в гнусных целях, например, для обмана других.
- Переоценка возможностей: для выполнения задач алгоритмам генеративного ИИ требуется огромное количество обучающих данных. С другой стороны, GAN не могут генерировать совершенно новые изображения или фразы. Они просто соединяют то, что знают, по-разному.
- Неожиданные результаты: трудно контролировать поведение некоторых моделей генеративного ИИ, таких как GAN. Они ведут себя хаотично и дают неожиданный результат.
- Конфиденциальность данных: Конфиденциальность данных на индивидуальном уровне является проблемой в приложениях, связанных со здоровьем.