Generative AI – Inteligência Artificial que renova o conteúdo antigo de uma maneira diferente

Publicados: 2022-04-20

A nova era da tecnologia está pronta para nos trazer uma tecnologia que não apenas pode observar o padrão subjacente de conteúdos antigos, mas também pode produzir novos conteúdos semelhantes à sua base, mas diferentes no front-end.
“IA generativa” é aquela tecnologia que permite que os computadores entendam o padrão subjacente associado a uma entrada e gerem material comparável com base nesse padrão.

O que é IA generativa?

Generative AI é um algoritmo de Inteligência Artificial que permite a criação de novo material crível a partir de conteúdo existente, como texto, gravações de áudio ou fotografias. Dito de outra forma, ele permite que os computadores abstraiam o padrão subjacente associado à entrada e, em seguida, use-o para gerar material semelhante.

Para criar novo conteúdo utilizando texto, arquivos de áudio ou imagens existentes, várias técnicas usadas são:

Redes contraditórias generativas (GANs) :

GANs são modelos generativos nos quais duas redes neurais, um gerador e um discriminador, são engajados entre si. O gerador, também conhecido como rede generativa, é uma rede neural que gera novos dados ou conteúdo semelhante aos dados de origem. O discriminador, também conhecido como rede discriminativa, é uma rede neural que distingue entre os dados de origem e os gerados.

Ambas as redes neurais são treinadas em ciclos alternados, com o gerador aprendendo a produzir dados mais realistas e o discriminador aprendendo a distinguir entre dados falsos e reais.

Como uma relação entre um ladrão e um policial, ambos aprendendo por conta própria novas maneiras de implementar seus deveres. Ladrão tenta descobrir novas maneiras de roubar coisas e policial paralelamente para reduzir os atos de roubo. Cada um deles melhora gradualmente o outro lado como resultado de seus esforços.

GAN implementando dados MNIST
GAN implementando dados MNIST (Crédito: Thalles Silva)

Transformadores :

Os transformadores são um tipo particular de arquitetura de rede neural. Para resumir, as redes neurais são uma ferramenta poderosa para avaliar tipos de dados complexos, como fotos, vídeos, áudio e texto.

Em palavras simples, eles podem até replicar ou até reescrever padrões escritos à mão humanos.

Transformadores como GPT-3, LaMDA e Wu-Dao replicam a atenção cognitiva medindo a relevância dos dados de entrada de diferentes maneiras. Eles são ensinados a reconhecer a linguagem ou imagem, realizar algumas tarefas de classificação e gerar textos ou imagens a partir de grandes conjuntos de dados.

Diagrama do transformador do papel original
Diagrama do transformador do papel original

Autoencoders Variacionais :

O codificador converte os dados em código compactado, que o decodificador decodifica e reproduz os dados originais.
Essa representação compactada armazena a distribuição dos dados de entrada em uma representação dimensional consideravelmente reduzida se for escolhida e treinada corretamente.

Implementação e aplicações de IA generativa

Reproduzindo fotos reais:

A IA generativa pode reproduzir réplicas do mundo real com algumas variações nas fotografias. Qualquer coisa que seja uma imagem pode ser replicada em uma base semelhante, mas parece diferente da original com base na entrada que fornecemos.

implementação de GANs para criar novas amostras de dados
A implementação de GANs para criar novas amostras de dados para o conjunto de dados de dígitos manuscritos MNIST, o conjunto de dados de imagens de objetos pequenos CIFAR-10 e o Toronto Face Database foi discutido no artigo de Ian Goodfellow “Generative Adversarial Networks” publicado em 2014.

Eles podem fazer dígitos que parecem escritos à mão e rostos que se assemelham a pessoas reais.

Crescimento progressivo de GANs para melhor qualidade, estabilidade e variação
Imagem: Crescimento progressivo de GANs para melhorar a qualidade, estabilidade e variação, 2017

Tero Karras demonstrou a produção de imagens realistas de rostos humanos em seu trabalho “Progressive Growing of GANs for Improved Quality, Stability, and Variation” publicado em 2017. As gerações de rostos foram educadas em exemplos famosos, o que significa que alguns rostos têm certas características de celebridades e assim parecem familiares.

Reconversão de Imagens

Conversão do dia para a noite
Conversão do dia para a noite
Visualização de satélite para visualização simples
Visualização de satélite para visualização simples
Pintura com variações
Pintura com variações
Síntese de texto para imagem fotorrealista usando redes adversárias generativas empilhadas

Síntese de texto para imagem fotorrealista usando redes adversárias generativas empilhadas (StackGAN)
Raw to Real e vice-versa
Raw to Real e vice-versa
Esboce para real
Esboce para real
Geração de visualização facial
Geração de Face View : Perfil à esquerda, o sintetizado no meio, a face frontal da verdade à direita
Imagem para Avatar
Imagem para Avatar
Apps de envelhecimento recriando imagens jovens
Apps de envelhecimento recriando imagens jovens

No mundo do entretenimento : Quando acionado pela impressão 3D, CRISPR e outras tecnologias, a IA generativa também pode ser usada para criar produtos do zero.

A tecnologia deep fake é usada para localizar (dublar e filtrar) material enquanto o distribui ao redor do mundo. A voz do artista/ator original pode ser combinada com uma sincronização labial usando síntese de rosto e clonagem de voz.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

Vantagens e Benefícios

A IA generativa tem inúmeras vantagens, incluindo a capacidade de garantir o desenvolvimento de saídas de alta qualidade por autoaprendizagem de cada conjunto de dados.
- Mover os perigos de um projeto para um nível mais baixo
-Reforçar os modelos de aprendizado de máquina para torná-los menos tendenciosos
-Previsão profunda sem a necessidade de sensores
-Usando deepfakes para permitir a localização e regionalização de conteúdo
-Permitir que os robôs entendam conceitos mais abstratos tanto na simulação quanto na vida real.

O que é benéfico em

  • Proteção de identidade: As pessoas que não desejam revelar suas identidades ao entrevistar ou trabalhar podem usar avatares Generative AI para ocultar suas identidades.
  • Controle robótico: a modelagem generativa ajuda os modelos de aprendizado de máquina de reforço na compreensão de conceitos mais abstratos na simulação e no mundo real.
  • Saúde: A IA generativa permite a detecção precoce de malícia potencial e o desenvolvimento de terapias eficazes. GANs, por exemplo, computam vários ângulos de uma imagem de raio-x para visualizar a expansão potencial do tumor.

Alguns desafios

  • Segurança: Algumas pessoas podem usar Generative AI por motivos nefastos, como fraudar outras pessoas.
  • Superestimação de recursos: para realizar tarefas, os algoritmos generativos de IA exigem uma grande quantidade de dados de treinamento. As GANs, por outro lado, são incapazes de gerar imagens ou frases totalmente novas. Eles simplesmente juntam o que sabem de maneiras diferentes.
  • Resultados inesperados: é difícil controlar o comportamento de alguns modelos Generative AI, como GANs. Eles se comportam de forma irregular e fornecem um resultado inesperado.
  • Privacidade de dados: a privacidade de dados em nível individual é um problema em aplicativos relacionados à saúde.