Imagens artísticas com IA ocorrem a partir de textos

Imagens artísticas com IA

Imagens artísticas com IA são feitas automaticamente com base em descrições de textos

Pesquisadores da Universidade de Waterloo, no Canadá, e do Instituto Courant de Ciências Matemáticas de Nova York, nos Estados Unidos, desenvolveram uma ferramenta de inteligência artificial (IA) capaz de gerar imagens artísticas exclusivas automaticamente com base em descrições de texto.

Imagens artísticas com IA

De acordo com os cientistas, o método ocorre por meio de uma rede adversária que gera a memória dinâmica (DM-GAN). Isso nada mais é que um modelo com duas redes neurais artificiais que atuam juntas para produzir imagens extremamente convincentes e próximas da realidade.

Segundo o coautor do estudo, o professor de engenharia Jean-Claude Franchitti:

“Criamos um modelo que usa entradas de texto para gerar figuras conforme são descritas. Isso permite que pessoas com deficiências incapacitantes, ou que não são muito habilidosas para desenhar, possam produzir belas imagens artísticas.”

Treinamento

Para isso, os pesquisadores utilizaram o modelo DM-GAN para gerar uma imagem realista que representasse uma descrição de texto. A partir daí, uma rede neural artificial com várias camadas chamada ResNet foi aplicada para classificar a figura produzida pelo sistema de IA.

WikiArt

Tal imagem foi colocada em uma das categorias de gênero do conjunto de dados, conhecido como WikiArt. Ele funciona como uma base de código aberto que contém mais de 40 mil pinturas produzidas por 195 artistas. Ela é amplamente usada para treinar sistemas de aprendizado profundo.

Franchitti acrescenta:

“Depois de classificar a imagem produzida pelo DM-GAN em uma das categorias de gênero descritas pelo WikiArt, nosso modelo pode selecionar um estilo de pintura compatível com essa categoria de gênero e transferi-lo para a figura gerada, utilizando uma rede neural de estilização artística.”

Resultados

Contudo, mesmo diante dos primeiros resultados que foram bons do ponto de vista de utilização de uma inteligência artificial com capacidades artísticas, os pesquisadores pretendem melhorar o desempenho da rede neural. E isso especialmente em relação ao método de entrada de dados, feito exclusivamente por meio de textos.

Futuro

Por fim, o intuito é que, no futuro, os usuários possam utilizar um módulo de reconhecimento de fala para gerar as imagens. A alternativa permite que pessoas com deficiências manuais consigam usar a própria voz sem ter que digitar caracteres descritivos para criar figuras artísticas. É o que explica o professor de ciência da computação Qinghe Tian, autor principal do estudo.

“Seria fantástico se essa técnica fosse integrada em aplicativos gráficos ou de desenho, permitindo que qualquer pessoa pudesse produzir imagens de alta qualidade, independentemente de suas habilidades e talentos artísticos.”

*Foto: Reprodução

Outras postagens

Postagens relacionadas

Últimas postagens

Internet 4G e 5G: Como estão chegando às regiões agrícolas remotas

Internet 4G e 5G tem ritmo de ampliação pelo Brasil, mas precisa ser maior ainda este alcance Situada a 290 quilômetros de São Paulo, a...

Bateria de íons de sódio tem recarga mais rápida a partir de teste sul-coreano

Bateria de íons de sódio, segundo testes de grupo de pesquisadores da Coreia do Sul, é capaz prover uma recarga em poucos segundos, além...

Unidades de conservação estadual: Tecnologia reforça monitoramento

Unidades de conservação estadual envolvem 85% do território preservado Atualmente, o estado do Acre está 85% preservado. Neste caso, a gestão prioriza o meio ambiente...