- Imagen, lançado na segunda-feira, superou outros softwares semelhantes;
- O Google disse que, embora estivesse satisfeito com os resultados, ainda havia problemas com o algoritmo;
- Há imaginações criativas nessas imagens, como “corgi fofo morando em uma casa de sushi”.
Entusiastas da arte digital, computação gráfica e inteligência artificial notaram a última tendência emergente na interseção desses mundos: geradores de texto para imagem.
Esses programas fazem exatamente o que o nome diz. Você descreve a imagem e ela é capaz de gerar o que você quer dizer com uma certa precisão. Há também uma variedade de estilos que podem ser introduzidos no processo de criação dessas imagens. Podem parecer que foram pintados a óleo, feitos a partir de computação gráfica, ou mesmo parecidos com fotografias.
Antes disso, o líder na área era o DALL-E, criado pelo OpenIA, um laboratório comercial de inteligência artificial. Ontem, no entanto, o Google lançou seu próprio software de imagem, Imagen, que superou o DALL-E em sua qualidade de criação.
Imagen
As imagens criadas pelo Google podem ser visualizadas no link https://imagen.research.google/. No site, você ainda pode participar de um minijogo onde pode escolher termos e criar imagens, utilizando pré-renderizações já criadas pelo Google.
No início, a qualidade, precisão e variedade dessas imagens eram surpreendentes. Por exemplo, “um corgi fofo mora em uma casa de sushi” e “uma foto de um guaxinim em um capacete de astronauta olhando pela janela à noite”, todos reproduzindo exatamente o que está em nossas mentes.
No entanto, é importante notar que os pesquisadores sempre procuram divulgar seus melhores resultados. Portanto, embora as imagens pareçam perfeitas, elas não são necessariamente representativas da qualidade média das imagens produzidas. Em outros programas, o produto final geralmente é uma imagem que parece inacabada, manchada ou borrada.
Problemas de inteligência artificial
O Google antecipa que seus programas podem enfrentar críticas no futuro, como manipulação maliciosa e falta de diversidade em seu banco de dados de IA.
A empresa decidiu não liberar a base de código do Imagen, temendo que o programa pudesse ser usado para aplicativos com mais problemas, como notícias falsas ou casos de assédio. Foi o que aconteceu com o advento dos “deepfakes”, programas capazes de produzir vídeos de celebridades ou qualquer outra pessoa com muito material de foto ou vídeo online.
Outro grande problema apontado pelo Google foi o viés no banco de dados. Usando dados capturados da internet, o software acaba por reproduzir vários “estereótipos sociais, visões opressivas e associações depreciativas ou prejudiciais com grupos de identidade marginalizados”, disse a empresa.
A gigante da tecnologia não detalhou o conteúdo perturbador gerado pelo Imagen, mas disse que o modelo “codifica uma variedade de preconceitos e estereótipos sociais, incluindo uma tendência geral de gerar imagens de pessoas com tons de pele mais claros, bem como uma tendência a retratar diferentes tipos de pele. tons. imagens. Ocupações que se encaixam nos estereótipos de gênero ocidentais.”