Mediante DragGAN, cualquiera puede deformar una imagen con un control preciso sobre dónde van los píxeles, manipulando así la pose, la forma, la expresión y la disposición de diversas categorías como animales, coches, humanos, paisajes, etc.
Dado que estas manipulaciones se realizan sobre el colector generativo de imágenes aprendido de un GAN, tienden a producir resultados realistas incluso para escenarios desafiantes como alucinar contenido ocluido y deformar formas que siguen consistentemente la rigidez del objeto.
Las comparaciones cualitativas y cuantitativas demuestran la ventaja de DragGAN sobre enfoques anteriores en las tareas de manipulación de imágenes y seguimiento de puntos.