Investigadores Explican la "Creatividad" de la IA a Través del Proceso de Eliminación de Ruido

Investigadores Explican la "Creatividad" de la IA a Través del Proceso de Eliminación de Ruido

Un nuevo estudio, destacado en la revista Quanta Magazine, revela el mecanismo de la "creatividad" en los modelos de difusión de IA como Midjourney. Los científicos han llegado a la conclusión de que la creatividad no es una propiedad mágica, sino un subproducto determinista de la propia arquitectura del modelo. El proceso de generación de imágenes comienza con ruido aleatorio. En cada uno de los muchos pasos, el modelo "elimina el ruido" ligeramente de la imagen, acercándola a la descripción del texto. Los investigadores descubrieron que, debido a las restricciones arquitectónicas (específicamente la "localidad", donde el modelo se enfoca en pequeños parches en lugar de en la imagen completa), la IA se ve obligada a "improvisar", ensamblando la imagen final a partir de fragmentos individuales como un mosaico. Es esta secuencia de decisiones locales la que da lugar a composiciones nuevas y originales, en lugar de un simple promedio de imágenes de los datos de entrenamiento. Este descubrimiento ayuda a desmitificar las habilidades creativas de la IA y abre caminos para crear herramientas generativas más controlables.

« Volver a la Lista de Noticias