El avance tecnológico que este nuevo siglo nos ha traído es impresionante, especialmente en todo lo relacionado con la Inteligencia Artificial (IA), que juega un papel clave para ayudar y aligerar la vida de los humanos, pues nos ayuda a conducir vehículos autónomos, e incluso, los robots ya realizan tareas que nosotros no queremos hacer.
Aunque aún estamos muy lejos de evolucionar en todo lo referente con la IA, se acaban de crear las dos más poderosas jamás creadas, con DALL-E 2 e IMAGEN; ambas son las primeras en su tipo en intentar acercarse a los seres humanos no a través de tareas mecánicas, sino en el área creativa y en Heraldo Binario te las presentmaos.
DALL-E 2 es la segunda versión de la IA generativa creada por OpenAI, una empresa fundada originalmente por Elon Musk, quien luego dejaría su gestión, y que ha recibido una importante financiación por parte de Microsoft.
DALL-E 2 funciona trabajando con enormes bases de datos de las que es capaz de extraer y reconocer referencias tanto en texto como en imágenes, formulando resultados que te dejan boquiabierto; y es que la IA crea sus propias ilustraciones.
Así, DALL-E 2 es capaz de desplegar cientos de imágenes y para ello basta que un humano le indique lo que desea ver, con lo que la IA hace uso de su creatividad.
A esto se ha sumado IMAGE, un proyecto similar de Google que también se lanzó en estos días, y en su caso está mucho más enfocado a generar imágenes con un enfoque realista.
“Creo que en muy pocos años, cuando estas tecnologías sean de dominio público e integradas en todos los dispositivos que usamos (incluidos los móviles), van a ser un agente de cambio con unas consecuencias que hoy en día son muy difíciles de predecir”, señaló Javier López, fundador de Erasmusu y que en los últimos tiempos se ha interesado e investigado las posibilidades que ofrecen estas nuevas formas de generación de imágenes.
Trabajan en crear imágenes como cuando el cerebro humano evoca recuerdos
Estos dos tipos de IA (DALL-E 2 e IMAGE) pretenden funcionar de manera similar al cerebro humano cuando evocamos recuerdos.
De acuerdo con los expertos, el principal factor diferenciador de DALL-E es el enorme dataset con el que trabaja (la cantidad de registros de los que toma información) y su forma de conectar y entrelazar las solicitudes tanto de texto como de imagen.
El proceso por el que DALL-E 2 acaba generando cosas tan increíbles como las imágenes que hemos visto es realmente complejo, pero para Ideami hay algo fundamental como punto de partida para entenderlo.
Así funciona DALL-E 2
“La similitud con el funcionamiento del cerebro humano a la hora de recordar es un buen punto de partida. Recopilamos información en un momento dado, que almacenamos. Después de un tiempo, evocamos esa información en forma de memoria. No siempre será el mismo, pero lo modificaremos cada vez. Transferida a la IA, parte de la información que le damos, busca su dataset, y genera la imagen que nos da”, explican los expertos creadores de DALL-E 2.
La secuencia DALL-E 2 funciona así:
- Se captura la información: primero, se ingresa un texto en un codificador que está capacitado para asignar el texto a un espacio de representación particular, por lo que es menester saber lo mejor posible lo que estamos pidiendo.
- Luego, DALL-E 2 busca en su enorme banco de "recuerdos".
- A continuación, un modelo asigna la codificación del texto a una codificación de imagen correspondiente que captura la información semántica del mensaje.
- La IA comienza a hacer coincidir texto e imagen. La imagen es evocada:
- Finalmente, un modelo de decodificación de imágenes genera estocásticamente una imagen que es una manifestación visual de esta información semántica que entiende que le hemos dado.
Con información de gadgets news
Sigue a Heraldo Binario en Google News, dale CLIC AQUÍ.