- Volver al menú
- Volver al menúPrecios
- Volver al menúInvestigación
- Volver al menúConsenso
- Volver al menú
- Volver al menú
- Volver al menú
- Volver al menúWebinars y Eventos
El aprendizaje automático que impulsa el arte generativo (NFT)
El arte generativo ha sido ONE de los casos de uso del aprendizaje automático por excelencia, pero recién en tiempos recientes este espacio ha alcanzado prominencia generalizada.

La inteligencia artificial (IA) en el ámbito de los tokens no fungibles (NFT) cobra cada vez mayor relevancia. El arte generativo (es decir, el arte creado por un sistema autónomo) se ha consolidado rápidamente como una de las principales categorías del mercado de NFT, impulsando proyectos innovadores y colecciones asombrosas. Desde las obras de leyendas del arte de la IA como Refik Anadol o Sofia Crespo hasta El nuevo proyecto QQL de Tyler HobbsLos NFT se han convertido en ONE de los principales vehículos para acceder al arte impulsado por IA.
El arte generativo ha sido ONE de los casos de uso por excelencia del aprendizaje automático, pero solo recientemente ha alcanzado prominencia generalizada. Este salto se ha debido principalmente a las mejoras computacionales y a una nueva generación de técnicas que permiten a los modelos Aprende sin necesidad de grandes conjuntos de datos etiquetados, cuya construcción es increíblemente limitada y costosa. Si bien la brecha entre la comunidad del arte generativo y la investigación en IA se ha acortado en los últimos años, muchas de las nuevas técnicas de arte generativo aún no han sido ampliamente adoptadas por artistas destacados, ya que la experimentación con estos nuevos métodos lleva tiempo.
Jesús Rodríguez es el CEO de IntoTheBlock.
Los catalizadores del arte generativo
El auge de la IA generativa ha sorprendido incluso a muchos de los pioneros de la IA, quienes consideraban esta disciplina un área relativamente desconocida del aprendizaje automático. El impresionante progreso de la IA generativa se debe a tres factores principales:
- IA multimodal: En los últimos cinco años, hemos presenciado una explosión de métodos de IA que pueden operar en diferentes dominios, como el lenguaje, la imagen, el vídeo o el sonido. Esto ha permitido la creación de modelos como...DALL-Eo Difusión Estable, que generan imágenes o vídeos a partir del lenguaje natural.
- Modelos de lenguaje preentrenados: la aparición de la IA multimodal ha estado acompañada de un progreso notable en los modelos de lenguaje con métodos comoGPT-3Esto ha permitido el uso del lenguaje como mecanismo de entrada para producir resultados artísticos como imágenes, sonidos o vídeos. El lenguaje ha desempeñado un papel fundamental en esta nueva fase de la IA generativa, ya que ha reducido las barreras para que las personas interactúen con los modelos de IA generativa.
- Métodos de difusión: La mayor parte del arte fotorrealista producido por métodos de IA que vemos hoy en día se basa en una técnica llamada modelos de difusión. Antes de la aparición de los modelos de difusión, el espacio de la IA generativa estaba dominado por métodos como las redes generativas antagónicas (GAN) o los autocodificadores variacionales (VAE), que presentan dificultades para escalar y adolecen de falta de diversidad en los resultados generados. Los modelos de difusión abordan estas limitaciones mediante un enfoque poco convencional que consiste en destruir las imágenes de datos de entrenamiento hasta que sean completamente ruidosas y reconstruirlas. El razonamiento es que si un modelo es capaz de reconstruir una imagen a partir de algo que, en teoría, es ruido, entonces debería ser capaz de hacerlo a partir de prácticamente cualquier representación, incluyendo otros dominios como el lenguaje. No es sorprendente que los métodos de difusión se hayan convertido en la base de los modelos de generación de texto a imagen como DALL-E y Difusión Estable.
La influencia de estos métodos en el arte generativo ha coincidido con el surgimiento de otra tendencia Tecnología : los NFT, que han desbloqueado capacidades increíblemente importantes para el arte digital, como la propiedad digital, incentivos programables y modelos de distribución más democratizados.
Ver también:Por qué los artistas de NFT no deberían esperar regalías | Opinión
Los métodos que impulsan el arte generativo en NFT
Texto a imagen:La síntesis de texto a imagen (TTI) ha sido el área más popular de la IA generativa dentro de la comunidad NFT. El espacio TTI ha producido algunos modelos de IA que están trascendiendo la cultura popular. OpenAIDALL-ESe ha convertido posiblemente en el ejemplo más conocido de TTI utilizado para generar imágenes artísticas.PLANEOEs otro modelo TTI creado por OpenAI, que se ha adoptado en muchos entornos de arte generativo. Google ha estado incursionando en el espacio del arte generativo, experimentando con diferentes enfoques comoImagen, que se basa en modelos de difusión, oPartido, que se basa en una técnica diferente llamada modelos autorregresivos. Meta también ha estado cultivando la comunidad del arte generativo con modelos comoCrea una escenaLas empresas emergentes de IA también están incursionando en el espacio TTI con modelos comoA mitad de viajeganando una comunidad vibrante a través de su distribución de Discord yIA de estabilidadsorprendiendo a la comunidad de IA porDifusión estable de código abierto.
Desde una perspectiva NFT, los modelos TTI han tenido la adopción más amplia porque un porcentaje desproporcionado de los coleccionables de arte digital actuales se representan como imágenes estáticas.
Texto a vídeo: La conversión de texto a vídeo (TTV) es un aspecto más complejo del arte generativo, pero en el que estamos viendo un gran progreso. Meta y Google publicaron recientemente modelos de TTV como Haz un video y Imagen Video, que puede generar videoclips de alta fidelidad de fotogramas basados en lenguaje natural. El vídeo es una de las áreas de investigación más activas en el arte generativo, y cabe esperar que la mayoría de los modelos de generación de imágenes tengan equivalentes en vídeo. Los vídeos aún no tienen la misma relevancia en el espacio NFT que las imágenes, pero es probable que esto cambie a medida que los modelos TTV se adopten más ampliamente entre los artistas generativos. El vídeo es una de las áreas que diferencia el arte digital del arte tradicional.
Sigue leyendo: Los NFT pueden y serán mucho más| Opinión
Imagen a imagen:La generación de imágenes mediante entradas textuales resulta casi natural, pero presenta limitaciones a la hora de capturar aspectos como la posición entre diferentes objetos, la orientación o incluso detalles muy específicos del paisaje. Los bocetos u otras imágenes son un mecanismo más adecuado para transmitir esta información. Varios de los principales modelos de difusión, comoDALL-E,Difusión estable y ImagenTodos incorporan mecanismos para generar imágenes a partir de los dibujantes. De igual forma, estos modelos incorporan técnicas como la pintura interna o externa, que permiten extender las imágenes dentro o fuera de sus límites originales.
La mayoría de las prácticas de arte generativo más consolidadas se centran en la creación de imágenes a partir de otras imágenes. No es sorprendente que varias colecciones populares de NFT de arte generativo se basen en variaciones de métodos de imagen a imagen.
Generación musical:La generación automática de música ha sido otro caso de uso común en la IA generativa que ha cobrado relevancia en los últimos años. OpenAI también ha estado a la vanguardia de esta revolución con modelos que incluyenMuseNety, más prominentemente,Tocadiscos tragamonedas, capaz de generar música en diversos estilos y géneros. Recientemente, Google entró en el sector conAudioLMUn modelo que crea voces realistas y música de piano simplemente escuchando fragmentos de sonido. Estabilidad respaldada por IA.Armoníacomenzó a ampliar los límites del espacio de generación de música con IA con el lanzamiento deDifusión de la danza, un conjunto de algoritmos y herramientas que pueden generar clips originales de música.
La música generada por IA es ONE de los ámbitos más importantes en los que los NFT pueden aportar un valor único. A diferencia de otras formas de arte, la música se distribuye digitalmente. La IA generativa puede convertirse en un complemento natural para los productores musicales, y los NFT ofrecen a los creadores formas únicas de expresar su propiedad en clips musicales o canciones.
Una combinación envidiable: NFT y arte generativo
A lo largo de la historia de la Tecnología , se han dado varios casos en los que tendencias relativamente diferentes se han influenciado mutuamente para obtener una cuota de mercado increíble. El ejemplo más reciente es la revolución de las redes sociales, los dispositivos móviles y la nube, en la que cada una de estas tendencias expandió el mercado de las otras dos. La IA generativa y los NFT están comenzando a mostrar una dinámica similar. Ambas tendencias han logrado introducir un mercado Tecnología complejo en la cultura general. Los NFT complementan la IA generativa con modelos digitales de propiedad y distribución que serían prácticamente imposibles de implementar de otro modo. De igual manera, es probable que la IA generativa se convierta en una de las fuentes más importantes de creación de NFT.
Nota: Las opiniones expresadas en esta columna son las del autor y no necesariamente reflejan las de CoinDesk, Inc. o sus propietarios y afiliados.
Jesus Rodriguez
Jesús Rodríguez es el CEO y cofundador de IntoTheBlock, una plataforma enfocada en facilitar inteligencia de mercado y soluciones DeFi institucionales para los Mercados de Cripto . También es cofundador y presidente de Faktory, una plataforma de IA generativa para aplicaciones empresariales y de consumo. Jesús también fundó The Sequence, ONE de los Newsletters sobre IA más populares del mundo. Además de su trabajo operativo, Jesús es profesor invitado en la Universidad de Columbia y la Wharton Business School, y es un escritor y orador muy activo.
