- Retour au menu
- Retour au menuTarifs
- Retour au menuRecherche
- Retour au menuConsensus
- Retour au menu
- Retour au menu
- Retour au menu
- Retour au menuWebinaires et Événements
L'apprentissage automatique au cœur des NFT d'art génératif
L’art génératif a été ONEun des cas d’utilisation par excellence de l’apprentissage automatique, mais ce n’est que récemment que cet espace a acquis une importance grand public.

L'intelligence artificielle (IA) gagne en importance dans le secteur des jetons non fongibles (NFT). L'art génératif (c'est-à-dire l'art créé par un système autonome) s'est rapidement imposé comme ONEune des principales catégories du marché des NFT, suscitant des projets innovants et des collections exceptionnelles. Des œuvres de légendes de l'art IA comme Refik Anadol ou Sofia Crespo aux Le nouveau projet QQL de Tyler HobbsLes NFT sont devenus ONEun des principaux véhicules permettant d’accéder à l’art alimenté par l’IA.
L'art génératif est ONEun des cas d'utilisation par excellence de l'apprentissage automatique, mais ce n'est que récemment que ce domaine a acquis une importance grandissante. Cette avancée est principalement due aux gains de calcul et à une nouvelle génération de techniques permettant aux modèles Guides sans nécessiter de nombreux jeux de données étiquetés, extrêmement limités et coûteux à construire. Même si l'écart entre la communauté de l'art génératif et la recherche en IA s'est réduit ces dernières années, nombre de ces nouvelles techniques T encore peu adoptées par les artistes de renom, car leur expérimentation prend du temps.
Jesus Rodriguez est le PDG d'IntoTheBlock.
Les catalyseurs de l'art génératif
L'essor de l'IA générative a surpris même nombre des pionniers de l'IA, qui considéraient généralement cette discipline comme un domaine relativement méconnu de l'apprentissage automatique. Les progrès impressionnants de l'IA générative s'expliquent par trois facteurs principaux :
- IA multimodale : Ces cinq dernières années, nous avons assisté à une explosion de méthodes d'IA capables d'intervenir dans différents domaines tels que le langage, l'image, la vidéo ou le son. Cela a permis la création de modèles tels queDALL-Eou Stable Diffusion, qui génèrent des images ou des vidéos à partir du langage naturel.
- Modèles de langage pré-entraînés : L'émergence de l'IA multimodale s'est accompagnée de progrès remarquables dans les modèles de langage avec des méthodes commeGPT-3Cela a permis d'utiliser le langage comme mécanisme d'entrée pour produire des œuvres artistiques telles que des images, des sons ou des vidéos. Le langage a joué un rôle primordial dans cette nouvelle phase de l'IA générative, car il a simplifié l'interaction avec les modèles d'IA générative.
- Méthodes de diffusion : La plupart des œuvres d'art photoréalistes produites par les méthodes d'IA actuelles reposent sur une technique appelée modèles de diffusion. Avant l'apparition de ces modèles, l'IA générative était dominée par des méthodes telles que les réseaux antagonistes génératifs (GAN) ou les auto-encodeurs variationnels (VAE), qui présentent des difficultés de mise à l'échelle et souffrent d'un manque de diversité des sorties générées. Les modèles de diffusion remédient à ces limitations en adoptant une approche non conventionnelle : détruire les images de données d'entraînement jusqu'à ce qu'elles soient complètement bruitées, puis les reconstruire. Le raisonnement est le suivant : si un modèle est capable de reconstruire une image à partir d'un élément théoriquement bruité, il devrait pouvoir le faire à partir de pratiquement n'importe quelle représentation, y compris d'autres domaines comme le langage. Sans surprise, les méthodes de diffusion sont devenues le fondement des modèles de conversion de texte en image tels que DALL-E et Stable Diffusion.
L’influence de ces méthodes dans l’art génératif a coïncidé avec l’émergence d’une autre tendance Technologies : les NFT, qui ont débloqué des capacités incroyablement importantes pour l’art numérique telles que la propriété numérique, les incitations programmables et des modèles de distribution plus démocratisés.
Voir aussi :Pourquoi les artistes NFT ne devraient T s'attendre à des « royalties » | Analyses
Les méthodes qui alimentent l'art génératif dans les NFT
Texte à image :La synthèse de texte en image (TTI) est le domaine d'IA générative le plus populaire au sein de la communauté NFT. L'espace TTI a produit des modèles d'IA qui transcendent littéralement la culture populaire. OpenAIDALL-Eest sans doute devenu l’exemple le plus connu de TTI utilisé pour générer des images artistiques.GLISSERest un autre modèle TTI créé par OpenAI, adopté dans de nombreux contextes d'art génératif. Google s'est intéressé à l'art génératif en expérimentant différentes approches, telles queImages, qui est basé sur des modèles de diffusion, ouParti, qui repose sur une technique différente appelée modèles autorégressifs. Meta a également cultivé la communauté de l'art génératif avec des modèles commeCréer une scèneLes startups d'IA font également des percées dans l'espace TTI avec des modèles commeÀ mi-parcoursgagner une communauté dynamique via sa distribution Discord etIA de stabilitéchoquant la communauté de l'IA endiffusion stable en open source.
Du point de vue des NFT, les modèles TTI ont connu la plus large adoption, car un pourcentage disproportionné d'objets de collection d'art numérique sont aujourd'hui représentés sous forme d'images statiques.
Texte en vidéo : La conversion de texte en vidéo (TTV) est un aspect plus complexe de l'art génératif, mais ONE connaît des progrès majeurs. Meta et Google ont récemment publié des modèles TTV tels que Faire une vidéo et Imagen Vidéo, capable de générer des clips vidéo haute fidélité à partir du langage naturel. La vidéo est ONEun des domaines de recherche les plus actifs en art génératif, et la plupart des modèles de génération d'images devraient avoir des équivalents vidéo. Les vidéos ne sont pas encore aussi présentes que les images dans l'espace NFT, mais cela devrait changer à mesure que les modèles TTV seront plus largement adoptés par les artistes génératifs. La vidéo est ONEun des domaines qui différencie l'art numérique de l'art traditionnel.
Sur le même sujet : Les NFT peuvent être et seront bien plus que cela| Analyses
Image à image :La génération d'images via des entrées textuelles semble presque naturelle, mais elle présente des limites lorsqu'il s'agit de capturer des aspects tels que la position entre différents objets, l'orientation ou même des détails très précis du paysage. Les croquis ou autres images constituent un meilleur moyen de transmettre ces informations. Plusieurs des principaux modèles de diffusion, tels queDALL-E,Diffusion stable et ImagesTous intègrent des mécanismes de génération d'images à partir d'esquisses. De même, ces modèles intègrent des techniques telles que l'in-painting ou l'out-painting, qui permettent d'étendre les images à l'intérieur ou au-delà de leurs limites d'origine.
La plupart des pratiques artistiques génératives les plus reconnues se concentrent sur la création d'images à partir d'autres images. Sans surprise, plusieurs collections NFT d'art génératif populaires reposent sur des variantes de méthodes d'image à image.
Génération musicale :La génération automatique de musique est un autre cas d'utilisation courant de l'IA générative, qui a gagné en importance ces dernières années. OpenAI a également été à l'avant-garde de cette révolution avec des modèles tels queMuseNetet, plus particulièrement,Juke-box, capable de générer de la musique dans divers styles et genres. Google a récemment fait son entrée dans ce secteur avecAudioLM, un modèle qui crée des paroles et des morceaux de piano réalistes simplement en écoutant des extraits sonores. Stabilité assurée par l'IA.Harmonaia commencé à repousser les limites de l'espace de génération de musique IA avec la sortie deDiffusion de la danse, un ensemble d'algorithmes et d'outils permettant de générer des clips musicaux originaux.
La musique générée par l'IA est ONEun des principaux domaines dans lesquels les NFT peuvent apporter une valeur unique. Contrairement aux autres formes d'art, la musique est distribuée sous forme numérique. L'IA générative peut devenir un complément naturel pour les producteurs de musique, et les NFT offrent aux créateurs des moyens uniques d'exprimer leur appartenance à des clips musicaux ou à des chansons.
Une alliance enviable : les NFT et l'art génératif
Tout au long de l'histoire des Technologies , plusieurs tendances relativement différentes ont su s'influencer mutuellement pour conquérir des parts de marché considérables. L'exemple le plus récent est la révolution social-mobile-cloud, où ONE de ces tendances a élargi le marché des deux autres. L'IA générative et les NFT commencent à afficher une dynamique similaire. Ces deux tendances ont permis d'intégrer un marché Technologies complexe à la culture dominante. Les NFT complètent l'IA générative par des modèles de propriété et de distribution numériques qui seraient quasiment impossibles à mettre en œuvre autrement. De même, l'IA générative est susceptible de devenir ONEune des principales sources de création de NFT.
Remarque : Les opinions exprimées dans cette colonne sont celles de l'auteur et ne reflètent pas nécessairement celles de CoinDesk, Inc. ou de ses propriétaires et affiliés.
Jesus Rodriguez
Jesus Rodriguez est PDG et cofondateur d'IntoTheBlock, une plateforme dédiée à la veille concurrentielle et aux solutions DeFi institutionnelles pour les Marchés des Crypto . Il est également cofondateur et président de Faktory, une plateforme d'IA générative pour applications professionnelles et grand public. Il a également fondé The Sequence, ONEune des Newsletters d'IA les plus populaires au monde. Outre son activité opérationnelle, Jesus est conférencier invité à l'Université Columbia et à la Wharton Business School, et est un écrivain et conférencier très actif.
