- Вернуться к меню
- Вернуться к менюЦены
- Вернуться к менюИсследовать
- Вернуться к менюКонсенсус
- Вернуться к менюПартнерский материал
- Вернуться к меню
- Вернуться к меню
- Вернуться к менюВебинары и Мероприятия
Машинное обучение как основа генеративного искусства NFT
Генеративное искусство всегда было ONE из основных вариантов использования машинного обучения, но лишь недавно эта сфера приобрела широкую известность.

Искусственный интеллект (ИИ) в пространстве невзаимозаменяемых токенов (NFT) становится все более актуальным. Генеративное искусство (то есть искусство, созданное автономной системой) быстро вышло в ONE из основных категорий рынка NFT, стимулируя инновационные проекты и удивительные коллекции. От работ легенд ИИ-искусства, таких как Рефик Анадоль или София Креспо, до Новый проект QQL Тайлера ХоббсаNFT стали ONE из основных средств доступа к искусству, созданному с помощью искусственного интеллекта.
Генеративное искусство было ONE из наиболее существенных вариантов использования машинного обучения, но только недавно эта область достигла мейнстримной известности. Скачок был в основном обусловлен вычислительными достижениями и новым поколением методов, которые могут помочь моделям Словарь, не требуя большого количества маркированных наборов данных, которые невероятно ограничены и дороги в создании. Несмотря на то, что разрыв между сообществом генеративного искусства и исследованиями ИИ сокращается в последние несколько лет, многие из новых методов генеративного искусства до сих пор T получили широкого распространения среди известных художников, поскольку требуется некоторое время, чтобы экспериментировать с этими новыми методами.
Хесус Родригес — генеральный директор IntoTheBlock.
Катализаторы генеративного искусства
Рост генеративного ИИ стал неожиданностью даже для многих ранних пионеров ИИ, которые в основном рассматривали эту дисциплину как относительно малоизвестную область машинного обучения. Впечатляющий прогресс в генеративном ИИ можно проследить за тремя основными факторами:
- Мультимодальный ИИ: За последние пять лет мы увидели взрыв методов ИИ, которые могут работать в различных областях, таких как язык, изображение, видео или звук. Это позволило создать такие модели, какДАЛЛ-Иили Stable Diffusion, которые генерируют изображения или видео на основе естественного языка.
- Предварительно обученные языковые модели: Появление мультимодального ИИ сопровождалось значительным прогрессом в языковых моделях с использованием таких методов, какГПТ-3. Это позволило использовать язык в качестве механизма ввода для создания художественных результатов, таких как изображения, звуки или видео. Язык сыграл важнейшую роль в этой новой фазе генеративного ИИ, поскольку он снизил барьер для взаимодействия людей с моделями генеративного ИИ.
- Методы диффузии: Большая часть фотореалистичного искусства, созданного методами ИИ, которые мы видим сегодня, основана на технике, называемой диффузионными моделями. До появления диффузионных моделей в генеративном пространстве ИИ доминировали такие методы, как генеративные состязательные сети (GAN) или вариационные автокодировщики (VAE), которые испытывают проблемы с масштабированием и страдают от отсутствия разнообразия генерируемых выходных данных. Диффузионные модели устраняют эти ограничения, следуя нетрадиционному подходу разрушения изображений обучающих данных до тех пор, пока они не станут полным шумом, и их восстановления обратно. Обоснование заключается в том, что если модель способна реконструировать изображение из чего-то, что теоретически является шумом, то она должна быть способна сделать это практически из любого представления, включая другие области, такие как язык. Неудивительно, что диффузионные методы стали основой моделей генерации текста в изображение, таких как DALL-E и Stable Diffusion.
Влияние этих методов на генеративное искусство совпало с появлением еще одной Технологии тенденции: NFT, которые открыли невероятно важные возможности для цифрового искусства, такие как цифровое владение, программируемые стимулы и более демократизированные модели распространения.
Смотрите также:Почему артистам NFT T стоит рассчитывать на «роялти» | Мнение
Методы, лежащие в основе генеративного искусства в NFT
Текст к изображению:Синтез текста в изображение (TTI) стал самой популярной областью генеративного ИИ в сообществе NFT. Пространство TTI создало некоторые модели ИИ, которые буквально проникли в поп-культуру. OpenAIДАЛЛ-Ипожалуй, стал самым известным примером использования TTI для создания художественных изображений.СКОЛЬЗИТЬ— еще одна модель TTI, созданная OpenAI, которая была принята во многих генеративных арт-установках. Google занимается генеративным арт-пространством, экспериментируя с различными подходами, такими какИзображение, который основан на моделях диффузии, илиПарти, который основан на другой технике, называемой авторегрессионными моделями. Meta также развивает сообщество генеративного искусства с помощью таких моделей, какMake-A-Scene. Стартапы в области искусственного интеллекта также проникают в сферу TTI с такими моделями, какВ середине путиприобретает активное сообщество через распространение Discord иСтабильность ИИшокировать сообщество ИИ,открытый исходный код Стабильная диффузия.
С точки зрения NFT, модели TTI получили наибольшее распространение, поскольку непропорционально большая часть коллекционных предметов цифрового искусства сегодня представлена в виде статических изображений.
Текст в видео: Текст-в-видео (TTV) — более сложный аспект генеративного искусства, но в ONE мы видим значительный прогресс. Meta и Google недавно опубликовали модели TTV, такие как Сделать Видео и Видео Изображение, который может генерировать видеоклипы с высокой точностью кадров на основе естественного языка. Видео является ONE из самых активных областей исследований генеративного искусства, и мы должны ожидать, что большинство моделей генерации изображений будут иметь видеоэквиваленты. Видео все еще не так заметны в пространстве NFT, как изображения, но это, вероятно, изменится, поскольку модели TTV будут все более широко использоваться генеративными художниками. Видео является ONE из областей, которая отличает цифровое искусство от традиционного искусства.
Читать дальше: NFT могут и будут намного больше| Мнение
Изображение-к-изображению:Создание изображений с помощью текстовых входов кажется почти естественным, но имеет ограничения, когда дело доходит до захвата таких аспектов, как позиции между различными объектами, ориентация или даже очень специфические детали пейзажа. Эскизы или другие изображения являются лучшим механизмом для передачи этой информации. Несколько лучших моделей диффузии, таких какДАЛЛ-И,Стабильная диффузия и Изображениевсе они включают механизмы для генерации изображений из скетчеров. Аналогично, эти модели включают такие методы, как in-painting или out-painting, которые позволяют расширять изображения в пределах или за пределами их исходных границ.
Большинство наиболее устоявшихся практик генеративного искусства сосредоточены на создании изображений из других изображений. Неудивительно, что несколько популярных коллекций генеративного искусства NFT основаны на вариациях методов «изображение-изображение».
Музыкальное поколение:Автоматическая генерация музыки — еще один распространенный вариант использования генеративного ИИ, который приобрел известность за последние несколько лет. OpenAI также находится в авангарде этой революции с моделями, включаяMuseNetи, что еще более важно,Музыкальный автомат, который способен генерировать музыку в различных стилях и жанрах. Недавно Google вошел в эту сферу сАудиоLM, модель, которая создает реалистичную речь и фортепианную музыку, просто слушая звуковые фрагменты. Стабильность Поддерживается ИИГармонайначал расширять границы пространства генерации музыки с помощью ИИ с выпускомТанцевальная диффузия, набор алгоритмов и инструментов, позволяющих генерировать оригинальные музыкальные клипы.
Музыка, сгенерированная ИИ, является ONE из крупнейших областей, в которых NFT могут предоставить уникальную ценность. В отличие от других форм искусства, музыка распространяется в цифровой форме. Генеративный ИИ может превратиться в естественное дополнение для музыкальных продюсеров, а NFT предлагают создателям уникальные способы выражения права собственности в музыкальных клипах или песнях.
Завидное сочетание: NFT и генеративное искусство
На протяжении всей истории Технологии было несколько случаев, когда относительно разные тенденции могли влиять друг на друга, чтобы получить невероятную долю рынка. Самый последний пример — революция социальных сетей, мобильных устройств и облаков, в которой каждая из этих тенденций расширила рынок двух других. Генеративный ИИ и NFT начинают демонстрировать схожую динамику. Обе тенденции смогли вывести сложный Технологии рынок в массовую культуру. NFT дополняют генеративный ИИ цифровыми моделями владения и распространения, которые было бы практически невозможно реализовать в противном случае. Аналогично, генеративный ИИ, вероятно, станет ONE из важнейших источников создания NFT.
Note: The views expressed in this column are those of the author and do not necessarily reflect those of CoinDesk, Inc. or its owners and affiliates.
Jesus Rodriguez
Jesus Rodriguez — генеральный директор и соучредитель IntoTheBlock, платформы, ориентированной на обеспечение рыночной аналитики и институциональных решений DeFi для Криптo . Он также является соучредителем и президентом Faktory, генеративной платформы ИИ для бизнес- и потребительских приложений. Jesus также основал The Sequence, ONE из самых популярных в мире Рассылка по ИИ. Помимо своей операционной работы Jesus является приглашенным лектором в Колумбийском университете и Wharton Business School, а также очень активным писателем и докладчиком.
