- Повернутися до менюЦіни
- Повернутися до менюдослідження
- Повернутися до менюКонсенсус
- Повернутися до менюСпонсорський матеріал
- Повернутися до меню
- Повернутися до меню
- Повернутися до меню
- Повернутися до менюВебінари та Заходи
Машинне навчання сприяє генеративному мистецтву NFT
Генеративне мистецтво було ONE із квінтесенційних випадків використання машинного навчання, але лише нещодавно цей простір набув мейнстрімної популярності.

Штучний інтелект (AI) у просторі незамінних токенів (NFT) стає все більш актуальним. Генеративне мистецтво (тобто мистецтво, створене автономною системою) швидко стало ONE з основних категорій ринку NFT, стимулюючи інноваційні проекти та дивовижні колекції. Від робіт легенд мистецтва штучного інтелекту, таких як Рефік Анадол або Софія Креспо Новий проект QQL Тайлера Гоббса, NFT стали ONE із основних засобів доступу до мистецтва на основі ШІ.
Генеративне мистецтво було ONE із квінтесенційних випадків використання машинного навчання, але лише нещодавно цей простір набув мейнстрімної популярності. Цей стрибок був здебільшого забезпечений обчислювальними досягненнями та новим поколінням методів, які можуть допомогти моделям Навчання, не вимагаючи великої кількості мічених наборів даних, які неймовірно обмежені та дорогі для створення. Незважаючи на те, що розрив між спільнотою генеративного мистецтва та дослідженнями штучного інтелекту зменшився протягом останніх кількох років, багато нових технік генеративного мистецтва досі T були широко прийняті видатними митцями, оскільки потрібен час, щоб експериментувати з цими новими методами.
Хесус Родрігес є генеральним директором IntoTheBlock.
Каталізатори генеративного мистецтва
Зростання генеративного штучного інтелекту стало несподіванкою навіть для багатьох перших піонерів штучного інтелекту, які здебільшого вважали цю дисципліну відносно невідомою областю машинного навчання. Вражаючий прогрес у генеративному ШІ можна простежити трьома основними факторами:
- Мультимодальний штучний інтелект: за останні п’ять років ми спостерігаємо вибух методів штучного інтелекту, які можуть працювати в різних областях, таких як мова, зображення, відео чи звук. Це дозволило створювати такі моделі, як DALL-E або Stable Diffusion, які створюють зображення або відео з природної мови.
- Попередньо підготовлені мовні моделі: поява мультимодального штучного інтелекту супроводжується значним прогресом у мовних моделях із такими методами, як ГПТ-3. Це дозволило використовувати мову як механізм введення для створення художніх результатів, таких як зображення, звуки чи відео. Мова зіграла першорядну роль у цьому новому етапі генеративного ШІ, оскільки вона знизила бар’єр для взаємодії людей із моделями генеративного ШІ.
- Методи дифузії. Більшість фотореалістичного мистецтва, створеного за допомогою методів штучного інтелекту, яке ми бачимо сьогодні, базується на техніці, яка називається моделями дифузії. До появи дифузійних моделей у просторі генеративного штучного інтелекту домінували такі методи, як генеративні суперницькі мережі (GAN) або варіаційні автокодери (VAE), які мають проблеми з масштабуванням і страждають від відсутності різноманітності генерованих виходів. Дифузійні моделі усувають ці обмеження, дотримуючись нетрадиційного підходу до знищення зображень навчальних даних, доки вони не стануть повним шумом, і їх реконструкції назад. Міркування полягає в тому, що якщо модель здатна реконструювати зображення з чогось, що теоретично є шумом, то вона повинна бути здатна зробити це практично з будь-якого представлення, включаючи інші домени, такі як мова. Не дивно, що методи дифузії стали основою моделей генерації тексту в зображення, таких як DALL-E і Stable Diffusion.
Вплив цих методів у генеративному мистецтві збігся з появою іншої Технології тенденції: NFT, які відкрили неймовірно важливі можливості для цифрового мистецтва, такі як цифрове володіння, програмовані стимули та більш демократичні моделі розподілу.
Дивіться також: Чому виконавцям NFT T варто очікувати «роялті» | Погляди
Методи живлення генеративного мистецтва в NFT
Текст до зображення: Синтез тексту в зображення (TTI) був найпопулярнішим напрямком генеративного ШІ в спільноті NFT. Простір TTI створив деякі моделі ШІ, які буквально виходять за межі поп-культури. OpenAI DALL-E можливо, став найвідомішим прикладом TTI, який використовується для створення художніх образів. КОВЗАННЯ це ще одна модель TTI, створена OpenAI, яка була прийнята в багатьох налаштуваннях генеративного мистецтва. Google пробував простір генеративного мистецтва, експериментуючи з різними підходами, як-от Imagen, яка заснована на моделях дифузії, або Parti, який базується на іншій техніці, яка називається авторегресійними моделями. Мета також розвиває генеративне мистецьке співтовариство за допомогою таких моделей, як Зробіть сцену. Стартапи зі штучним інтелектом також пробиваються в простір TTI з такими моделями, як Середня дорога створення динамічної спільноти завдяки розповсюдженню Discord і Стабільність ШІ шокуючи спільноту ШІ Стабільна дифузія відкритого джерела.
З точки зору NFT, моделі TTI отримали найбільше поширення, оскільки непропорційно великий відсоток предметів колекціонування цифрового мистецтва сьогодні представлено у вигляді статичних зображень.
Перетворення тексту на відео: Перетворення тексту на відео (TTV) є більш складним аспектом генеративного мистецтва, але в ONE ми бачимо значний прогрес. Meta та Google нещодавно опублікували моделі TTV, наприклад Зробіть відео і Imagen Відео, який може створювати відеокліпи з високою точністю кадрів на основі природної мови. Відео є ONE з найактивніших сфер дослідження генеративного мистецтва, і ми повинні очікувати, що більшість моделей генерації зображень матимуть відеоеквіваленти. Відео все ще не так помітно в просторі NFT, як зображення, але це, ймовірно, зміниться, оскільки моделі TTV стануть ширше використовуватися творчими художниками. Відео є ONE зі сфер, яка відрізняє цифрове мистецтво від традиційного.
Читайте також: NFT можуть і будуть набагато більше | Погляди
Зображення до зображення: Створення зображень за допомогою текстових вводів виглядає майже природним, але має обмеження, коли йдеться про захоплення таких аспектів, як положення між різними об’єктами, орієнтація або навіть дуже конкретні деталі пейзажу. Ескізи чи інші зображення є кращим механізмом для передачі цієї інформації. Кілька найкращих дифузійних моделей, наприклад DALL-E, Стабільна дифузія і Imagen усі включають механізми для створення зображень із ескізників. Подібним чином ці моделі включають такі техніки, як зафарбовування або замальовування, які дозволяють розширювати зображення в межах або за їх вихідні межі.
Більшість найкращих практик генеративного мистецтва зосереджуються на створенні зображень з інших зображень. Не дивно, що кілька популярних колекцій генеративного мистецтва NFT засновані на варіаціях методів зображення до зображення.
Генерація музики: Автоматичне створення музики було ще одним поширеним випадком використання генеративного штучного інтелекту, який набув популярності за останні кілька років. OpenAI також був в авангарді цієї революції, включаючи моделі MuseNet і, що більш помітно, музичний автомат, який здатний генерувати музику в різних стилях і жанрах. Нещодавно компанія Google вийшла на ринок AudioLM, модель, яка створює реалістичну мову та фортепіанну музику, просто прослуховуючи звукові фрагменти. Стабільність із підтримкою штучного інтелекту Гармонай з випуском Танцювальна дифузія, набір алгоритмів і інструментів, які можуть генерувати оригінальні музичні кліпи.
Музика, створена штучним інтелектом, є ONE з найбільших сфер, у якій NFT можуть принести унікальну цінність. На відміну від інших форм мистецтва, музика поширюється в цифровій формі. Generative AI може перетворитися на природне доповнення для музичних продюсерів, а NFT пропонують творцям унікальні способи вираження власності на музичні кліпи чи пісні.
Завидна пара: NFT і генеративне мистецтво
За всю історію розвитку Технології було кілька випадків, коли відносно різні тенденції могли впливати одна на одну, щоб отримати неймовірну частку ринку. Останнім прикладом є революція соціально-мобільних хмар, у якій ONE з цих тенденцій розширила ринок двох інших. Генеративний ШІ та NFT починають демонструвати подібну динаміку. Обидві тенденції змогли привести ринок складних Технології до загальної культури. NFT доповнюють генеративний штучний інтелект моделями цифрового володіння та розподілу, які було б майже неможливо реалізувати інакше. Подібним чином генеративний ШІ, ймовірно, стане ONE із найважливіших джерел створення NFT.
Примітка: Погляди, висловлені в цьому стовпці, належать автору і не обов'язково відображають погляди CoinDesk, Inc. або її власників та афіліатів.
Jesus Rodriguez
Хесус Родрігес є генеральним директором і співзасновником IntoTheBlock, платформи , яка зосереджена на забезпеченні ринкової інформації та інституційних рішень DeFi для Крипто . Він також є співзасновником і президентом Faktory, генеративної платформи штучного інтелекту для бізнес-програм і програм для споживачів. Ісус також заснував The Sequence, ONE із найпопулярніших Розсилки ШІ у світі. На додаток до своєї операційної роботи, Ісус є запрошеним лектором у Колумбійському університеті та Wharton Business School, а також є дуже активним письменником і оратором.
