Compartir este artículo

Anna Kazlauskas: La proprietà dei dati nell'era dell'intelligenza artificiale

La co-fondatrice di Vana sta sviluppando DAO di dati e marketplace decentralizzati per creare un ecosistema di dati di proprietà degli utenti. Terrà il discorso principale all'AI Summit di Consensus il 16 maggio.

Kazlauskas

Nuoti nei dati. Crei nuovi dati ogni giorno. Se la tua app per la salute conta i tuoi passi? Sono dati nuovi. L'anello Oura che traccia i tuoi dati biometrici? Dati preziosi. I tuoi post sui social media, persino le battute stupide che non hanno ricevuto alcun like? Altri dati.

Questi sono tutti dati che le aziende di intelligenza artificiale vorrebbero raccogliere. T si può costruire una buona intelligenza artificiale senza buoni dati, ed è per questo che molti considerano i dati il ​​"nuovo petrolio" nella corsa all'intelligenza artificiale. Il problema, però, è che, sebbene i dati siano preziosi, in teoria, la realtà è che è difficile monetizzare i propri dati personali, poiché non si ha alcun potere decisionale come individui. (L'intelligenza artificiale aperta T bussa alla tua porta per acquistare i tuoi vecchi tweet.)

CONTINÚA MÁS ABAJO
No te pierdas otra historia.Suscríbete al boletín de Crypto Daybook Americas hoy. Ver Todos Los Boletines

EntrareVana"Credo che i dati siano la risorsa fondamentale che alimenta la prossima generazione di intelligenza artificiale e, in realtà, la prossima generazione della nostra economia digitale", afferma Anna Kazlauskas, co-fondatrice di Vana e CEO di Open Data Labs. "Molte persone, francamente, T si rendono conto di essere effettivamente proprietarie dei propri dati".

Ma i tuoi dati sono tuoi. E sono preziosi... se riesci in qualche modo a unire le forze con milioni di altre persone che possiedono i loro dati. Questo ti darebbe potere contrattuale. Ed è questa la missione di Vana: creare un ecosistema per i dati di proprietà degli utenti, che a sua volta alimenta l'intelligenza artificiale di proprietà degli utenti.

Questo ecosistema comprende un mix di Data DAO (un “sindacato” per i dati), mercati di dati decentralizzati, il recentemente lanciatoGettone VRC-20, e un nuovocollaborazionecon Flower Labs per costruire il primo modello fondazionale di proprietà dell'utente al mondo. (Allegato A che l'intelligenza artificiale decentralizzata si sta insinuando nel mainstream: la collaborazione Vana/Flower è stata trattata daCABLATO.)

Kazlauskas terrà un discorso principale allaVertice sull'intelligenza artificiale al Consensus 2025delineando questa visione, e ne offre un assaggio qui. E vede lo slancio cambiare. "Stiamo già iniziando a vedere questo cambiamento, dove più persone si rendono conto che 'I miei dati sono davvero importanti per l'IA' e 'Sono effettivamente il proprietario di questi dati'". Prevede che tra qualche anno oltre 100 milioni di utenti saranno a bordo. Tra 10 anni? "Popolazione mondiale. Oltre 10 miliardi".

L'intervista è stata condensata e leggermente modificata per maggiore chiarezza.

Perché i dati degli utenti sono così importanti per te?

Anna Kazlauskas: La maggior parte delle persone dà per scontato che i dati siano di proprietà delle piattaforme su cui sono archiviati, ma non è così. Allo stesso modo, quando parcheggi la tua auto in un parcheggio, il parcheggio T ne è il proprietario. Puoi sempre riprenderla. Ne hai la piena proprietà.

E oggi si guadagna un'enorme quantità di denaro, soprattutto da grandi aziende tecnologiche, grazie a quei dati, ma i legittimi proprietari sono gli utenti. Quindi penso sia importante ripristinare questa proprietà, sia dal punto di vista dell'utente che da quello dello sviluppatore.

Riesci a collegare i puntini e capire come questo aiuta gli sviluppatori?

Come sviluppatore, soprattutto in un mondo dominato dall'intelligenza artificiale, avere accesso ai dati giusti è fondamentale. Ed è estremamente difficile ottenerlo al momento, perché la maggior parte dei dati è custodita all'interno dei giardini recintati delle grandi aziende tecnologiche. Molti dei miei amici più brillanti che si occupano di intelligenza artificiale vanno a lavorare nei grandi laboratori, perché è lì che si trovano i dati e il computer. Ma T deve essere necessariamente così.

In che modo esattamente i Data DAO si inseriscono in questa visione?

Quindi, un DataDAO è una sorta di sindacato per i dati. In pratica, un ampio gruppo di persone mette in comune i propri dati e può prendere decisioni collettive su cosa farne.

Il motivo per cui questo è importante è che i dati, da soli, non sono poi così utili, giusto? Sono molto più utili quando ce n'è una grande quantità. Quando ce ne sono abbastanza per addestrare un modello di intelligenza artificiale.

Quali sono alcuni dei Data DAO che ti entusiasmano di più?

Ce ne sono alcuni in ambito sanitario davvero interessanti. Ce n'è ONE dei primi che esporta completamente le cartelle cliniche dei pazienti, il che credo possa davvero contribuire a far progredire la ricerca in questo settore. Ce ne sono alcuni relativi alla biometria, al sonno e alla salute. Ce n'è ONE con i laboratori del DLP [Driver Loyalty Program]; stanno acquisendo dati sulle auto. E all'interno del loro dataset, i dati Tesla sono davvero interessanti perché la maggior parte delle persone considera Tesla un'azienda preziosa perché ha un data lead, giusto? In realtà, gli utenti possono accedere a gran parte di quel dataset.

Con la nuova collaborazione con Flower Labs per la creazione di COLLECTIVE-1, state passando dalla teoria alla pratica. Qual è l'obiettivo?

COLLECTIVE-1 è il primo modello di base di proprietà dell'utente. Di solito, quando si pensa a un modello di base, si pensa a ONE che gestisce un'attività di formazione molto ampia in un singolo data center, giusto? Come OpenAI. E il motivo per cui viene tipicamente eseguito in modo centralizzato è perché richiede, in ONE, un'enorme potenza di calcolo e, in secondo luogo, un'enorme quantità di dati.

Flower AI è in un certo senso leader nell'addestramento federato [decentralizzato]. Hanno fatto un ottimo lavoro nello sviluppo di queste fantastiche librerie open source. Hanno lavorato sia sul training che sugli algoritmi. E con Vana, ci concentriamo davvero su quei dati, giusto? Quindi abbiamo praticamente tutti questi dati su cui le persone possono fare training. Poi si dà agli utenti la proprietà finale del modello, che possono decidere cosa il modello può fare. Quindi questo è il primo modello di base del suo genere.

E la teoria è che alla fine, con dati migliori, si può costruire un’intelligenza artificiale che non sia solocompetitivocon i giocatori centrali maMeglio, giusto? Quindi non si tratta solo di ideologia, ma anche di performance.

Esatto, sì, è proprio così. In un contesto decentralizzato, penso che spesso le persone concordino in linea di principio sul fatto che "Sì, dovremmo avere un'IA di proprietà delle persone. Dovremmo avere un'IA decentralizzata". Ma cosa possiamo effettivamente fare meglio in un contesto decentralizzato? I dati sono la risposta. Ogni azienda ha a disposizione solo una piccola parte di un set di dati. Apple ha i suoi dati. Google ha i suoi dati. Ma se si considera l'utente, si possono utilizzare piattaforme diverse e creare set di dati migliori di qualsiasi singola azienda. I dati sono l'ingrediente Secret che fa funzionare tutto.

Lo adoro. Grazie Anna, ci vediamo all'AI Summit di Toronto.

Jeff Wilser ospiterà l'AI Summit al Consensus 2025 ed è l'ospite diL'intelligenza artificiale del popolo: il podcast sull'intelligenza artificiale decentralizzata.


Jeff Wilser

Jeff Wilser is the author of 7 books including Alexander Hamilton's Guide to Life, The Book of Joe: The Life, Wit, and (Sometimes Accidental) Wisdom of Joe Biden, and an Amazon Best Book of the Month in both Non-Fiction and Humor.

Jeff is a freelance journalist and content marketing writer with over 13 years of experience. His work has been published by The New York Times, New York magazine, Fast Company, GQ, Esquire, TIME, Conde Nast Traveler, Glamour, Cosmo, mental_floss, MTV, Los Angeles Times, Chicago Tribune, The Miami Herald, and Comstock's Magazine. He covers a wide range of topics including travel, tech, business, history, dating and relationships, books, culture, blockchain, film, finance, productivity, psychology, and specializes in translating "geek to plain-talk." His TV appearances have ranged from BBC News to the The View.

Jeff also has a strong business background. He began his career as a financial analyst for Intel Corporation, and spent 10 years providing data analysis and customer segmentation insights for a $200 million division of Scholastic Publishing. This makes him a good fit for corporate and business clients. His corporate clients range from Reebok to Kimpton Hotels to AARP.

Jeff is represented by Rob Weisbach Creative Management.

CoinDesk News Image