Meta AI genera video da un testo: nasce Make-a-video
L’ultima frontiera dell’intelligenza artificiale era stata generare un’immagine come risposta ad un testo, con generatori di immagini AI come DALL-E 2 e Stable Diffusion. Ora i ricercatori Meta AI stanno portando questa tecnologia a fare un ulteriore passo avanti: la nuova intelligenza artificiale di Meta AI inventa video da un messaggio di testo. Il progetto si chiama Make-a-video ed è già destinato a far parlare di sé.
Vediamo più da vicino di cosa si tratta. Meta ha lanciato un nuovo tipo di intelligenza artificiale che genera arte. Questa tecnologia è in grado di creare video da messaggi di testo, con risultati inquietanti, surreali e impressionanti. La società di Mark Zuckerberg non ha annunciato quando il sistema potrebbe diventare disponibile al pubblico o se ci saranno delle restrizioni. Esiste però un modulo di iscrizione che le persone possono compilare se vogliono testare Make-A-Video in futuro.
Meta AI presenta Make-a-video
Il CEO di Meta Mark Zuckerberg ha pubblicato giovedì su Facebook un post che parla della ricerca Make-A-Video. Ha presentato una clip di 20 secondi che raccoglieva diversi suggerimenti di testo utilizzati dai ricercatori Meta e i brevi video che ne sono risultati. I suggerimenti hanno incluso “Un orsacchiotto che dipinge un autoritratto”, “Un’astronave che atterra su Marte”, “Un cucciolo di bradipo con un cappello lavorato a maglia che cerca di capire un laptop” e “Un robot che cavalca un’onda nell’oceano”.
I video per ogni prompt durano solo pochi secondi e generalmente mostrano ciò che il prompt suggerisce. Il tutto in una risoluzione abbastanza bassa e a scatti.
La pagina web di Make-A-Video include questi brevi clip e altri. Alcuni sembrano abbastanza realistici, come un video creato in risposta al messaggio “Pesce pagliaccio che nuota attraverso la barriera corallina” o uno volto a mostrare “Una giovane coppia che cammina sotto una pioggia battente”.
In un suo post su Facebook, Zuckerberg ha sottolineato quanto sia complicato generare un’immagine in movimento da una manciata di parole. “È molto più difficile generare video rispetto alle foto perché oltre a generare correttamente ogni pixel, il sistema deve anche prevedere come cambieranno nel tempo”, ha scritto.
Un documento di ricerca che descrive il lavoro spiega che il progetto Make-a-video di Meta utilizza un modello di intelligenza artificiale da testo a immagine per capire come le parole corrispondano alle immagini. Il sistema usa anche una tecnica di intelligenza artificiale nota come apprendimento non supervisionato. In esso gli algoritmi esaminano dati che non sono etichettati per discernere pattern al suo interno. Il tutto è impiegato per determinare l’aspetto del movimento realistico.
Uso e distorsioni di Make-a-video
Come accade con i sistemi di intelligenza artificiale popolari che generano immagini dal testo, i ricercatori hanno rivelato che il loro modello di IA da testo a immagine è stato addestrato su dati Internet. Questo significa che il sistema ha appreso “e probabilmente esagerato pregiudizi sociali, compresi quelli dannosi”. I dati sarebbero stati filtrati per “contenuti NSFW e parole tossiche”. Ma poiché i set di dati possono includere molti milioni di immagini e testo, potrebbe non essere possibile rimuovere tutti i contenuti nocivi.
L’annuncio di Meta AI dimostra una nuova direzione che la ricerca sull’IA sta prendendo mentre i sistemi diventano sempre più bravi a generare immagini dalle parole. Se la tecnologia sarà infine rilasciata ampiamente, tuttavia, solleverà molte delle stesse preoccupazioni suscitate dai sistemi di conversione da testo a immagine. I progressi nell’uso di IA per creare video on demand pongono ogni sorta di dilemmi etici. Per non parlare della possibilità di incrementare deepfake e disinformazione.
Meta ha comunque precisato che tutti i contenuti generati dal nuovo sistema contengono una filigrana. Serve ad “aiutare gli spettatori a sapere che il video è stato generato con l’intelligenza artificiale e non è un video acquisito”. “Il nostro obiettivo è rendere finalmente disponibile questa tecnologia al pubblico, ma per ora continueremo ad analizzare, testare e provare Make-A-Video per garantire che ogni fase del rilascio sia sicura e intenzionale”.
Intelligenza artificiale Make-a-video di Meta AI: prospettive future
“Meta AI si impegna a sviluppare un’intelligenza artificiale responsabile e garantire l’uso sicuro di questa tecnologia video all’avanguardia”, ha scritto la società. “La nostra ricerca adotta i seguenti passaggi per ridurre la creazione di contenuti dannosi, distorti o fuorvianti”.
“Sotto tutti gli aspetti, risoluzione spaziale e temporale, fedeltà al testo e qualità, Make-A-Video definisce il nuovo stato dell’arte nella generazione da testo a video, come determinato da misure sia qualitative che quantitative”. Sono queste le parole usate dai ricercatori in un documento che spiega il sistema.
Ma quali sono le prospettive di Make-A-Video di Meta AI? I precedenti sistemi di intelligenza artificiale che generano immagini fisse dal testo hanno prodotto strani risultati. Ad esempio Craiyon AI, un popolare sistema di conversione da testo a immagine diverso da Meta, ha creato diverse immagini che rappresentano come potrebbero apparire le persone se tutti gli umani si unissero al metaverso. Ogni persona è illustrata con un visore per realtà aumentata unito al proprio viso. Quelle immagini sono apparse per la prima volta quando The US Sun ha posto all’IA queste domande sugli umani nel metaverso.
Le immagini arrivano dopo che una diversa IA che funziona allo stesso modo ha prodotto immagini bizzarre di quello che è stato chiamato “l’ultimo selfie mai scattato”. In quel caso si mostravano scene apocalittiche di persone di fronte a esplosioni nucleari, con carne in decomposizione e devastazione alle spalle.
Diverse aziende tecnologiche, tra cui Meta, investono decine di miliardi di dollari per creare mondi virtuali in cui le persone potranno fare acquisti, lavorare e divertirsi. E nonostante le critiche al metaverso di Zuckerberg, sistemi come Make-A-Video presto saranno più evoluti ed entreranno a far parte dei nuovi mondi inaugurati dal metaverso.
Per il momento, Zuckerberg ha scritto che Meta prevede di condividere il progetto Make-A-Video come demo.