La prossima frontiera dell’intelligenza artificiale generativa? Il video
Scrivi qualche riga e il servizio ti crea un video che corrisponda a quella descrizione (allo script). Immagini e attori (avatar) creati appositamente, in modo artificiale.
Questa è la probabile prossima frontiera dell’IA generativa. Già possibile esplorarla, con centinaia di servizi disponibili.
Prima di analizzare quelli che per la stampa specializzata sono i migliori del momento, bisogna ricordare che sono ancora sistemi in parte immaturi. Prova ne è che i big del settore, Meta e Google, ancora non hanno rilasciato al pubblico i propri, anche se li hanno annunciati. Meta dice che il suo “Make a Video” è ancora da perfezionare; Google teme anche utilizzi distorti del suo Imagen, tali da alimentare la disinformazione.
Questi sistemi di IA generativa sono insomma ancora un passo indietro rispetto a quelli tipo chatbot testuale o creatori di immagini. Utilizzano modelli tecnologici detti “Diffusion” (il più famoso è il creatore di immagini – non video – Dall E di OpenAi, la stessa azienda di Chatgpt), diversi da quelli large language model alla base dell’IA generativa testuale.
Funzionano via cloud quindi su qualsiasi pc.
Un limite che ricorre tra i vari sistemi è il realismo. È ancora possibile riconoscere a occhio nudo che i video sono fatti da una IA (più difficile con immagini statiche, testi e audio). Questi video vanno fatti insomma senza pensare di ingannare la propria audience; non sono un reale sostituito di video vecchio stampo. Il vantaggio di contro è la possibilità di risparmiare molto tempo e soldi e non richiedere competenze tecniche né di programmazione né di tipo audio-video. Un’applicazione tipica sarebbe per fare presentazioni aziendali o a convegni; bozze di progetti di marketing o video per i social eccetera. Bisogna anche tenere conto che i diversi sistemi hanno un set limitato di immagini e avatar utilizzabili (per forza di cose) e di lingue, tra cui non sempre c’è l’italiano. Infine, le funzioni più avanzate sono a pagamento, ma c’è di buono che quasi tutti hanno ampi piani di prova gratuita (a 30 giorni). Teniamo poi conto che se non ci soddisfa nessuno di questi servizi, possiamo provare a migliorare la nostra abilità di prompting. Se continuiamo a trovarli troppo limitati, aspettiamo qualche mese: la tecnologia continua a migliorare.
Pictory
Uno degli aspetti migliori di questo strumento è che davvero non richiede alcuna esperienza nel montaggio o nella progettazione di video. Si inizia fornendo uno script o un articolo, che servirà come base per il contenuto del video. Pictory consente anche di modificare facilmente i video utilizzando il testo, ad esempio per modificare webinar, podcast, registrazioni Zoom.Permette anche di creare video di presentazione condivisibili, utili per chi vuole creare trailer o condividere brevi clip sui social media. È anche possibile inserire automaticamente le didascalie nei video e riassumere automaticamente i video lunghi.
Synthesia
Un altro noto generatore di video AI è Synthesia, una piattaforma di generazione di video AI che consente di creare rapidamente video con avatar AI. La piattaforma include oltre 60 lingue e vari modelli, un registratore di schermo, una libreria multimediale e molto altro. Synthesia è utilizzata da alcuni dei più grandi nomi del mondo come Google, Nike, Reuters e BBC. È un prodotto più articolato e complesso degli altri, quindi da scegliere per prodotti più professionali. Oltre agli avatar preimpostati, possiamo anche crearne nostri. La piattaforma di generazione della voce dell’intelligenza artificiale consente di ottenere facilmente voci fuori campo professionali, che possono essere pure modificate. È possibile caricare risorse col proprio marchio e ottenere modelli personalizzati.
Deepbrain AI
Lo strumento Deepbrain AI offre la possibilità di creare facilmente video generati dall’intelligenza artificiale utilizzando un testo di base in modo semplice e rapido. È sufficiente preparare il testo e utilizzare la funzione Text-to-Speech per ottenere il primo video AI in cinque minuti o meno.Tra tutti, è uno degli strumenti più intuitivi, progettato per essere super facile da usare per i principianti.
Fonte: Il Sole 24 Ore