Ecco Veo, Google “regala” la Gen AI per i video ai suoi clienti cloud
Lo si potrebbe definire un’altra tappa importante nel cammino intrapreso da Google nel mondo dell’intelligenza artificiale generativa, e questa volta interessa da vicino la clientela di classe entreprise del colosso di Mountain View. Oggi la società californiana ha infatti annunciato che Veo, il Large Language Model proprietario sviluppato dagli ingegneri di DeepMind che permette di generare video a partire da testo o immagini, sarà disponibile in anteprima privata per i clienti di Google Cloud tramite la piattaforma di apprendimento automatico Vertex AI. Il senso di questo annuncio? Intanto il fatto che BigG può fregiarsi del titolo (platonico se vogliamo) di primo hyperscaler a offrire funzionalità image-to-video. In secondo luogo, grazie all’entrata in gioco di Veo non è certo irrilevante l’espansione (a beneficio delle grandi aziende soprattutto) del portafoglio di modelli proprietari, 160 quelli già disponibili da terze parti e open source, catalogati nel Model Garden di Vertex AI
Che cos’è e cosa fa Veo?
Presentato in occasione dell’ultima edizione di I/O, a maggio di quest’anno, Veo è il modello di generazione video che nasce in pancia a Google DeepMind e sfrutta avanzate capacità di comprensione del linguaggio naturale e della semantica visiva, per creare filmati realistici che rispondono fedelmente alle indicazioni fornite dall’utente rispetto alla sua visione creativa. In altre parole, il modello può generare un video con un’immagine come input insieme alla richiesta di testo che segue lo stile dell’immagine stessa e le istruzioni testuali. Con il suo rilascio su Vertex AI, diventa disponibile pubblicamente sulla piattaforma anche Imagen 3, il modello text-to-image di Google che promette maggiore fedeltà e meno artefatti visivi rispetto ai modelli precedenti. Imagen 3 è per l’uso in dal 3 dicembre.
Le possibili applicazioni
Nel post di annuncio è stato spiegato in modo abbastanza dettagliato come i clienti di Google Cloud possono d’ora in avanti utilizzare i due modelli su Vertex AI, descrivendo alcuni casi d’uso. Chi si occupa di inserzioni pubblicitarie, per esempio, potrà più agevolmente generare immagini e video di un prodotto o di un oggetto specifico in un ambiente diverso, conservandone la forma e le caratteristiche. Per i retailer, invece, sarà più semplice creare una clip video che mostra un capo di abbigliamento, un indumento o un accessorio specifico su una persona, semplicemente partendo da un’immagine di tale articolo. Chi lavora in area marketing, ancora, potrà ricorrere a Veo (e a Imagen 3) per creare risorse per blog, eventi e altri contenuti di comunicazione da utilizzare sui social media e su altri canali online. Il tutto in estrema sicurezza, assicurano da Google, grazie alla presenza di strumenti come SynthID (una sorta di filigrana digitale integrata in ogni immagine e fotogramma prodotto dai due modelli) e di filtri di sicurezza pensati per evitare la creazione di contenuti dannosi. In tema di governance dei dati, inoltre, la società ha voluto ribadire un concetto: per addestrare gli LLM i dati dei clienti vengono elaborati solo in base alle loro istruzioni e non utilizzati senza autorizzazione.
Chi sta già usando i modelli LLM di BigG
Se le aziende italiane sono ancora alla fase di sperimentazione della Gen AI, Oltreoceano vi sono aziende come Mondelez International (multinazionale Usa attiva nel settore alimentare con i marchi Chips Ahoy!, Cadbury e Oreo) o Quora (community nata nel 2009 proprio a Mountain View) che già utilizzano i modelli di grande formato di Google per creare video partendo da prompt di testo o immagini. La prima, in particolare, ha beneficiato delle funzionalità di Imagen 3 per modificare drasticamente il processo di produzione di contenuti, realizzando centinaia di migliaia di asset personalizzati e riducendo in modo significativo il time-to-market e i costi. Ora, con Veo, Mondelez e le agenzie di marketing partner vuole estendere queste capacità ai contenuti video. In modo simile, Quora impiegherà il nuovo modello per facilitare (tramite la piattaforma Poe) la condivisione di idee a milioni di utenti attraverso video generativi di alta qualità. Altre referenze di peso che Google mette sul tavolo sono inoltre Puma, Warner Bros e Mercedes. La prima sta utilizzando IImagen 2 su Vertex AI per creare immagini di prodotto dinamiche e personalizzate che migliorano i tassi di clic e accelerano il time-to-market delle campagne digitali del marchio a livello globale. La seconda ha incorporato nella soluzione di sottotitolazione di Discovery un flusso di lavoro che utilizza la piattaforma di Google Cloud per ottimizzare le didascalie con l’ausilio della supervisione umana. La casa automobilistica tedesca, infine, sta sfruttando gli strumenti di Gen AI, tra cui Vertex AI e i modelli Gemini, per rendere le sue campagne di marketing su scala internazionale più personalizzate e rilevanti.
Fonte: Il Sole 24 Ore