Whisk, la novità di Google che mixa immagini con l’intelligenza artificiale
Lanciata negli Stati Uniti da alcuni giorni, questa novità non richiede la digitazione di lunghi e complessi comandi di testo ma consente di lanciare prompt fornendo delle immagini: è sufficiente trascinarle nei box dedicati per iniziare la creazione. Whisk, infatti, permette di inserire un’immagine per definire il soggetto principale, un’altra per la scena o il contesto e un’ultima per stabilire lo stile.
“Dietro le quinte il modello Gemini scrive automaticamente una didascalia dettagliata delle vostre immagini. Quindi inserisce quelle descrizioni nell’ultimo modello di generazione di immagini di Google, Imagen 3. Questo processo cattura l’essenza del soggetto, non una replica esatta. In questo modo, potete facilmente remixare i vostri soggetti, scene e stili in modi nuovi” spiega Iljic nel blogpost e continua “Nei nostri primi test con artisti e creativi, in molti hanno descritto Whisk come un nuovo tipo di strumento creativo, non un editor di immagini tradizionale. Lo abbiamo creato per un’esplorazione visiva rapida, non per modifiche pixel perfect. Si tratta di esplorare idee in modi nuovi e creativi, consentendovi di lavorare su decine di opzioni e scaricare quelle che amate”.
Fonte: Il Sole 24 Ore