«Pronto, sono Crosetto»: così funzionava l’inganno ai vip grazie all’intelligenza artificiale

«Pronto, sono Crosetto»: così funzionava l’inganno ai vip grazie all’intelligenza artificiale

«Pronto sono il generale Montalbano, chiamo da parte del ministro Crosetto» o «Pronto sono Guido Crosetto, ciao come va, ti devo chiedere una cosa importante». Potrebbero essere iniziate così le telefonate dei truffatori che hanno fatto sparire in paradisi fiscali circa un milione di euro mettendo nel mirino imprenditori e vip della finanza e dell’economia italiana. La chiave di accesso è stata la voce perfettamente riprodotta dall’intelligenza artificiale del ministro della Difesa Guido Crosetto che ha consentito alla nuova banda degli onesti 4.0 di convincere grandi imprenditori a effettuare versamenti al fine di contribuire a liberare giornalisti presi in ostaggio in Paesi stranieri.

L’innesco utilizzato sarebbe stato quello della giornalista Cecilia Sala recentemente trattenuta in Iran. Il denaro da versare con urgenza sarebbe poi stato restituito dalla Banca d’Italia. I truffatori dopo aver bersagliato le segreterie degli imprenditori presentandosi come generali o come membri dello staff del ministro della Difesa hanno fatto ricorso all’intelligenza artificiale per far parlare con i loro interlocutori direttamente il finto ministro della Difesa.

I tentativi sono stati tanti e non tutti sono andati a buon fine grazie soprattutto al filtro degli staff che accompagnano gli imprenditori finiti come bersagli principali della truffa. Ma senza filtri adeguati cadere nella trappola non è poi così difficile. Come ha sottolineato in una intervista a Repubblica, Massimo Moratti, «Questi sono bravi, nel senso che sembrava assolutamente tutto vero. Comunque può capitare, poi certo uno non se l’aspetta una roba di questo genere. Ma succede a tutti…».

La chiave di accesso

In questa truffa la chiave di accesso è stata soprattutto la voce del ministro riprodotta dall’intelligenza artificiale. Sono sufficienti 10 secondi e forse anche meno per riprodurre perfettamente una voce. Una novità con cui bisognerà confrontarsi e che poggia sul voice cloning. Per riprodurre perfettamente una voce si parte dalle registrazioni che vengono elaborate per creare un modello in grado di riprodurre quella voce in modo realistico, anche con nuove frasi. Queste tecnologie sono sempre più avanzate e possono catturare le intonazioni, le emozioni e le sfumature della voce umana, rendendo l’esperienza di ascolto molto naturale. Sarà sufficiente raccogliere un campione di registrazioni vocali della persona di cui si vuole clonare la voce. Queste registrazioni devono essere di alta qualità. Poi vengono poi analizzate per estrarre caratteristiche vocali uniche, come il tono, il ritmo, l’intonazione e le emozioni. Questo passaggio è fondamentale per garantire che la voce clonata suoni il più naturale possibile.

L’addestramento della voce IA

Utilizzando tecniche di machine learning, in particolare reti neurali, il sistema viene addestrato sulle caratteristiche vocali richieste. Durante questo processo, il modello impara a riconoscere e riprodurre le peculiarità della voce originale. Una volta addestrato, il modello può essere utilizzato per generare nuova voce. Basta fornire del testo, e il sistema lo convertirà in parlato utilizzando la voce clonata. Questo può includere anche variazioni nel tono e nell’emozione, a seconda delle impostazioni. Ovviamente il voice cloning è stato ideato non per truffare poveri o ricchi malcapitati ma per applicazioni specifiche come assistenti virtuali o per riprodurre film e videogiochi.

Fonte: Il Sole 24 Ore