Evo 2 è l’intelligenza artificiale più potente mai creata per la biologia

Evo 2 è l’intelligenza artificiale più potente mai creata per la biologia

Un modello di intelligenza artificiale addestrato su un’enorme quantità di dati genomici segna un passo avanti nella progettazione di nuovi genomi. Oggi gli scienziati hanno annunciato il rilascio del più grande modello di intelligenza artificiale mai sviluppato per la biologia.

Battezzato Evo 2, questo modello è stato addestrato su 128.000 genomi provenienti da tutto l’albero della vita, dagli esseri umani ai batteri unicellulari.. È in grado di scrivere interi cromosomi e piccoli genomi da zero, oltre a decifrare il Dna esistente, compresi quei tratti non codificanti spesso associati a malattie ma difficili da interpretare.

Si tratta di un modello senza precedenti per la biologia. Evo 2 è stato addestrato su oltre 9,3 trilioni di nucleotidi estratti da 128.000 genomi. Questa mole di dati lo pone alla pari, in termini di scala, con i più potenti modelli generativi di linguaggio. Il suo obiettivo è quello di riconoscere schemi genetici che richiederebbero anni di ricerca sperimentale, identificare mutazioni legate a malattie e persino progettare nuovi genomi, lunghi quanto quelli di batteri semplici.

Negli ultimi anni, la ricerca ha prodotto modelli di intelligenza artificiale sempre più avanzati per la biologia. Evo 2 fa un passo in più: il suo addestramento non si limita alle sequenze codificanti (quelle che forniscono istruzioni per la sintesi delle proteine), ma comprende anche il DNA non codificante, che regola l’attività genica.

Per rendere Evo 2 accessibile alla comunità scientifica, l’Arc Institute ha sviluppato Evo Designer, un’interfaccia user-friendly che permette di esplorare le sue potenzialità. Inoltre, il codice sorgente del modello è open source, disponibile su GitHub e integrato nel framework Nvidia BioNeMo, accelerando così la ricerca in ambito genetico.

Fonte: Il Sole 24 Ore