Entro dicembre il nuovo Gpt: ecco cosa sappiamo e cosa no

Altman ha dichiarato che GPT-5 mira a correggere molti di questi problemi, come commettere meno errori di base che nemmeno un bambino farebbe. Il ragionamento è uno dei principali punti deboli di un’IA generativa al momento. OpenAI se ne è occupato soprattutto con l’ultima versione, la o1, pensata per affrontare problemi scientifici e matematici. Il modello, a differenza degli altri, è progettato per riflettere molto sulla domanda prima di formulare una risposta; migliora così la qualità dell’output ma aumenta al tempo stesso il dispendio computazionale. È infatti più costoso da usare.

“Forse le aree di progresso più importanti riguarderanno la capacità di ragionamento”, ha detto Altman a Bill Gates in una recente intervista, riferendosi a GPT-5. “Al momento, GPT-4 può ragionare solo in modi estremamente limitati”.

Cosa non sappiamo sul nuovo modello

Ciò che non sappiamo sono molte cose. Come OpenAI intende ottenere questi progressi, ad esempio. Finora molto è stato ottenuto in questo campo aumentando la quantità di dati e l’impegno computazionale, soprattutto. I dati disponibili per addestrare i modelli sono però prossimi a finire. Di qui la necessità di usare anche dati sintetici, che però hanno noti limiti rispetto a quelli creati da umani.

È possibile che OpenAI stia seguendo approcci diversi al training con i dati. Ad esempio, la comunità scientifica guarda con interesse all’uso di video o dati real-world multimediali-multimodali per migliorare la capacità dei modelli di creare un modello del mondo. Qualcosa che anche un bambino possiede e di cui l’IA manca, come detto (tra gli altri) da Dario Amodei, fondatore di Anthropic e da Yann Lecun, il capo dell’AI di Meta.

Secondo LeCun, la vera intelligenza, come quella umana, richiede una comprensione incarnata del mondo e la capacità di ragionare e pianificare pensieri e azioni usando questa comprensione. Laddove invece Gpt e modelli analoghi si limitano a generare testo o dati un pezzo dopo l’altro, con un modello statistico basato sulle probabilità, senza un collegamento con il mondo reale.

Fonte: Il Sole 24 Ore