Da DeepSeek a Doubao: l’offensiva dell’intelligenza artificiale made in China
La competizione per la leadership mondiale oggi si gioca sempre più sul terreno tecnologico. Mentre gli Stati Uniti hanno guadagnato un vantaggio iniziale nell’intelligenza artificiale, lanciandosi per primi in quella che è stata definita una vera e propria “corsa all’oro”, la Cina ha rapidamente colmato il divario con una strategia nazionale lungimirante. Il piano “Made in China 2025” rappresenta l’emblema di questo ambizioso percorso di recupero tecnologico. Attraverso investimenti consistenti e mirati, Pechino sta puntando a diventare una potenza globale nell’innovazione, con un focus particolare sullo sviluppo di modelli di intelligenza artificiale. L’obiettivo è chiaro: posizionarsi come protagonista centrale nella rivoluzione tecnologica globale, con l’intelligenza artificiale che non è più solo una questione di primato tecnologico, ma una vera e propria leva strategica per il futuro geopolitico ed economico delle nazioni.
Tra colossi e nuovi player l’Ai cinese promette faville
Con un panorama in continua evoluzione, nuovi protagonisti cinesi stanno rapidamente conquistando spazio nel settore dell’Ai generativa. Tra le aziende emergenti spiccano nomi come DeepSeek e startup come Moonshot AI (con il suo modello Kimi). Ma nella partita Ai ci sono anche i colossi Alibaba, che nel 2024 ha rilasciato i nuovi modelli Ai open source della serie Qwen 2.5 e ByteDance, la società madre di TikTok. Quest’ultima ha annunciato, giorni fa, il rilascio del suo nuovo modello di Ai generativa di punta, Doubao-1.5-pro. Questo sistema, comparato ai modelli Ai americani, sarebbe capace di offrire prestazioni di alto livello e una notevole efficienza computazionale. Nelle prestazioni, Doubao-1.5-pro ha superato il modello OpenAI o1 nel benchmark AIME, un test che valuta la capacità dei sistemi di ragionamento matematico nel comprendere e risolvere istruzioni complesse. Per quanto riguarda l’efficienza, l’altro aspetto distintivo, l’approccio orientato al risparmio di risorse è significativo. ByteDance si affida a un cluster di server con supporto flessibile per chip di fascia bassa, riducendo significativamente i costi di formazione. Una strategia che consente all’azienda di offrire prestazioni al top a prezzi estremamente competitivi, partendo da 2 yuan per milione di token (ben al di sotto dei 438 yuan di OpenAI).
DeepSeek: il nuovo protagonista dell’AI generativa
Tra i nuovi protagonisti del panorama AI cinese DeepSeek ha rapidamente guadagnato attenzione con il lancio dei suoi promettenti modelli open source, R1 e R1-Zero, entrambi accessibili tramite la piattaforma Hugging Face con una licenza MIT, che ne consente l’uso open source, senza restrizioni commerciali. Un approccio che punta non solo a democratizzare l’accesso all’Ai, ma rappresenta una sfida diretta ai modelli chiusi delle aziende occidentali, con un ecosistema di sviluppo aperto che permette di accelerare progressi e applicazioni.
Oltre ad essere open source, i modelli della startup cinese vantano capacità di ragionamento avanzate, dichiarandosi superiori ai sistemi occidentali in benchmark specifici. Secondo i dati diffusi da DeepSeek, R1, con i suoi 671 miliardi di parametri, ha superato il modello OpenAI o1 in test come AIME (un test di ragionamento matematico), MATH-500 (una raccolta di problemi con le parole) e SWE-bench Verified (uno strumento di valutazione della programmazione). Inoltre, per aumentare la flessibilità d’uso anche con hardware meno potenti, sia in cloud che in locale, DeepSeek ha sviluppato versioni di R1 con un numero di parametri ridotto (da 1,5 a 70 miliardi) e, contestualmente, offrendo la possibilità ai ricercatori di svilupparne altri. Secondo il paper di ricerca pubblicato da DeepSeek questo avviene grazie ad un processo di “distillazione” della capacità di ragionamento di R1. Una modalità per creare modelli di intelligenza artificiale più piccoli che funzionano quasi come quelli grandi, ma consumando meno risorse computazionali. Con questo sistema i ricercatori hanno creato 6 modelli “distillati” che hanno mostrato prestazioni notevoli su diversi benchmark. Per esempio, il piccolissimo DeepSeek-R1-Distill-Qwen-1,5B ha avuto prestazioni migliori nei test AIME e MATH-500 rispetto a GPT-4o.
Un altro punto di forza dirompente, che accomuna molte proposte cinese di modelli Ai, è l’alta efficienza nei costi. DeepSeek offre tramite l’API il suo modello a prezzi del 90-95% inferiori rispetto a o1 di OpenAI. Un approccio che se da una parte punta a democratizzare l’accesso all’Ai generativa, rendendola appetibile e competitiva per piccole imprese e sviluppatori indipendenti che non possono spendere delle fortune, consente anche di conquistare quei mercati emergenti dove le risorse tecnologiche sono limitate.
Fonte: Il Sole 24 Ore