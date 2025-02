DeepSeek, startup cinese relativamente sconosciuta fino a poco tempo fa, ha fatto parlare di sé nel mondo dell’intelligenza artificiale, sfidando i giganti tecnologici occidentali con il suo modello di linguaggio avanzato.

Il 27 gennaio 2025 è avvenuto uno sconvolgimento nel settore tecnologico delle borse europee e americane dopo il lancio del nuovo chatbot di intelligenza artificiale, che gli sviluppatori affermano possa competere con OpenAI e Google, rimanendo però completamente open source e gratuito per gli utenti e riducendo significativamente i costi. I titoli nel settore tecnologico hanno subito un calo in Europa. Nel premercato statunitense, il Nasdaq ha registrato una perdita di quasi 4 punti percentuali, mentre Nvidia ha visto un calo di circa il 12%.

Era ancora forte l’eco del crollo dei titoli tech nelle Borse quando, il 30 gennaio 2025, Deepseek è stato bloccato in Italia dal Garante per la protezione dei dati personali dopo la richiesta formale di informazioni inviata il giorno precedente. Il Garante ha imposto, con effetto immediato e in via d’urgenza, la limitazione del trattamento dei dati degli utenti italiani nei confronti delle società cinesi Hangzhou DeepSeek Artificial Intelligence e Beijing DeepSeek Artificial Intelligence, responsabili del servizio di chatbot DeepSeek. Il provvedimento è stato adottato “a tutela dei dati degli utenti italiani”. Già dal 29 gennaio l’applicazione di DeepSeek non risultava più scaricabile dagli store digitali del nostro Paese, senza alcuna spiegazione ufficiale. Vedremo gli ulteriori sviluppi in futuro.

Futuro che non sembra esente da difficoltà: le normative sulla censura in Cina limitano i suoi modelli nel trattare argomenti politicamente sensibili, ostacolandone così l’espansione nei mercati internazionali.

Come è nata e cosa fa Deepseek

La società innovativa è stata fondata nel 2023 da Liang Wenfeng e supportata dall’hedge fund High-Flyer di Hangzhou. Il suo fiore all’occhiello è il modello DeepSeek-R1, lanciato all’inizio del 2025, che ha già fatto parlare di sé grazie alla sua abilità nel risolvere problemi complessi, come il ragionamento matematico e la generazione di codice. Questo è possibile grazie all’uso di tecniche di apprendimento avanzato che permettono al modello di “ragionare” in modo autonomo.

Come funziona il modello DeepSeek-R1

Presentato il 20 gennaio 2024, ha dimostrato prestazioni paragonabili, se non superiori, a quelle dei modelli di punta di aziende come OpenAI e Google DeepMind, attirando l’attenzione di esperti del settore come Marc Andreessen, che lo ha definito “una delle più sorprendenti e impressionanti innovazioni mai viste”.

Ciò che rende particolarmente notevole il successo di DeepSeek è il contesto in cui è stato sviluppato: nonostante le restrizioni imposte dagli Stati Uniti sull’esportazione di chip avanzati verso la Cina, l’azienda è riuscita a sviluppare un modello di alto livello utilizzando risorse hardware limitate.

Secondo quanto riportato da The New York Times, gli ingegneri di DeepSeek hanno dichiarato di aver utilizzato solo 2.000 chip Nvidia per l’addestramento del loro modello, in netto contrasto con i 16.000 o più chip generalmente considerati necessari dai concorrenti statunitensi per sviluppare modelli di pari complessità. Questo risultato non solo dimostra l’ingegnosità degli sviluppatori di DeepSeek, ma solleva anche interrogativi sulla reale efficacia delle restrizioni tecnologiche imposte dagli Stati Uniti nei confronti della Cina nel campo dell’IA.

La “lean production” dietro il successo della startup cinese

Il successo di DeepSeek è il risultato di un approccio innovativo e frugale allo sviluppo dell’intelligenza artificiale, che ricorda per certi versi la rivoluzione della “lean production” introdotta da Toyota negli anni ’80 e ’90. Liang Wenfeng ha adottato una strategia basata sull’ottimizzazione delle risorse e sull’innovazione tecnica per superare le limitazioni imposte dalle restrizioni statunitensi.

L’azienda ha concentrato i suoi sforzi su tecniche avanzate come la Multi-head Latent Attention (MLA) e la Mixture of Experts (MoE), che permettono di migliorare l’efficienza dei modelli riducendo al contempo i requisiti hardware.

Secondo quanto riportato da EpochAI, il modello DeepSeek-V3 è stato addestrato utilizzando solo 2,78 milioni di ore GPU, rispetto ai 30,8 milioni richiesti da modelli simili come Llama 3. Questa drastica riduzione è stata possibile grazie all’impiego di tecnologie come il FP8 (floating point 8), che migliorano l’efficienza del calcolo. Inoltre, DeepSeek ha fatto un uso innovativo dei chip Nvidia H800, progettati specificamente per il mercato cinese e meno avanzati rispetto agli H100, ma ottimizzati per ottenere prestazioni elevate a costi inferiori.

Un altro aspetto chiave della strategia di DeepSeek è stato il focus sui giovani talenti: invece di cercare tecnici esperti, l’azienda ha reclutato principalmente neolaureati e dottorandi provenienti dalle migliori università cinesi, creando un ambiente di lavoro collaborativo e orientato alla ricerca. Questa combinazione di innovazione tecnica, ottimizzazione delle risorse e valorizzazione dei giovani talenti ha permesso a DeepSeek di sviluppare un modello di IA all’avanguardia con un investimento stimato di soli 5,6 milioni di dollari, una frazione del costo dichiarato da aziende come Anthropic per progetti simili.

Quanto è popolare DeepSeek e in quale misura è limitata dalla censura cinese?

“La popolarità di DeepSeek è esplosa” scrive Filippo Diodovich, Senior Market Strategist, IG Italia. “La sua app ha conquistato gli utenti globali, diventando l’app gratuita più scaricata sull’App Store in Cina e negli Stati Uniti, sorpassando persino ChatGPT. Tuttavia, il suo sviluppo non è privo di sfide. Le rigide leggi sulla censura in Cina limitano i suoi modelli dall’affrontare temi politicamente delicati (ad esempio l’indipendenza di Taiwan), ostacolando una piena diffusione nei mercati internazionali dove la libertà di espressione è cruciale. In poche parole, DeepSeek sta emergendo come una forza innovativa nel panorama dell’intelligenza artificiale, pronta a sfidare i giganti occidentali, ma con il peso delle regolamentazioni cinesi sulle spalle”.

Cosa succederà nel mondo, cosa succederà nella tecnologia

L’ascesa di DeepSeek nell’intelligenza artificiale ha importanti implicazioni geopolitiche e tecnologiche.

Dal punto di vista geopolitico, il successo dell’azienda cinese sfida le restrizioni tecnologiche statunitensi, dimostrando che l‘innovazione può prosperare anche con risorse limitate. Questo mette in discussione l’efficacia delle politiche USA e solleva interrogativi sulla competizione tecnologica futura tra USA e Cina, con impatti sulle politiche di esportazione e cooperazione internazionale.

Dal punto di vista tecnologico, l’approccio di DeepSeek, focalizzato sull’efficienza e l’ottimizzazione delle risorse, potrebbe influenzare le strategie globali di sviluppo dell’IA. Il successo di modelli cinesi economici rappresenta una minaccia per la leadership tecnologica americana. Inoltre, l’approccio open source di DeepSeek potrebbe accelerare la diffusione della conoscenza nel campo dell’IA, democratizzando l’accesso e riducendo il divario tra grandi aziende e startup, con potenziali ripercussioni sugli equilibri di potere e l’innovazione globale.

Deepseek: la scommessa sull’open source

Il successo di DeepSeek ha riaperto il dibattito sulla contrapposizione tra modelli di intelligenza artificiale proprietari e open source. Mentre società come OpenAI e Google scelgono un approccio chiuso e brevettato, DeepSeek punta sull’open source, rendendo i propri algoritmi accessibili e favorendo l’innovazione collaborativa. Questo solleva dubbi sull’efficacia dei modelli di business tradizionali nell’IA. Yann LeCun di Meta evidenzia che la vera sfida è tra modelli open source e proprietari, sottolineando come DeepSeek e altri benefici dell’open source possano accelerare l’innovazione. L’approccio aperto potrebbe democratizzare l’IA, rendendola accessibile a molti sviluppatori, ma solleva interrogativi sulla sostenibilità economica e la protezione della proprietà intellettuale. L’impatto di questi modelli sull’industria dell’IA resta da vedere, specialmente in termini di monetizzazione e strategie aziendali.

(Articolo originariamente pubblicato il 27 gennaio 2025 e aggiornato al 31/01/2025)