L’intensificarsi della competizione tra Stati Uniti e Cina nel campo dell’intelligenza artificiale ha portato a un acceso dibattito sulle politiche di controllo delle esportazioni di chip avanzati. Recentemente, DeepSeek, un’azienda cinese di AI, ha dimostrato di poter sviluppare modelli all’avanguardia a costi inferiori rispetto a quelli statunitensi. Ma questo significa che i controlli sulle esportazioni hanno fallito? Secondo Dario Amodei, CEO di Anthropic, la risposta è no. Anzi, la sua analisi suggerisce che le recenti evoluzioni rendono ancora più cruciale il mantenimento e il rafforzamento delle restrizioni sulle esportazioni di semiconduttori verso la Cina.
Le Dinamiche Fondamentali dello Sviluppo dell’AI
Per comprendere perché i controlli sulle esportazioni restano fondamentali, bisogna analizzare tre dinamiche chiave che guidano il progresso dell’intelligenza artificiale:
Le Leggi di Scalabilità
La ricerca ha dimostrato che l’aumento delle risorse di calcolo destinate all’addestramento di un modello porta a un miglioramento graduale e prevedibile delle sue capacità. Se un modello addestrato con un milione di dollari può risolvere il 20% di un insieme di compiti, uno da dieci milioni può risolverne il 40%, e così via. Questo principio spiega perché le aziende investono cifre sempre maggiori nell’addestramento di modelli sempre più potenti.
L’Innovazione Tecnologica e l’Efficienza
Ogni anno, nuove scoperte rendono l’addestramento dei modelli più efficiente. Che si tratti di miglioramenti nell’architettura delle reti neurali o di progressi nell’uso delle risorse hardware, queste innovazioni spostano la curva di scalabilità, riducendo i costi per raggiungere un determinato livello di prestazioni. Tuttavia, invece di limitare la spesa, questa efficienza viene reinvestita per sviluppare modelli ancora più avanzati, accelerando così il progresso complessivo.
Il Cambio di Paradigma
Nel 2024, l’uso del reinforcement learning per affinare il ragionamento dei modelli AI è diventato una nuova frontiera di ricerca. Aziende come Anthropic, DeepSeek e OpenAI stanno investendo in questa tecnica, che migliora le capacità logiche e di problem-solving delle reti neurali. Essendo ancora in una fase iniziale della sua curva di scalabilità, anche investimenti relativamente modesti in questa area possono portare a miglioramenti significativi.
DeepSeek: Innovazione o Semplice Evoluzione del Settore?
DeepSeek ha recentemente attirato l’attenzione del settore con il lancio di due modelli: DeepSeek-V3 e DeepSeek-R1. Il primo, una rete pre-addestrata, ha dimostrato di avvicinarsi alle prestazioni dei modelli statunitensi di punta, ma con un costo significativamente inferiore. Il secondo, invece, ha aggiunto un livello di addestramento tramite reinforcement learning, simile a quello utilizzato da OpenAI per il modello o1-preview.
Alcune analisi hanno suggerito che DeepSeek sia riuscita a ottenere risultati straordinari con un budget di soli 6 milioni di dollari, mentre le aziende americane avrebbero speso miliardi per modelli comparabili. Tuttavia, Amodei contesta questa narrativa, sottolineando alcuni punti chiave:
Il confronto è fuorviante: Claude 3.5 Sonnet, un modello di fascia media di Anthropic, è stato addestrato con decine di milioni di dollari, non miliardi. Inoltre, DeepSeek-V3 è stato addestrato circa 9-12 mesi dopo Claude 3.5 Sonnet, quindi il suo vantaggio in termini di costo è in linea con la naturale tendenza di riduzione dei prezzi nell’industria dell’AI.
L’innovazione di DeepSeek è più ingegneristica che rivoluzionaria: Le principali ottimizzazioni di DeepSeek riguardano l’uso efficiente delle risorse hardware, come la gestione avanzata della “Key-Value cache” e l’implementazione della tecnica “Mixture of Experts”. Questi miglioramenti sono importanti, ma non cambiano radicalmente la curva dei costi dell’AI.
DeepSeek non ha operato con risorse limitate: L’azienda dispone di circa 50.000 GPU di ultima generazione della serie Hopper, il che significa che non è stata significativamente più vincolata rispetto alle aziende statunitensi nel suo processo di sviluppo. Questi chip sono costati circa un miliardo di dollari, dimostrando che il divario di risorse tra le due parti non è così netto come si potrebbe pensare.
Il Ruolo Cruciale dei Controlli sulle Esportazioni
Il punto centrale dell’analisi di Amodei è che i controlli sulle esportazioni di chip avanzati verso la Cina sono fondamentali per determinare il futuro geopolitico dell’AI. Nei prossimi anni, il settore si avvicinerà a un punto critico:
Per sviluppare modelli di intelligenza artificiale che superino le capacità umane nella maggior parte dei compiti, saranno necessarie milioni di GPU e investimenti nell’ordine delle decine di miliardi di dollari.
Gli Stati Uniti e i loro alleati avranno sicuramente accesso a queste risorse. La vera domanda è se la Cina riuscirà a ottenere un numero comparabile di chip avanzati.
Se la Cina riuscisse ad accumulare milioni di GPU, il mondo si avvierebbe verso una competizione bipolare, in cui entrambi i paesi avrebbero accesso a sistemi di AI di livello superiore. Questo scenario potrebbe favorire la Cina, che potrebbe concentrare maggiormente l’uso dell’AI in applicazioni strategiche e militari.
Se invece i controlli sulle esportazioni impedissero alla Cina di raggiungere questa scala, il mondo rimarrebbe unipolare, con gli Stati Uniti e i loro alleati in netto vantaggio. In questo caso, l’AI potrebbe essere utilizzata per consolidare il primato tecnologico occidentale per un periodo prolungato.
Le Esportazioni Illegali e il Successo delle Restrizioni
Un’argomentazione comune contro i controlli sulle esportazioni è che la Cina possa comunque ottenere i chip attraverso il contrabbando o sfruttando scappatoie legali. Tuttavia, Amodei evidenzia come l’analisi delle risorse di DeepSeek suggerisca il contrario.
DeepSeek utilizza una combinazione di chip H100, H800 e H20. Gli H100 sono stati vietati fin dal loro lancio, quindi se DeepSeek li possiede, sono stati ottenuti tramite contrabbando. Gli H800 erano ancora legali fino all’aggiornamento delle restrizioni nell’ottobre 2023, mentre gli H20 sono tuttora esportabili (sebbene Amodei suggerisca che andrebbero vietati).
I controlli stanno funzionando e si stanno adattando: Se le restrizioni fossero inefficaci, DeepSeek avrebbe probabilmente accesso a un numero molto maggiore di chip di ultima generazione. Il fatto che possieda un mix di GPU di generazioni diverse dimostra che le restrizioni stanno limitando la crescita della capacità cinese.
Il successo di DeepSeek non dimostra il fallimento delle restrizioni sulle esportazioni, ma piuttosto la necessità di mantenerle e rafforzarle. La Cina sta dimostrando una notevole capacità di innovazione e potrebbe diventare un concorrente sempre più pericoloso se dovesse ottenere accesso illimitato ai chip più avanzati.
Per gli Stati Uniti e i loro alleati, la priorità strategica deve essere garantire che il futuro dell’intelligenza artificiale sia guidato da democrazie e non da regimi autoritari. I controlli sulle esportazioni sono uno degli strumenti più potenti per realizzare questo obiettivo.Recentemente, Dario Amodei, il CEO di Anthropic ha espresso stupore riguardo al significativo calo delle azioni di Nvidia, definendolo “sconcertante”. Questo declino è avvenuto in seguito all’annuncio di DeepSeek, una startup cinese, che ha presentato un modello di intelligenza artificiale avanzato sviluppato con un budget notevolmente inferiore rispetto ai concorrenti occidentali. DeepSeek afferma di aver addestrato il proprio modello utilizzando GPU Nvidia H800, con un investimento di soli 5,6 milioni di dollari, una cifra significativamente inferiore rispetto ai costi sostenuti da aziende come OpenAI e Anthropic.
Dario Amodei ha sottolineato che, sebbene l’innovazione di DeepSeek sia notevole, non giustifica una reazione così drastica del mercato nei confronti di Nvidia. Ha evidenziato che Nvidia rimane un attore chiave nell’ecosistema dell’intelligenza artificiale, con una solida base di clienti e una storia di innovazione che difficilmente verrà compromessa da un singolo sviluppo. Alcuni analisti condividono questa visione, suggerendo che l’efficienza di DeepSeek potrebbe, paradossalmente, aumentare la domanda complessiva di intelligenza artificiale, compensando eventuali timori di una riduzione nell’uso dei chip.
Parallelamente, ha difeso le recenti restrizioni all’esportazione di chip avanzati verso la Cina, implementate dagli Stati Uniti. Ha affermato che tali misure sono essenziali per mantenere un vantaggio competitivo nel settore dell’intelligenza artificiale e per garantire la sicurezza nazionale. Nonostante le preoccupazioni espresse da aziende come Nvidia riguardo alle potenziali ripercussioni economiche di queste restrizioni, il CEO di Anthropic ritiene che siano necessarie per prevenire la proliferazione di tecnologie avanzate in paesi che potrebbero utilizzarle in modo contrario agli interessi degli Stati Uniti.
È importante notare che, nonostante le restrizioni, DeepSeek è riuscita a sviluppare il proprio modello utilizzando GPU Nvidia H800, una versione meno potente del chip H100, il cui export verso la Cina è stato vietato nel 2022. Questo solleva interrogativi sull’efficacia delle restrizioni all’esportazione e sulla capacità delle aziende cinesi di aggirarle. citeturn0search4
In conclusione, mentre il CEO di Anthropic trova “sconcertante” la reazione del mercato al successo di DeepSeek, egli sostiene fermamente le restrizioni all’esportazione come misura necessaria per proteggere gli interessi strategici degli Stati Uniti nel campo dell’intelligenza artificiale. La situazione evidenzia la complessità dell’equilibrio tra promozione dell’innovazione, protezione degli interessi economici e salvaguardia della sicurezza nazionale.
***** l’articolo pubblicato è ritenuto affidabile e di qualità*****
Visita il sito e gli articoli pubblicati cliccando sul seguente link