Mentre NVIDIA si prepara a presentare al Computex 2026 il suo primo chip per portatili, un altro gigante del cloud insidia il suo dominio dal basso. Il business dei semiconduttori su misura di Amazon — i processori Trainium per l'IA, le CPU Graviton e i chip di rete Nitro — ha superato un run rate annualizzato di 20 miliardi di dollari, con una crescita a tre cifre anno su anno e quasi il 40% in piu' nel solo primo trimestre 2026. Il dato, emerso dai risultati trimestrali del gruppo, sta riverberando da settimane nel dibattito sull'infrastruttura dell'IA.

Numeri da terzo produttore di chip al mondo

A mettere in prospettiva la cifra e' stato lo stesso amministratore delegato Andy Jassy: "Se il nostro business dei chip fosse un'azienda a se' stante e vendesse i chip prodotti quest'anno ad AWS e a terzi come fanno gli altri grandi produttori, il nostro run rate di ricavi annuo sarebbe di 50 miliardi di dollari". Tradotto: Amazon e' gia' di fatto uno dei principali produttori di silicio al mondo, anche se usa la maggior parte dei suoi chip internamente.

La spinta arriva soprattutto dai Trainium, gli acceleratori dedicati all'addestramento e all'inferenza dei modelli IA. La domanda e' cosi' intensa che le generazioni successive vengono esaurite prima di arrivare ai clienti: Trainium2, che secondo Amazon offre circa il 30% di rapporto prezzo-prestazioni in piu' rispetto alle GPU concorrenti, e' in gran parte gia' venduto, e Trainium3 e' quasi del tutto prenotato.

I Trainium2 sono in gran parte esauriti, i Trainium3 quasi tutti prenotati.

Ordini per 225 miliardi e l'impegno di Anthropic

Dietro la crescita ci sono impegni di acquisto enormi: Amazon dichiara circa 225 miliardi di dollari in commesse garantite per i chip Trainium. Tra i clienti di peso spicca Anthropic, che sta scalando fino a 5 gigawatt di capacita' su generazioni attuali e future di Trainium — l'equivalente, secondo le stime, di 500.000-700.000 acceleratori. OpenAI, dal canto suo, si e' impegnata per circa 2 gigawatt di capacita' Trainium, in rampa dal 2027.

Sono numeri che spiegano la posta in gioco: i grandi laboratori IA non vogliono dipendere da un unico fornitore di GPU, e i fornitori cloud hanno tutto l'interesse a costruire silicio proprietario per abbassare i costi e marginare di piu' sui servizi.

Non solo Trainium: il ruolo di Graviton e Nitro

Sarebbe un errore leggere il fenomeno solo in chiave IA. Una fetta importante del business arriva dalle CPU Graviton, i processori ARM general-purpose che Amazon usa per far girare a costi piu' bassi i servizi cloud tradizionali, e dai chip di rete e sicurezza Nitro. E' una strategia di lungo corso, avviata dopo l'acquisizione della startup israeliana Annapurna Labs, che oggi paga i suoi frutti proprio nel momento di massima fame di calcolo. Ogni carico di lavoro che Amazon sposta dai chip di terzi al proprio silicio migliora i margini di AWS e abbassa la dipendenza dai fornitori esterni.

Per i clienti del cloud, il messaggio e' che esiste un'alternativa concreta e gia' matura alle GPU piu' costose, almeno per una parte dei carichi di addestramento e inferenza. Non e' la fine del dominio di NVIDIA, ma e' la prova che il mercato dell'hardware per l'IA, fin qui quasi monopolistico, si sta lentamente aprendo.

Perche' NVIDIA non puo' stare tranquilla

NVIDIA resta il riferimento assoluto per le GPU da data center, con margini elevatissimi e l'ecosistema software CUDA come fossato competitivo. Ma la strategia del silicio verticale di Amazon — affiancata da iniziative simili di Google con i suoi TPU e di Microsoft con i chip Maia — punta proprio a erodere quel dominio nei carichi di lavoro interni. Per i grandi clienti, avere un'alternativa credibile a NVIDIA significa potere contrattuale e bollette del calcolo piu' leggere.

Anche Google con i TPU e Microsoft con Maia spingono sul silicio proprietario.

Cosa cambia per il mercato dell'IA

Per gli utenti finali, l'effetto piu' tangibile passa dai prezzi dei servizi. Negli ultimi mesi diversi laboratori hanno alzato il costo delle loro API, citando proprio la spesa per il calcolo: ogni risposta di un modello avanzato consuma energia e tempo di GPU, e quel costo finisce nelle bollette di chi costruisce applicazioni sopra i modelli. Un'offerta di hardware piu' ampia e competitiva e' la leva strutturale per invertire la tendenza, perche' mette in concorrenza i fornitori e libera capacita' produttiva.

La concorrenza sui chip e' una buona notizia per chi sviluppa e usa l'IA: piu' offerta significa, nel tempo, costi di inferenza piu' bassi e meno colli di bottiglia nella disponibilita' di calcolo, che e' oggi il principale freno all'espansione dei servizi IA. Il rischio, sul fronte opposto, e' una concentrazione ancora maggiore del potere nelle mani di pochi colossi cloud capaci di progettare i propri chip, finanziare i data center e ospitare i modelli. La storia e' raccontata nei numeri dei conti trimestrali di Amazon, ripresi da The Motley Fool e Dealroom.