Valutazione dei colli di bottiglia nella supply chain dell'IA: intervista a Irrational Analysis (@insane_analyst)

@chrisbarber
INGLESE2 mesi fa · 14 mag 2026
841K
1.4K
202
31
3.7K

TL;DR

Questa intervista con Irrational Analysis esplora i vincoli dell'hardware per l'IA, dalla carenza di fosfuro di indio all'ascesa dei trasformatori a stato solido e degli acceleratori alternativi come Taalas.

Ecco la mia intervista con Irrational Analysis (@insane_analyst) sui colli di bottiglia nella supply chain dell'AI. NFA, possiedo o potrei possedere alcune di queste in futuro.

Quali acceleratori alternativi potrebbero fare una quantità molto significativa di training o inference tra tre e cinque anni da oggi?

Per il training, penso che siano tutti più o meno a zero. Per l'inference, sono un grande fan di Positron e Cerebras, ma per ragioni molto diverse. Chi altro? MatX. Il problema con MatX è che non ho abbastanza informazioni. Quindi forse è buono, ma non so nulla di loro. La risposta rapida sarebbe Positron e Cerebras. C'è anche Taalas, di cui non credo nella premessa, ma è molto figo e in un certo senso voglio promuoverli un po' perché se la premessa funziona, è incredibile. Ma non credo che le persone dell'AI saranno tolleranti verso la premessa. Sì, questi sono più o meno i tre grandi che mi piacciono davvero tanto, con MatX a parte perché non ne so abbastanza. Sto ancora cercando di convincerli a parlarmi.

La premessa di Taalas con cui non sei d'accordo sono i pesi fissi?

Quello che fanno è usare uno strato di maschera superiore per masterizzare i pesi. Quindi una volta che hai i pesi, non puoi cambiarli. E dato quanto velocemente cambiano i modelli AI, tipo ogni due settimane arriva GPT 5.5 e poi 5.6. Se parli con le persone che lavorano in queste aziende, internamente il modello cambia continuamente. C'è un esadecimale alla fine del modello. Ogni paio di settimane c'è un aggiornamento. I pesi cambiano costantemente e vengono affinati.

Ora, quello che dice Taalas è che supportano il fine-tuning. Penso che intendano che il chip attuale supporta qualche modifica dei pesi, ma non quanto si vorrebbe. Il loro chip attuale è per due terzi pesi hard-coded e per un terzo solo una macchina SRAM. E il motivo per cui possono supportare il fine-tuning è che un terzo è SRAM, e puoi avere un sottoinsieme dei pesi che puoi cambiare o su cui fare fine-tuning, fare cose tipo LoRA. E fondamentalmente stanno parlando con i clienti e dicono: "beh, il tuo modello funzionerà molto più velocemente quanto più hard-codifichi, ma hai questo compromesso." Ora, in un mondo ideale, qualcuno potrebbe progettare un modello dove il 90% dei pesi è hard-codificato (mi sto inventando questi numeri). Funzionerebbe super veloce. E poi il 10% viene usato per LoRA o per aggiornare i pesi. Ora, se qualche grande pesce accetterà questo livello di vincolo, non lo so. Non credo. Ma l'ingegneria dietro quello che sta facendo Taalas è in realtà super, super intelligente.

Usano uno strato di maschera superiore. Quindi i chip hanno tipo 14 strati oggi, chiamiamoli 14 o 15 strati. Prendono uno degli strati nel terzo superiore della maschera e lo usano per programmare i pesi e hard-codificarli. Quindi se ci pensi, normalmente un progetto di chip richiede almeno tre mesi, tipicamente di più, per fare il design. Poi devi fare il tape-out e poi ci vogliono cinque o sei mesi perché i chip tornino e poi devi verificarli. Taalas ha dovuto creare un sacco di strumenti EDA personalizzati per il loro compilatore, lo stack di verifica e il design del chip, e sostengono che ci vuole un giorno per fare un nuovo modello. Alla fine. Al momento ci vuole circa una settimana. Quindi è una settimana per fare il design, e poi poiché cambiano solo lo strato superiore, uno degli strati superiori, possono accumulare wafer. Quindi se vai da TSMC o da qualsiasi fonderia, è una cosa molto comune nell'industria, puoi dire: "ehi, voglio che tu tenga X numero di wafer al 70% di completamento, non finire l'ultimo pezzo perché stiamo facendo R&D o altro." Quindi Taalas può avere un turnaround molto più veloce di quanto mi aspettassi inizialmente. È una settimana per fare il nuovo design e poi circa due mesi. Questa è la mia stima, di certo non sei mesi. Quindi entro due mesi puoi riavere i chip e farli funzionare. E sostengono di aver creato alcuni strumenti compilatori Verilog molto intelligenti e strumenti di simulazione thread per interfacciarsi con gli strumenti EDA standard e verificare tutto molto bene. Quindi la validazione post-silicio dovrebbe essere nulla perché l'infrastruttura del chip è già validata e stai solo cambiando i pesi. Hanno preso un processo che richiedeva almeno un anno dall'inizio alla fine e lo hanno ridotto a teoricamente due o tre mesi, che non è male.

Da una prospettiva di architettura del modello, sono più una persona da hardware. Non capisco l'architettura dei modelli. Facevo fatica a capire: "ok, come fai ad avere qualcosa dove la maggior parte dei pesi è fissa e poi cambi solo alcuni pesi, tipo i pesi in un singolo strato o cose del genere?" E poi ho scoperto LoRA e ho chiesto a persone che capiscono l'AI per bene e mi hanno detto: "oh no, LoRA, non puoi scalarlo o cose così. È stupido. Solo i perdenti usano LoRA." Ma se la premessa funziona, se trovano un cliente disposto a usare LoRA o qualche altro sistema algoritmico dove una grande parte dei pesi è fissa e serviremo questo modello costantemente, quindi sarà economico, Taalas, la loro economia è incredibile. Il chip costa pochissimo. Non ha bisogno di HBM o memoria di alcun tipo. Non ha bisogno di packaging avanzato di alcun tipo. Anche il PCB, sono davvero limitati dalla latenza nella comunicazione chip-to-chip, non sono affatto limitati dalla larghezza di banda. Quindi usano PCIe e CXL e il loro vero limite al momento è che non hanno l'ultima versione di CXL sul loro chip e apparentemente CXL 3.0 sta dando loro alcune funzionalità che li aiuteranno significativamente. Ma per ora sono ancora a posto. Quindi avrai prestazioni incredibili, fantastiche (letteralmente impossibili in qualsiasi altra architettura) a prezzi stracciati. È solo che hai questa limitazione: una grande parte dei pesi, probabilmente tra il 50 e il 90%, deve essere fissa e non puoi cambiarli. Ma per cambiarli dovresti buttare via tutti i tuoi chip o la maggior parte di essi e poi aspettare due o tre mesi, e il costo per fare un nuovo design è circa un quarto di milione di dollari, più o meno.

Prendi il CEO di Taalas. Ha fatto un'intervista in cui ha detto che il costo del design del chip, una nuova versione del chip, è "lo stesso di un server H100". Quindi diciamo che stai gestendo un data center, stai servendo qualche modello con chip Taalas, decidi di buttare via tutti i tuoi chip Taalas perché il modello deve essere aggiornato. Quindi devi svalutare quel capex, devi dare a Taalas altri 300-500k. Nel caso peggiore, ti fanno nuovi chip in due o tre mesi e poi li deployi. E di nuovo, non c'è problema di memoria. Non c'è nemmeno un problema di PCB. Puoi usare materiali PCB di bassa qualità perché stanno solo eseguendo PCIe molto lento. Quindi potrebbe funzionare. Semplicemente non so abbastanza sui modelli per vedere se funzionerà.

Diversi livelli dello stack: quali pensi che finiranno per essere più vincolati dalla supply chain nei prossimi anni?

Sì, è un po' tutto. Se me lo avessi chiesto a gennaio o febbraio avrei dato una risposta molto diversa, ma ora è tutto vincolato.

Perché il mercato ha iniziato a impazzire su questo lo scorso settembre o giù di lì?

Non lo capisco. A volte il mercato è molto strano e parlo con molti di questi gestori di hedge fund e dico: "ragazzi, siete intelligenti, perché ve ne rendete conto solo ora?" È strano.

La visione macro è che tutti ora stanno capendo che il capex degli hyperscaler continuerà ad aumentare almeno in valore assoluto?

Sì, la cosa macro è che le persone continuano a oscillare avanti e indietro. Ti faccio un esempio divertente. Mi è stato detto che gli investitori energetici tradizionali sono tutti short su Bloom perché dicono: "oh, Bloom è troppo costoso, le turbine a gas naturale sono semplicemente più economiche, questa è una bolla." E io dico: "ragazzi, si tratta di time-to-power. Vi siete persi completamente la barca."

Non capiscono i vincoli di questo insieme di clienti.

Lo so. Non capisci perché le persone scelgono questo. Non è perché è più economico. L'economia per megawatt o qualunque cosa è significativamente peggiore. Ma puoi averlo ora. E se devi ritardare il tuo progetto di data center di almeno sei mesi... Sto parlando con più hedge fund focalizzati su AI e semiconduttori e loro dicono: "oh, conosciamo questi altri hedge fund energetici che sono short su Bloom." Tipo: "perché mai saresti così suicida da shortare questo?" Ci sono molte cose strane che accadono nel mondo della finanza. Quindi non posso spiegarlo.

Quali altri livelli finiranno per essere colli di bottiglia?

Il fosfuro di indio è messo così male. È davvero pazzesco. Non so cosa faranno molte persone, ma il fosfuro di indio, tutto ciò che è correlato al fosfuro di indio, è messo molto, molto, molto male.

Il fosfuro di indio serve per laser e ottica, perché il silicio non può generare luce. E le persone ancora non capiscono quanto sia grave, perché il CPO sta spingendo i requisiti per i laser in termini di prestazioni di rumore.

Questo è Aixtron, per esempio?

Oh, sì. Quindi producono le attrezzature per la produzione di fosfuro di indio. In un certo senso non sono il collo di bottiglia, beh, probabilmente lo sono, ma stanno producendo più macchine e i Lumentum, Coherent e Sumitomo del mondo stanno comprando quelle macchine. Sono long su quella roba. È più una questione di capacità di Lumentum e Coherent. Il mondo dei substrati, AXT, Sumitomo, IQE, tutti questi, loro sono il collo di bottiglia.

Cos'è IQE?

C'è questa azienda britannica, credo facciano l'epitassia. Ci sono un sacco di nomi in questa catena di produzione del fosfuro di indio. Ed è fondamentalmente un disastro in questo momento.

Semplicemente non c'è abbastanza fosfuro di indio per il mondo, giusto?

Sì, beh, le miniere di fosfuro di indio stanno bene, credo, per ora. Ma la lavorazione del fosfuro di indio in cristallo, poi prendere il wafer, poi fare l'epitassia sul wafer e poi stampare i laser sul wafer, tutto questo, è un disastro completo. Perché il modo in cui funzionano i laser CPO è che devono essere di potenza molto più alta, il che significa che la dimensione del die deve essere significativamente più grande, e hanno bisogno di una larghezza di linea molto più stretta e migliori prestazioni di rumore, il che significa che devi rendere la dimensione del die più grande in generale.

Quindi è anche parte del motivo per cui SiPho e Tower Semi stanno andando alle stelle. Tradizionalmente, il modo in cui funzionava il mondo dei transceiver era che si iniziava con EML, che è fondamentalmente un singolo chip monolitico di fosfuro di indio che ha il modulatore che agita la luce su e giù e il laser a onda continua, tutto sullo stesso chip di fosfuro di indio. E EML ha sempre prestazioni migliori della fotonica al silicio per ragioni fisiche. E generalmente quello che succede è che dopo uno o due anni, dopo ogni generazione di transceiver (come 400G o 800G), le persone iniziano a passare a SiPho per risparmiare denaro. Capisci come rendere le prestazioni di SiPho abbastanza buone e risparmi denaro perché invece di comprare un grande EML, compri un laser a onda continua molto più piccolo e lo metti nel modulo SiPho e moduli lì.

Ma comunque, questa volta SiPho è andato alle stelle perché tutti dicono: "aspetta, c'è una carenza di EML", e poi le stesse persone che producono EML producono anche i laser CW e stanno riallocando la loro capacità verso CW perché ha margini più alti e c'è più domanda. Quindi ora la domanda di CPO sta massacrando l'offerta di EML che era già enormemente sottodimensionata. E ora, i transceiver 1.6T sono la prima generazione in cui SiPho è dominante, quasi subito. Penso che entro sei mesi abbia raggiunto la maggioranza delle quote. Non conosco i numeri esatti, ma è completamente diverso. Se guardi ogni generazione di transceiver e poi la quota di mercato SiPho vs EML, questa volta è completamente diversa. Ed è perché c'è una carenza così paralizzante di fosfuro di indio.

Per quanto riguarda il prossimo, direi la memoria perché semplicemente non c'è capacità di clean room. Qualcuno mi ha fatto questa domanda, che non è completamente stupida: "oh, Samsung, hanno fab di logica e fab di memoria, perché non riallocano semplicemente la linea di fab di logica alla memoria?" Perché le fab di memoria sono completamente diverse nelle attrezzature che usano e nel processo e in tutto. Quindi hai solo tre aziende che possono produrre DRAM. Sono tutte completamente prenotate. Non c'è capacità in arrivo a breve.

Che sono Hynix, Micron e Samsung?

Sì, quelle tre. Quindi questo è il secondo collo di bottiglia peggiore. Ma le persone ne sono abbastanza consapevoli.

C'è molta differenza tra i tre produttori di memoria?

Personalmente non penso che importi. C'è molto dramma e rumore. C'è una tale carenza. Tutto si venderà con margini lordi dell'80%. Chi se ne frega? Quindi storicamente SK Hynix era decisamente in testa e Samsung era in una sorta di autodistruzione. Era piuttosto brutto. E Micron era più o meno al secondo posto. E ora c'è fondamentalmente molto dramma sulle velocità dei die HBM4, tutto questo rumore dai leak della supply chain. Fondamentalmente con HBM, tutto l'HBM prima di HBM4, 3E, 3, tutto, il die base, che contiene un sacco di circuiti logici per l'interfaccia, era realizzato su un nodo di processo DRAM interno. Ora il motivo per cui è importante è che è più economico perché i ragazzi della DRAM usano le loro stesse fab per produrlo. Ma la qualità dei transistor è molto peggiore. La DRAM è progettata per transistor lenti e minuscoli e condensatori giganti, non per il design logico, quindi sei limitato in velocità.

Quindi con HBM4, tutti sono stati in qualche modo costretti ad abbandonare questa strategia. Beh, avrebbero dovuto abbandonare questa strategia. Quello che è successo è che SK Hynix è andata da TSMC e ha iniziato a usare un processo di classe 12 nanometri. Quindi molto meglio della schifezza che potevano mettere insieme con il processo DRAM interno. Ma è comunque 12 nanometri, non molto buono. Samsung ha il proprio nodo logico interno SF4X e non è 4 nanometri, direi che al massimo è alla pari con TSMC N6, o da qualche parte tra TSMC N6 e N7. È abbastanza buono per quello che deve fare. Micron è stupido. Hanno detto: "no, useremo il nostro processo DRAM interno." E si sono sparati sui piedi e si sono ritardati. E c'è tutto questo dramma: "oh no, Micron, non ce la faranno per Nvidia Rubin." E a nessuno importa. Venderanno solo più DRAM normale o HBM3E a prezzi alle stelle. Niente di tutto questo importa. Tutti e tre venderanno tutto ciò che hanno a prezzi piuttosto alti. E il divario di qualità è ora abbastanza vicino. Una volta Samsung HBM3 era così brutto che nessuno poteva usarlo. A nessun prezzo certe persone avrebbero usato Samsung HBM3 perché avevano molti problemi di potenza. Era un vero divoratore di energia. Ma ora sono tutti abbastanza vicini che, ok, diciamo che Nvidia ha standard più alti e rifiuta l'HBM4 di Micron, venderanno HBM4 a qualcun altro o semplicemente venderanno DRAM normale con margini lordi pazzeschi. Questo non influenzerà finanziariamente Micron. Quindi c'è stato molto dramma dietro le quinte su questo e penso che sia francamente stupido.

Quando dici memoria, intendi specificamente DRAM o HBM e DRAM?

Sì, ogni volta che dico DRAM includo HBM in quello. È tutto uguale. La memoria la categorizzo in DRAM e NAND flash. Quelle sono le due categorie. DRAM è tutta la memoria che non è NAND flash.

Il terzo collo di bottiglia che hai detto, le fab di logica?

Puoi vedere Intel che va alle stelle, si sta risolvendo. Il fatto è che TSMC semplicemente non ha abbastanza capacità. Sono stati troppo conservativi. Sei mesi fa, Samsung fondamentalmente non aveva utilizzo, quasi nessuno, sulla loro logica avanzata. E Intel era solo interna. Ora ci sono aziende esterne che si stanno accalcando e Samsung sta ottenendo anche un utilizzo piuttosto alto. Quindi c'è stata una sorta di flessione in cui la situazione della logica sembrava molto brutta a febbraio. Ora è migliorata. È ancora piuttosto brutta ma non è peggiorata. La memoria e il fosfuro di indio sono peggiorati negli ultimi sei mesi. La logica è migliorata, ma è ancora piuttosto brutta perché ci vuole molto tempo per costruire queste linee, e di nuovo ci sono solo tre attori: Samsung, Intel, TSMC.

Quali altri colli di bottiglia sono peggiorati negli ultimi sei mesi?

No, sono principalmente quelli due in termini di categoria. Non penso che i power semis diventeranno brutti, ma penso che siano la categoria più interessante, perché c'è molta capacità libera dato che la situazione dei veicoli elettrici non era buona.

Puoi spiegare i power semis?

I power semis cambiano la potenza da una tensione all'altra. Puoi pensarci in questo modo. Hai la tua rete elettrica che è a migliaia di volt AC. Devi convertirla in AC più bassa e poi alla fine devi convertirla in tensione DC. 800 volt DC, 400 volt DC, 240 volt AC. E alla fine dopo diversi passaggi, il tuo chip logico di fascia alta assorbe tipo 1,2 volt, più o meno. Per essere più precisi, ogni chip logico di fascia alta, i chip a 3 nanometri, la tensione standard è tipo 0,75 volt. E poi ci sono alcune tensioni lato alto a tipo 1,1 volt o 1,5 volt. Quindi devi andare da una tensione molto alta a una molto più bassa per il chip. Quindi hai bisogno di più stadi di conversione. E ci sono questi materiali chiamati materiali a banda larga, carburo di silicio e nitruro di gallio, che sono molto migliori del silicio per ragioni fisiche.

Più efficienti, quindi risparmi sui costi energetici e meno raffreddamento, giusto?

Sì, esattamente. Più efficienti. E possono tollerare tensioni molto più alte. Prova a mettere un chip di silicio nella stessa posizione, brucerà, si friggerà.

Qual è il tuo preferito tra quelli che hai menzionato: TI, Navitas, onsemi, Infineon?

Beh, questo fine settimana pubblicherò il post. È quasi finito. Al momento in GaN, TI e Navitas sono in parità per il primo posto e Infineon è un secondo distante. onsemi sostiene di avere qualcosa di incredibile chiamato GaN verticale. Ma sono solo slides. Nessun datasheet, nessuna specifica reale. È solo: "abbiamo creato una cosa e avrà questi numeri fantastici." Ok, certo. Quindi onsemi, forse hanno qualcosa, forse no. Nel carburo di silicio non l'ho ancora capito, ho bisogno di altri giorni. Ma l'attore interessante nel carburo di silicio è, è un meme stock, ma anche non è un meme stock. È Wolfspeed.

Parlami di Wolfspeed.

Hanno sovraccostruito la capacità in modo massiccio. Sono puro carburo di silicio e sono integrati verticalmente. Producono i wafer, i substrati, producono i dispositivi, fanno tutto internamente.

A parte: gli hedge fund ti contattano e vogliono solo la tua opinione sulle cose, e lo fai perché è divertente e così vedi quali domande fanno?

Imparo anche. Capisco come pensano questi ragazzi. Perché io sono solo una formica. Non muovo il mercato. Questi ragazzi muovono il mercato. Condividono anche idee. In particolare, Wolfspeed è venuto fuori da una conversazione con un hedge fund.

Wolfspeed è venuto fuori da una conversazione con un hedge fund?

Quello è venuto da cinque. È un titolo molto interessante. Sono integrati verticalmente, al 100% basati negli USA. Hanno sovraccostruito il carburo di silicio, e sono stati uccisi dalla concorrenza cinese e dal rallentamento dei veicoli elettrici. Sono letteralmente andati in bancarotta, Chapter 11. Sono emersi dal Chapter 11 solo abbastanza recentemente, credo circa quattro mesi fa. Devo controllare. Ma è molto recente. Tutti hanno smesso di comprare da loro perché il tuo fornitore è in bancarotta. Quindi la loro utilizzazione della fab è circa al 30%, a quanto si dice. Molto, molto bassa. E ora sono tornati. E il fatto è che se il mercato in qualche modo si capovolge, questo titolo è un 5X. È così leveraggiato e folle. Ma è letteralmente appena andato in bancarotta. E ha margini lordi negativi. Puoi guardare il loro ultimo rapporto sugli utili. Il loro margine lordo è negativo al 20%. E la loro guidance è: "continuiamo ad aspettarci margini lordi negativi." Perdono letteralmente soldi su ogni chip che producono perché sono così sottoutilizzati.

Ora, la cosa interessante, e il motivo per cui la gente mi stava contattando, è che Wolfspeed ha inventato questo chip di carburo di silicio da 10 kilovolt. Questi chip sono letteralmente solo un transistor, un transistor super, super resistente che deve gestire livelli pazzeschi di tensione e corrente. Al momento, i transistor di carburo di silicio con la tensione nominale più alta sul mercato sono nell'intervallo 1700-2000 volt. Infineon ha un componente da 3,3 kilovolt. Nessuno ha niente al di sopra di quello tranne Wolfspeed. Wolfspeed dice: "oh, possiamo fare un componente da 10 kilovolt." E sto guardando il datasheet e questa cosa è pazzesca. Non so come diavolo l'abbiano fatto. E non è immediatamente ovvio se sia meglio o peggio. Perché i transistor sono solo interruttori, e idealmente quando accendi il transistor, vuoi che sia un interruttore perfetto, che non abbia resistenza. Ma non è mai vero. Avrai una resistenza parassita. Quindi quando un transistor è acceso, agisce come un minuscolo resistore (questo è estremamente semplificato). Sto guardando la resistenza parassita di questo componente Wolfspeed, e la capacità parassita di gate, che danneggia la velocità di commutazione, e lo confronto con componenti completamente diversi, come quelli da 2000 e 3000 volt dei concorrenti. I parassiti sono peggiori, ma hai bisogno solo di uno di questi invece di tre. Ho dovuto guardare alcune simulazioni di circuito per capire. Penso che il componente da 10 kilovolt sia in realtà abbastanza buono. E sarà utile per le infrastrutture. È completamente inutile nel data center. E quando lo dico ad alcuni di questi gestori di fondi, loro dicono: "oh no, non è utile nel data center." Io dico: "amico, ti stai perdendo il quadro generale. Trasformatori a stato solido. Vuoi la regolazione del carico per la rete elettrica tra l'AC ad alta tensione e il data center."

Quindi sono molto più bullish sulla distribuzione di potenza che si trova appena fuori dal data center che all'interno del data center. Sento che tutti si stanno concentrando su chi vincerà il power rack nel design Nvidia e nel design OCP, fisicamente all'interno del data center. E questa è un'opportunità interessante. Ma la roba che sta fuori dal data center, tra il data center e la rete elettrica, è anche super interessante. In effetti, probabilmente più interessante. Quindi sì, amo i power semis. Penso che sarà la prossima cosa che esploderà e diventerà un collo di bottiglia. Non sarà il collo di bottiglia principale perché c'è così tanta capacità extra in giro, dato che i veicoli elettrici sono in un certo senso morti. Ma è il più entusiasmante dove le cose cambieranno.

Sei specificamente più entusiasta della distribuzione di potenza all'esterno del data center rispetto all'interno?

Hai mai guidato vicino e visto quelle cose circolari con quelle grandi scatole vicino alle sottostazioni elettriche? Quelli sono trasformatori tradizionali. Il modo in cui funzionano è che hai un nucleo di ferro gigante e poi hai un sacco di avvolgimenti di rame su un lato e avvolgimenti di rame sull'altro lato. E questi sono fondamentalmente dispositivi per lo più passivi in cui converti tipo 100 kilovolt AC in tipo 35 kilovolt AC, e poi converti i 35 kilovolt AC in tipo 7 kilovolt AC, e poi li converti in tipo 240 volt, 120 volt AC che vanno nella tua casa. O tipo 2000 kilovolt AC che vanno ai clienti industriali, per trasmettere elettricità su lunghe distanze. Vuoi tensione estremamente alta per ridurre le perdite di potenza. Ma per usarla effettivamente devi abbassarla con i trasformatori. Questi trasformatori sono tipicamente queste cose passive e ingombranti e fanno schifo perché ci vuole molto tempo per comprarli. Fai un ordine ora (e questo è prima della roba AI), e poi 12-18 mesi dopo te lo danno perché è un enorme pezzo di metallo. Ci vuole semplicemente molto tempo per produrlo.

Ecco la traduzione in italiano del testo fornito, seguendo scrupolosamente tutte le linee guida specificate.


Quello che penso che le persone non capiscano è che hanno un grosso problema con i data center di intelligenza artificiale. Perché, pensateci, immaginiamo che lavoriate per una compagnia elettrica, PG&E o simili. Avete questi nuovi clienti che si collegano alla vostra rete e che dovete gestire, il cui carico aumenta e diminuisce in modo aggressivo. Questi tizi sono tipo: "Oh, ora ci serve un gigawatt". E poi cinque minuti dopo: "No, in realtà ci servono solo 800 megawatt". Quindi questo è un incubo satanico per i gestori della rete. E non so se l'avete visto, è circolato su Twitter l'anno scorso, il team di PyTorch ha aggiunto un flag speciale chiamato "Power Plant No Blow Up". Era una cosa divertente che girava. Ora, cosa fa questo flag? Il problema che stava accadendo era questo: hai un sacco di GPU, 10.000 GPU, 100.000 GPU. Stanno facendo un sacco di calcoli per l'addestramento e poi una parte di esse smette di fare calcoli o li fa a una velocità molto più bassa perché stanno comunicando tra loro, all reduce e cose varie. E questo stava causando instabilità nella rete elettrica. E il gestore della rete dice: "Qualunque cosa stiate facendo, fermatevi, altrimenti vi stacchiamo. È pericoloso. State destabilizzando la rete." Quindi ciò che fa il flag in PyTorch è: se la GPU non ha bisogno di fare calcoli, la forza a farli comunque alla massima velocità. Falle fare calcoli spazzatura e mandali da qualche parte. Diciamo che il tuo chip funziona a 500 watt. In una situazione normale, vorresti che scendesse a 200 watt se non sta lavorando. Ma in questo caso, no, non vogliamo che scenda a 200 watt. Tienilo a 500 watt per tutto il tempo perché non vogliamo che il gestore della rete si arrabbi con noi. E il motivo per cui i gestori della rete sono arrabbiati è che, se pensate a un sistema elettrico, quando avete questi componenti passivi, questi trasformatori passivi, qualsiasi tipo di spinta e trazione del carico si propaga all'indietro verso la rete e la destabilizza. Ora, questo andava bene in passato perché le persone della rete elettrica gestivano la cosa, e ci sono alcune soluzioni alternative per stabilizzare le reti. Ma ora non è più così.

Quindi abbiamo parlato dei trasformatori tradizionali. Ora esistono i trasformatori a stato solido. Non so perché si chiamino trasformatori a stato solido, perché anche i trasformatori precedenti sono a stato solido, sono passivi. Invece di avere un blocco di ferro e un mucchio di avvolgimenti di rame, costruisci dei circuiti con chip di carburo di silicio e puoi fare la stessa cosa: convertire alta tensione CA in una tensione CA più bassa, o anche direttamente da alta tensione CA a CC. Perché le persone non lo hanno fatto? Esiste dal 2020. È più costoso. Puoi lamentarti quanto vuoi dei trasformatori tradizionali, ma sono economici e aspetti 12 mesi e ottieni la cosa. I trasformatori a stato solido sono molto più costosi, ma hanno un vantaggio enorme, enorme. E cioè che puoi fare la regolazione del carico. Puoi programmare dinamicamente il trasformatore a stato solido per assicurarti che la corrente e la tensione su entrambi i lati siano più o meno le stesse. Puoi cambiare la frequenza di commutazione. Quindi se il carico aumenta, puoi commutare a una frequenza più alta, o se il carico diminuisce, commuti a una frequenza più bassa.

E usano semiconduttori di potenza nei trasformatori a stato solido.

Sì, quindi questi sono dispositivi attivi. Sono fondamentalmente un mucchio di transistor. Invece di avere dispositivi passivi, un mucchio di induttori, avvolgimenti di rame e alcuni diodi, sono transistor. Accendi e spegni i transistor per gestire l'energia, non solo per convertirla ma anche per gestirla in modo da ottenere 800 volt puliti, non 800 volt più o meno 20 volt o simili. O fornire mille ampere, non 1000 ampere più o meno il 10%. Puoi regolarla. E questo è enorme perché invece di sprecare soldi con il flag "Power Plant No Blow Up" in PyTorch, puoi abbassare la GPU, ottieni semplicemente enormi guadagni in efficienza. E anche i gestori della rete sono più contenti di te. Molte volte, le questioni di permessi, diciamo che stai cercando di costruire un data center e i permessi non vengono approvati, e tu sei tipo: "Perché è successo?" È perché la compagnia elettrica dice: "Stai per destabilizzare la rete. Non possiamo permetterlo." E poi ora puoi dire: "Beh, metterò dei trasformatori a stato solido ed ecco come non destabilizzerò la tua rete." E allora la compagnia elettrica dice: "Ok, va bene, ti vendo l'elettricità, collegati." Quindi le persone hanno aggirato questo collo di bottiglia in vari modi creativi. Ma penso che ora sia il momento di usare i trasformatori a stato solido e sopportarne il costo perché il valore c'è. Sì, paghi di più per la scatola che converte l'elettricità. Ma ottieni tutti questi vantaggi. Penso che questo inizierà a decollare nel prossimo anno. Questa è più una storia della seconda metà del 2027. Ma il modo in cui funzionano i titoli azionari è che le persone lo capiscono e comprano in anticipo. I titoli guardano al futuro. Quindi questo sta iniziando ad accadere ora e penso che prenderà piede nei prossimi 36 mesi.

Saresti più entusiasta delle aziende di semiconduttori di potenza rispetto alle aziende che vendono i trasformatori a stato solido?

In generale sì, perché almeno il mio stile di investimento personale è che capisco l'ingegneria, o almeno ci provo, e riesco a capire la differenziazione. Confronto e riesco a capire il cui chip è migliore di chi, chi può far pagare un premio. Le persone che comprano quei chip e costruiscono la scatola, anche lì c'è valore, a causa dell'aspetto del controllo. Diciamo che la scatola ha mille transistor molto potenti. Se non hai i circuiti di protezione e il controllo, è estremamente pericoloso. Puoi far saltare tutto ciò che è collegato, inviare un picco di tensione. Quindi ci sono attente considerazioni di progettazione su come mettere insieme questi semiconduttori di potenza. Ci sono due titoli qui. Un sacco di persone me li hanno proposti e io non li prendevo sul serio. E poi quando la quindicesima persona me li manda, penso: "Ok, va bene, li leggerò." Ci sono queste due società chiamate SolarEdge ed Enphase Energy. La loro storia è la produzione di microinverter per pannelli solari. Il problema con le installazioni di pannelli solari è che i pannelli solari sono in CC, ma ovviamente la tua casa funziona in CA, quindi devi convertire ogni pannello solare da CC alla CA corretta. E poi ci sono un sacco di cose di sicurezza e devi controllare tutto. Quindi questi tizi facevano queste piccole cose di microinverter per installazioni solari domestiche. E da quando gli incentivi fiscali per il solare domestico sono andati a rotoli, questi tizi sono completamente crollati. Puoi guardare il prezzo delle loro azioni. C'è stata una bolla nel 2021 circa, e poi sono scesi del 90%. Ora sono solo spazzatura. E questi tizi si stanno riconvertendo ai trasformatori a stato solido. Vedono l'opportunità. E non ho avuto tempo di approfondire completamente, ma in realtà penso che sia legittimo. È super degen. È un'idea super stupida. Ma penso che funzionerebbe effettivamente come titolo. Perché sono molto esperti nell'assemblaggio e nei circuiti di protezione di questa roba. E questo è probabilmente più facile di quello che fanno nel mondo solare, perché invece di averlo distribuito su tutto un tetto, lo metti tutto in una scatola e puoi fare la protezione da sovracorrente molto più facilmente. E hanno persino una tecnologia differenziata. Enphase ha un ASIC di controllo a 22 nanometri. Hanno progettato il loro chip a 22 nanometri per controllare tutti questi microinverter perché devi fare un po' di calcoli e un sacco di segnalazioni diverse a tutte queste parti analogiche. È un problema di sistemi distribuiti. Fondamentalmente devi dire a circa 10.000 transistor a quale velocità devono commutare e anche rilevare guasti e cose del genere. Quindi hanno un ASIC di controllo per questo e questo semplifica le cose. È un vantaggio competitivo legittimo.

E Delta Electronics?

Sì, Delta è quella grande. Quindi hai Delta, Vertiv, Eaton e tutti questi grandi. Questo è il loro core business. Questo è ciò che già fanno. E i titoli sono già saliti. La parte interessante di SolarEdge ed Enphase è che sono state lasciate per morte e nessuno ci presta attenzione. E questi titoli, se funzionano, fanno 5X. Vuoi inseguire qualcosa che è già salito molto come Vertiv, o vuoi inseguire qualcosa di un po' degen? Quindi è divertente. Non è un'idea terribile. Potrebbe funzionare. Se vuoi giocare d'azzardo, metti mezzo punto percentuale del tuo portafoglio in questo. Certo, perché no.

Cosa chiedono gli hedge fund?

Generalmente vogliono la mia opinione sulle cose perché il mio libro è pubblico e sto sovraperformando tutti loro, anche se con livelli di rischio folli, intendiamoci. Molti di questi tizi sono market neutral, quindi la mia performance non è giusto paragonarla alla loro. Ma me la sto cavando abbastanza bene. Mi chiedono opinioni e cose, e molte volte si concentra su cose tecniche perché non so niente di valutazione. A volte quando c'è un nuovo fondo chiedono: "Oh, cosa ne pensi della valutazione?" Non leggete quello che scrivo? Ma sì, cose di ingegneria. Per esempio, la faccenda di Wolfspeed. Nessuno di loro sa se questo carburo di silicio da 10 kilovolt è buono e dove verrebbe usato. E non credo che nemmeno Wolfspeed stessa sappia come verrebbe usato, perché hanno messo la fornitura di energia per reattori a fusione nucleare nella scheda tecnica e nel loro comunicato stampa. Io penso: "Ragazzi, state davvero esagerando." Molte volte, il management dell'azienda dice qualcosa a queste persone della finanza e loro pensano: "Stanno dicendo la verità?" E io dico: "Sì o no, o è complicato, dovreste fare queste domande di approfondimento." Quindi è per lo più tecnico, ma non al 100%.

Cerebras, la tua opinione ora.

Lo adoro. Ho alcune critiche severe. Andrew Feldman (@andrewdfeldman) ne è molto dolorosamente consapevole, a quanto pare. Sono su FP16, che è un errore stupido. Se implementassero FP4, otterrebbero fondamentalmente da 3 a 4 volte la capacità solo da questo. E questo è un frutto a portata di mano facile. È solo logica digitale. Devono anche sistemare il loro I/O per scaricare la cache KV. E non compro questa argomentazione del tipo: "Oh, è abbastanza buono." Questa è una scusa debole. Se hai l'opportunità di rendere il tuo prodotto 10 volte migliore, rendi il tuo prodotto 10 volte migliore. Non accontentarti della mediocrità. E infine, i loro margini lordi indicano che la loro resa è super bassa. Affermano pubblicamente che la loro resa a livello di wafer è del 100% e io gli credo, il che significa che la loro resa dal confezionamento del wafer è orribile. È tra il 20 e il 40%. Non so perché sia così male, ma devono sistemarlo. Ho ancora critiche nei loro confronti, ed è più come se volessi essere un investitore attivista. Sto comprando alcune delle loro azioni. Non me ne vado. Sono rialzista ma anche severo perché potrebbe essere molto meglio. Andrew Feldman nega il problema dell'I/O. E io sono tipo: "No, amico, smettila di negare e sistemalo. Puoi renderlo migliore. Rendi il prodotto semplicemente migliore."

Sei ancora ribassista sulle neocloud?

Sì, più o meno. Guarda cosa è successo a CoreWeave lo scorso trimestre. Penso che fondamentalmente stiano ottenendo costi più alti a causa di tutte le carenze, l'ottica e la memoria. E tutte le persone della finanza erano tipo: "Stai trasferendo i costi al cliente attraverso il contratto?" E il CEO di CoreWeave ha provato a rispondere a questo due volte e non ho idea di quale sia la risposta. Poiché il titolo è sceso, immagino che le persone della finanza abbiano interpretato che no, si stanno facendo fregare. Hanno firmato un contratto a lungo termine e non possono trasferire i costi.

Qualche pensiero sulle neocloud con maggiori probabilità di morire?

Le più piccole. CoreWeave è abbastanza grande. Oracle è abbastanza grande. Nebius è probabilmente abbastanza grande. Non so se moriranno, ma alla fine ci sarà un problema. Il livello di debito qui. Non appena ci sarà una recessione, o anche se i tassi di interesse aumentano, potrebbero esserci aumenti dei tassi di interesse nella seconda metà di quest'anno e questo le danneggerà abbastanza gravemente. È semplicemente un brutto business. Ci sono così tante altre grandi cose in cui investire. Fai quello. Non so perché le persone vogliano possedere questa robaccia.

Terafab?

Non ci sono abbastanza informazioni, a parte il fatto che sembra che stiano forse licenziando il processo Intel 14A. Questa è la mia interpretazione di ciò che sta succedendo. Non ci sono informazioni.

Il ramp del CPO avverrà senza troppi problemi?

Non penso che ci saranno problemi. Le persone che sono preoccupate per l'affidabilità hanno completamente torto e non capiscono l'ingegneria. I problemi saranno la carenza di fosfuro di indio, che è davvero, davvero grave. Ma la distribuzione, no, non credo che sarà un problema. Se lo fai bene, se fai i compiti a casa, andrà bene. Sarà in realtà più affidabile dei ricetrasmettitori.

Qualche opinione su Amkor?

No, non seguo molto i player del packaging.

E Ibiden o Unimicron?

No, non lo so. Nessuna opinione.

Nokia o Infinera?

Oh, sì. Ha il potenziale per essere una versione molto più economica di Ciena. Quindi se sei tipo: "Wow, Ciena è salita molto, la valutazione è alta", beh, potresti semplicemente prendere Nokia e stanno cercando di fare la stessa cosa. Quindi penso che sia un legittimo investimento di valore. È una delle poche cose in cui la valutazione è ragionevole. Non ci sono dentro in questo momento, ma ci sono stato dentro e fuori e ho bisogno di più tempo per pensarci. Ma sì, mi piace.

Qual è il tuo modo preferito per giocare la carenza di fosfuro di indio?

Fondamentalmente Lumentum. E come cosa più rischiosa puoi fare AXT, e poi per i semiconduttori l'azienda tedesca AIXTRON. Quindi queste tre.

Cosa pensi sia più sopravvalutato al momento?

Direi microLED perché penso sia una bufala. Ci sono circa sette alternative al microLED e sono tutte oggettivamente migliori. Quindi sì, odio proprio il microLED.

GE Vernova.

Ne possiedo molte. Ho comprato un sacco di azioni a circa 170 in uno dei miei conti long-only. Il mio prezzo medio è tra 170 e 250. Ed è andato sulla luna e, beh, immagino di non venderlo mai. Quindi sì, è fantastico. Turbine a gas. Sono stato fortunato, qualcuno mi ha avvisato presto. È un fossato di altissima qualità. Sono una delle poche persone che possono fabbricarlo. Ma a questo punto sono completamente prenotati e il titolo si è mosso così tanto che non sono sicuro di come si possa far salire ulteriormente il titolo. Da dove arriva la capacità, o gli aumenti di prezzo? Non lo so.

Alcuni dal tuo portafoglio long-only: Besi, Rigaku, TSMC o Fujikura, qual è il più entusiasmante?

Rigaku.

Sono raggi X per il packaging avanzato?

Besi si è già mossa così tanto, quindi comprare a questi livelli, non so. Ma Rigaku, quindi i player tradizionali sono Camtek e Onto, e fanno ispezione ottica per il packaging avanzato. Queste macchine a raggi X erano tradizionalmente utilizzate per scopi di R&S. Quindi diciamo che sei TSMC e stai cercando di sviluppare il tuo nodo a 2 nanometri, la parte di R&S, devi davvero guardare dentro e capire cosa sta succedendo, compri una manciata di queste macchine Rigaku e le usi per R&S e non le usi mai più. Ora si è arrivati al punto in cui, a causa dei transistor gate-all-around, della distribuzione di potenza sul retro e delle tolleranze molto più strette sulla prossima generazione di packaging avanzato, devi usare queste macchine a raggi X. Sei fregato con l'ottica. Quindi Rigaku sta passando da una nicchia di R&S alla produzione. E Onto sa di essere fregata perché ha comprato il 27% di Rigaku come partnership strategica. E fondamentalmente, il software che gira sulle macchine Rigaku è il software Onto. Quindi un sacco di persone pensano: "Oh, questo è rialzista per Onto." No, non lo è. Sanno di non poter fabbricare le macchine, quindi vanno a comprare un quarto della capitalizzazione di mercato dell'azienda che può fabbricare le macchine e vendono solo software a lato. Cioè, compra Rigaku. Quindi sì, questo è il mio tipo preferito di semiconduttore specializzato di nicchia. Lo adoro.

Dal tuo conto trading: Tower Semi, Lumentum, Intel, Bloom, Semtech, qual è il più entusiasmante?

Semtech. Decisamente Semtech. Gli altri sono saliti molto. Semtech, penso ancora che le persone non capiscano appieno cosa producono.

La mia comprensione molto ingenua è che fa funzionare meglio il rame?

È vero, ma è solo una piccola parte della storia. Producono amplificatori analogici ed equalizzatori analogici. E la bellezza è che questo funziona nei cavi di rame attivi, funziona sui PCB, funziona nell'ottica lineare pluggabile, funziona nei ricetrasmettitori tradizionali, funziona nella cosa Arista XPO, funziona nell'ottica vicino al package. È fottutamente tutto. Non è solo rame, è tutto. È fantastico. E hanno le parti di altissima qualità. È fondamentalmente un duopolio tra loro e MACOM. E le parti Semtech sono semplicemente migliori. Ho visto le schede tecniche. Ho usato queste cose. Quindi ci sono molte persone della finanza, fanno queste chiamate con esperti con qualche uomo d'affari: "Oh sì, stiamo facendo doppia fonte, bla, bla, bla." Io penso: "Amico, in che rapporto? È probabilmente il 90% Semtech perché le parti Semtech sono molto migliori." Quindi sì, Semtech ha molto più margine di crescita. È fottutamente fantastico. È ovunque. Non è solo rame.

Sui diversi segmenti, basso, medio o alto, quanto pensi che sarà teso. HBM.

Sì, alto.

Fotonica al silicio, ottica, CPO.

Anche alto. Visto cosa è successo a Tower.

Cosa è successo a Tower?

Le persone stanno pagando Tower in anticipo per la capacità nel 2027, 2028. Il loro titolo è salito del 15%. È una corsa da miliardi di dollari. Stanno esaurendo la capacità.

C'è un sottoinsieme dell'ottica che pensi sia più importante?

La parte del fosfuro di indio, i laser.

Packaging avanzato.

Non penso che sarà così importante perché Intel sta aumentando molto la capacità. Intel ha molta capacità in Malesia, credo.

Opinioni su EMIB?

Sì, EMIB è buono. Intuitivamente puoi pensare a EMIB come fondamentalmente la stessa cosa di CoWoS-L. Ci sono alcune questioni tecniche, ma dal punto di vista del progettista è la stessa cosa. Il problema con EMIB 18 mesi fa era che Intel era un po' idiota nelle loro regole di progettazione e nel servizio clienti, ed era orribile. E poi è arrivato Lip-Bu Tan e ha licenziato un sacco di persone e ora va bene. E ora le persone stanno spostando cose su EMIB perché, uno, TSMC non ha abbastanza capacità CoWoS, e due, TSMC preferirebbe usare lo spazio della loro camera bianca per un margine lordo del 60-70% su N3 piuttosto che usarlo per CoWoS. Quindi penso che la situazione del packaging avanzato, almeno rispetto ad altre cose, non sarà così grave come la gente pensa. Altre cose saranno peggiori.

Substrati ABF.

Non ne so abbastanza.

HBF.

Non mi piace per niente la memoria flash ad alta larghezza di banda. Non penso sia una buona soluzione perché avrà problemi di resistenza. Quindi semplicemente non mi piace. Non voglio nemmeno vederlo come un collo di bottiglia. Penso solo che sia una cattiva idea. Se hai intenzione di usare la flash per questo tipo di cose, allora devi renderla inseribile in un socket. E se è inseribile in un socket, non hai bisogno di impilarla. Puoi semplicemente metterla intorno al controller CXL e metterla in un server da qualche parte.

Wafer.

Wafer di fosfuro di indio, piuttosto male. Wafer di carburo di silicio, no. Wafer normali, no, probabilmente va bene.

PCB.

È male. La roba ad alta velocità, la roba di altissima qualità per l'alta velocità che supporta SerDes a 200 Gb/s, sì, è piuttosto male. Tutti sono più o meno esauriti.

Hai un gioco preferito lì?

Ho comprato e venduto TTMI, ma ora è salito così tanto che non voglio preoccuparmene. Quindi sì, non so su chi puntare lì. Ci sono anche molti player che non seguo a Taiwan. È uno dei settori con cui non ho a che fare.

Energia e Trasformatori.

Entusiasmante, sì. Collo di bottiglia, no. C'è molta capacità di fabbrica inattiva. Ma più entusiasmante, sì.

Entusiasmante perché è tecnicamente interessante per te?

Tecnicamente interessante ed è la prossima cosa che esploderà. Cioè, una grande parte del motivo per cui il titolo Lumentum non si è mosso sugli utili, è sceso e poi è risalito, è che Hurlston sta dicendo a tutti: "Beh, abbiamo venduto tutto per i prossimi due anni", e questo dice alle persone della finanza: "Ok, quindi non può migliorare in termini di potenziale di rialzo." Wolfspeed ha il potenziale per fare 5X. Potrebbe essere davvero stupido. E poi tutti i normali produttori di semiconduttori di potenza, Infineon, TI, onsemi, STM, possono raddoppiare. Possono raddoppiare. Non è prezzato. Altre cose sono prezzate. Questo no.

Switch di rete.

Va bene. Competono solo con i wafer logici e c'è bisogno di un po' di CoWoS, ma non così tanto. Va bene.

Fibra ottica.

Non è eccezionale in questo momento. Ci sono alcuni problemi. Non penso sia grave come altre cose, quindi diciamo medio. Specificamente la fibra che mantiene la polarizzazione. C'è un tipo più costoso che serve in certe situazioni.

Raffreddamento a liquido.

Va bene. Non ho sentito parlare di problemi.

Cose di assemblaggio e test.

Puoi aumentare la capacità. Sta aumentando. Non è difficile aumentarla.

CPU.

Grosso problema. Sì, grosso problema. Intel può aumentare la capacità fino a un certo punto. Ecco perché il titolo è salito così tanto. AMD, ha aumentato la capacità in una certa misura, nel senso che stanno usando il loro vecchio design di CPU su N5 e lo stanno riavviando. Ma ora che lo hanno fatto, se la situazione delle CPU peggiora, cosa faranno? Se fossi AMD, vorrei prendere la mia allocazione TSMC, vendere GPU o CPU? Devi scegliere. ARM non ha wafer. Qualcomm. Per quanto mi dispiaccia ammetterlo, l'unica cosa che può aiutare la situazione delle CPU è Qualcomm perché hanno molti wafer da TSMC.

Ma il fatto è che Qualcomm è l'unico grande player che ha capacità di wafer e può riconvertirla alle CPU perché, se Android continua a cadere da un dirupo, hanno ancora quei wafer ordinati da TSMC. Possono semplicemente dire a TSMC di stampare il design della CPU invece. Ed è per questo che Qualcomm è salita così tanto, perché le persone sperano. Qualcomm ha fallito circa tre volte con le CPU per data center. Questo è il loro terzo o quarto tentativo. Se non ci riescono questa volta, non c'è davvero speranza. Deve solo funzionare. Se funziona, la gente lo comprerà e loro faranno un sacco di soldi e salverà l'azienda dall'implosione di Android e dalle imminenti cause legali di Apple.

Hai un gioco preferito sulle CPU?

Preferisco Intel per le CPU perché niente mi farà comprare Qualcomm. Ma le persone nei fondi mi hanno chiesto: "Oh, dovrei comprare Qualcomm per le CPU?" Beh, puoi se vuoi fidarti di questi idioti. Ma io no. Ma certo, se vuoi andare, vai pure. Ammetto che hanno molta capacità e potrebbero farcela.

Anche la DRAM sarebbe alta?

Sì, fondamentalmente vedo DRAM e HBM come equivalenti.

Hard disk.

Nessuna opinione. Immagino che con la NAND in carenza, forse anche gli hard disk stanno diventando più stretti. Non ne so abbastanza.

Shell di data center.

Non seguo quella roba. Nessuna opinione.

I semiconduttori di potenza sarebbero alti per te?

No, ora sono bassi. Non sono un collo di bottiglia ora, ma lo saranno tra un anno. Ecco perché è la cosa più interessante perché ha il potenziale di rialzo.

NAND.

Penso che la DRAM abbia un premio. Anche la NAND è in carenza come la DRAM, ma penso che la NAND sia più pericolosa perché è più incline all'eccesso di offerta rispetto alla DRAM. Ma sì, collo di bottiglia alto, ma direi che preferisco la DRAM alla NAND.

Ci sono cambiamenti nei modelli, come contesto lungo, più RL, modelli del mondo, che ti aspetti cambieranno molto le richieste hardware?

Penso sinceramente che tutti si stiano muovendo verso una maggiore lunghezza del contesto. C'è valore economico in questo. Le persone sono disposte a pagare per una maggiore lunghezza del contesto. Quindi questo danneggerà tutta la memoria, tutto. Questa è solo l'opinione generale di alto livello. Non seguo così tanto l'architettura del modello. Ma dal lato economico, sì, le persone vogliono una lunghezza del contesto super lunga o una lunga catena di token.

Se fossi Jensen, quale fornitura cercheresti di bloccare dopo?

Ha già bloccato tutta la fornitura per tutte le cose. Stavo per dire fibra e poi ha fatto l'accordo con Corning. Penso che l'uomo sia un dio e abbia già bloccato tutto. Penso che lo abbia effettivamente fatto.

Paghi per qualche fonte di informazioni e quali?

Ho un abbonamento a SemiAnalysis, Fabricated Knowledge, FundaAI, e ho Citrini. Queste sono le uniche quattro per cui pago.

I primi tre o cinque account su X che ti piacciono.

Mi piace Clive Chan (@itsclivetime) di OpenAI, ma non pubblica quasi mai nulla. C'è il tipo Suspended Cap (@ContrarianCurse), è interessante. TBU (@TBU12345678). TBU mi piace molto. Outspoken Geek (@OutspokenGeek). Jukan (@jukan05) dà buone informazioni. Max Cherney (@chernandburn) di Reuters. Mi piace. Thomas, non pubblica quasi mai, ma Thomas Sohmers (@trsohmers) di Positron, ogni tanto pubblica cose utili. Sravan (@SKundojjala) di SemiAnalysis pubblica roba buona di tanto in tanto. E poi Citrini (@citrini). Oh, Bucket Shop Capital (@bucketshopcap). Mi piace. Dan Nystedt (@dnystedt).

Analisti del sell-side che apprezzi. Stacy Rasgon è uno di questi.

Sì, mi piace Stacy Rasgon (@BernsteinRasgon) e Vivek Arya (B of A). Timothy Arcuri (UBS). In pratica, chiunque abbia il coraggio di fare una domanda scomoda, mi piace.

Qual è stata la cosa che ti ha fatto cedere sull'HBM?

Questa è più una tesi a lungo termine. La cosa che mi ha fatto cedere è sostanzialmente la tesi di Nick Gagnet di Coatue. L'idea che i produttori di memoria verranno rivalutati, non saranno più basati sul price to book, ma sull'EPS.

Quale pensi sarà il tuo modo per giocare la memoria?

Non lo so, ci sto ancora pensando. Hynix avrà presto un ADR. Non sono sicuro se aspetterò quello o tornerò su Micron.

Fai una configurazione a due portafogli, uno long only e uno trading, giusto per tenere la mente lucida?

Sì, psicologicamente, solo nelle ultime due settimane ho avuto giorni in cui il mio conto trading era in rosso di un quarto di milione di dollari e io ero completamente imperturbabile perché ho il mio conto long only. Quindi la gente mi chiede: "Oh, come fai a essere così pazzo, come gestisci questa volatilità?" Perché non mi interessa. Ho un conto separato. Prendo molto seriamente il mio stesso consiglio: non investire ciò che non puoi permetterti di perdere. Il mio conto trading potrebbe andare a zero e per me va bene. Ho ancora i miei conti long only. E non è salutare avere accesso al margine e tutti i tuoi soldi in un unico posto. Quindi è così che gestisco il rischio.

Qual è l'unica azienda che consiglieresti ai tuoi genitori, un buy and hold da 10 anni?

Intel, perché Intel è una detenzione a lungo termine pazzesca. Anche Broadcom, Keysight. SiTime, ma forse non a questi prezzi. Nvidia, ovviamente. TSMC. Queste sono da comprare ciecamente a lungo termine.

Broadcom, immagino che tutti i loro clienti vogliano aggressivamente eliminare la loro dipendenza da loro, o non è un problema?

Google ci sta provando. Non sta andando bene, te lo dico io. Oltre a Lumentum, l'altro grande player nell'indio fosfuro è in realtà Broadcom. Non molti lo sanno. Broadcom ha una divisione laser gigantesca. Un'azienda molto ben diversificata.

@insane_analyst

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Altri pattern da decodificare

Articoli virali recenti

Esplora altri articoli virali