Évaluation des goulots d'étranglement de la chaîne d'approvisionnement en IA : Entretien avec Irrational Analysis (@insane_analyst)

Voici mon entretien avec Irrational Analysis (@insane_analyst) à propos des goulots d'étranglement dans la chaîne d'approvisionnement de l'IA. NFA, je possède ou pourrais posséder certains de ces éléments à l'avenir.

Quels accélérateurs alternatifs pourraient effectuer une part très significative de l'entraînement ou de l'inférence dans trois à cinq ans ?

Pour l'entraînement, je pense qu'ils sont tous plus ou moins nuls. Pour l'inférence, je suis un très grand fan de Positron et Cerebras, mais pour des raisons très différentes. Qui d'autre ? MatX. Le problème avec MatX, c'est que je n'ai pas assez d'informations. Donc peut-être que c'est bien, mais je ne sais rien d'eux. La réponse rapide serait donc Positron et Cerebras. Il y a aussi Taalas, où je ne crois pas au postulat de base, mais c'est très cool et j'ai envie de les promouvoir un peu parce que si le postulat fonctionne, c'est incroyable. Mais je ne pense pas que les gens de l'IA seront tolérants envers ce postulat. Voilà, ce sont en quelque sorte les trois grands que j'apprécie vraiment, avec MatX en retrait parce que je ne les connais pas assez. J'essaie encore de les faire parler avec moi.

Le postulat de Taalas avec lequel tu n'es pas d'accord, ce sont les poids fixes ?

Ce qu'ils font, c'est utiliser une couche de masquage supérieure pour graver les poids. Donc une fois que tu as les poids, tu ne peux pas les changer. Et vu la vitesse à laquelle les modèles d'IA évoluent, toutes les deux semaines il y a GPT 5.5 puis 5.6. Si tu parles aux gens qui travaillent dans ces entreprises, en interne le modèle change constamment. Il y a un hexadécimal à la fin du modèle. Toutes les deux semaines, il y a une mise à jour. Les poids changent constamment et sont affinés.

Maintenant, ce que Taalas dit, c'est qu'ils supportent le fine-tuning. Je pense que ce qu'ils veulent dire, c'est que la puce actuelle permet une certaine modification des poids, mais pas autant qu'on le souhaiterait. Leur puce actuelle est composée aux deux tiers de poids codés en dur et d'un tiers de machine SRAM. Et la raison pour laquelle ils peuvent supporter le fine-tuning, c'est qu'un tiers est en SRAM, et tu peux avoir un sous-ensemble des poids que tu peux changer ou affiner, faire des trucs LoRA. Et ils parlent essentiellement aux clients en disant : « Eh bien, votre modèle tournera beaucoup plus vite si vous codez en dur, mais vous avez ce compromis. » Maintenant, dans un monde idéal, quelqu'un pourrait concevoir un modèle où 90 % des poids sont codés en dur (je invente ces chiffres). Ça tournerait super vite. Et puis 10 % seraient utilisés pour LoRA ou la mise à jour des poids. Maintenant, est-ce qu'un gros poisson acceptera ce niveau de contrainte ? Je ne sais pas. Je ne pense pas. Mais l'ingénierie derrière ce que fait Taalas est en fait super, super intelligente.

Ils utilisent une couche de masquage supérieure. Les puces ont environ 14 couches de nos jours, disons 14 ou 15 couches. Ils prennent une des couches dans le tiers supérieur du masque et l'utilisent pour programmer les poids et les coder en dur. Donc si tu y réfléchis, normalement une conception de puce prend au minimum trois mois, généralement plus, pour la conception. Ensuite tu dois faire le tape-out et ça prend cinq à six mois pour que les puces reviennent, puis tu dois les vérifier. Taalas a dû créer une série d'outils EDA personnalisés pour leur compilateur, leur pile de vérification et la conception de la puce, et ils prétendent qu'il leur faut un jour pour faire un nouveau modèle. Éventuellement. Pour l'instant, ça prend environ une semaine. Donc c'est une semaine pour la conception, et ensuite, comme ils ne changent que la couche supérieure, une des couches supérieures, ils peuvent stocker des wafers. Donc si tu vas chez TSMC ou n'importe quelle fonderie, c'est une pratique très courante dans l'industrie, tu peux dire : « Hé, je veux que tu gardes X nombre de wafers à environ 70 % d'achèvement, ne finis pas la dernière partie parce qu'on fait de la R&D ou autre. » Donc Taalas peut avoir un délai d'exécution beaucoup plus rapide que ce que je pensais initialement. C'est une semaine pour la nouvelle conception, puis environ deux mois. C'est mon estimation, certainement pas six mois. Donc en deux mois, tu peux récupérer les puces et les faire fonctionner. Et ils prétendent avoir créé des outils de compilateur Verilog très intelligents et des outils de simulation threadée pour s'interfacer avec les outils EDA standard et tout vérifier très bien. Donc la validation post-silicium ne devrait être rien, car l'infrastructure de la puce est déjà validée et tu ne changes que les poids. Ils ont pris un processus d'au moins un an du début à la fin et l'ont réduit à théoriquement deux à trois mois, ce qui n'est pas si mal.

D'un point de vue architecture de modèle, je suis plutôt un spécialiste du matériel. Je ne comprends pas l'architecture des modèles. J'avais du mal à comprendre comment avoir quelque chose où la plupart des poids sont fixes et où tu ne changes que certains poids, comme les poids d'une seule couche ou des trucs comme ça. Et puis j'ai découvert LoRA et j'ai demandé à des gens qui comprennent bien l'IA et ils m'ont dit : « Oh non, LoRA, tu ne peux pas le passer à l'échelle ou quoi. C'est nul. Seuls les losers utilisent LoRA. » Mais si le postulat fonctionne, s'ils trouvent un client prêt à utiliser LoRA ou un autre système algorithmique où une grande partie des poids est fixe et qu'on va servir ce modèle en continu, donc ce sera économique, les chiffres de Taalas sont incroyables. La puce est très bon marché. Elle n'a besoin d'aucune HBM ni mémoire d'aucune sorte. Elle n'a besoin d'aucun packaging avancé. Même le PCB, ils sont vraiment limités par la latence sur la communication puce-à-puce, ils ne sont pas du tout limités en bande passante. Donc ils utilisent PCIe et CXL et leur principale limite actuelle est qu'ils n'ont pas la dernière version de CXL sur leur puce et apparemment CXL 3.0 leur apporte des fonctionnalités qui les aideront significativement. Mais ça va encore pour l'instant. Donc tu auras des performances incroyables (littéralement impossibles dans toute autre architecture) à des prix très bas. C'est juste que tu as cette limitation : une grande partie des poids, probablement entre 50 et 90 %, doivent être fixes et tu ne peux pas les changer. Mais pour les changer, tu devrais jeter toutes tes puces ou la plupart, puis attendre deux à trois mois, et le coût de création d'une nouvelle conception est d'environ un quart de million de dollars.

Prends le PDG de Taalas. Il a donné une interview où il a dit que le coût de la conception de la puce, une nouvelle version de la puce, est « le même qu'un serveur H100 ». Donc disons que tu gères un centre de données, il sert un modèle avec des puces Taalas, tu décides de jeter toutes tes puces Taalas parce que le modèle doit être mis à jour. Tu dois donc amortir ce capex, tu dois donner à Taalas 300 à 500 000 dollars supplémentaires. Dans le pire des cas, ils fabriquent de nouvelles puces pour toi en deux à trois mois et tu les déploies. Et encore une fois, il n'y a pas de problème de mémoire. Il n'y a même pas de problème de PCB. Tu peux utiliser des matériaux PCB de mauvaise qualité parce qu'ils tournent juste sur du PCIe très lent. Donc ça pourrait marcher. Je ne sais tout simplement pas assez sur les modèles pour voir si ça va fonctionner.

Différentes couches de la pile : lesquelles penses-tu finiront par être les plus contraintes en termes d'approvisionnement dans les années à venir ?

Oui, c'est un peu tout. Si tu m'avais demandé en janvier ou février, j'aurais donné une réponse très différente, mais maintenant tout est contraint.

Pourquoi le marché a-t-il commencé à devenir fou à ce sujet vers septembre dernier ?

Je ne comprends pas ça. Parfois le marché est vraiment bizarre et je parle à beaucoup de ces gars des hedge funds et je me dis : « Vous êtes intelligents, pourquoi réalisez-vous ça maintenant ? » C'est bizarre.

Est-ce que la vision macro est que tout le monde réalise maintenant que les capex des hyperscalers vont continuer à augmenter, au moins en valeur absolue ?

Oui, le truc macro, c'est que les gens changent constamment d'avis. Je vais te donner un exemple amusant. On m'a dit que les investisseurs traditionnels dans l'énergie sont tous à découvert sur Bloom parce qu'ils se disent : « Oh, Bloom est trop cher, les turbines à gaz naturel sont moins chères, c'est une bulle. » Et je leur dis : « Les gars, c'est une question de délai de mise en service. Vous avez complètement raté le coche. »

Ils ne comprennent pas les contraintes de cet ensemble de clients.

Je sais. Vous ne comprenez pas pourquoi les gens choisissent ça. Ce n'est pas parce que c'est moins cher. Les coûts par mégawatt ou autre sont nettement moins bons. Mais tu peux l'avoir maintenant. Et si tu dois retarder ton projet de centre de données d'au moins six mois, je parle à des hedge funds plus axés sur l'IA et les semi-conducteurs, et ils me disent : « Oh, on connaît ces autres hedge funds énergétiques qui sont à découvert sur Bloom. Pourquoi serais-tu assez suicidaire pour vendre à découvert ça ? » Il se passe beaucoup de choses étranges dans le monde de la finance. Je ne peux pas l'expliquer.

Quelles autres couches finiront par être des goulots d'étranglement ?

Le phosphure d'indium est vraiment très mal en point. C'est complètement fou. Je ne sais pas ce que beaucoup de gens vont faire, mais le phosphure d'indium, tout ce qui est lié au phosphure d'indium, est vraiment, vraiment, vraiment mal en point.

Le phosphure d'indium est utilisé pour les lasers et l'optique, car le silicium ne peut pas générer de lumière. Et les gens ne comprennent toujours pas à quel point c'est grave, car le CPO pousse les exigences pour les lasers en termes de performance de bruit.

C'est Aixtron, par exemple ?

Oh, oui. Ils fabriquent l'équipement pour la fabrication du phosphure d'indium. Ils ne sont pas vraiment le goulot d'étranglement, enfin ils le sont probablement, mais ils fabriquent plus de machines et les Lumentum, Coherent et Sumitomo du monde achètent ces machines. Je suis long sur ces trucs. C'est plutôt la capacité de Lumentum et Coherent. Le monde des substrats, AXT, Sumitomo, IQE, tous ces gars, ils sont le goulot d'étranglement.

C'est quoi IQE ?

Il y a cette entreprise britannique, je pense qu'ils font l'épitaxie. Il y a tout un tas de noms dans cette chaîne de fabrication du phosphure d'indium. Et c'est globalement un désastre en ce moment.

Il n'y a tout simplement pas assez de phosphure d'indium pour le monde, en gros ?

Oui, enfin, les mines de phosphure d'indium vont bien, je pense, pour l'instant. Mais le traitement du phosphure d'indium en cristal, puis la prise du wafer, puis l'épitaxie du wafer, puis l'impression des lasers sur le wafer, tout ça, c'est un désastre complet. Parce que la façon dont fonctionnent les lasers CPO, ils doivent être beaucoup plus puissants, ce qui signifie que la taille de la puce doit être significativement plus grande, et ils nécessitent une largeur de ligne beaucoup plus étroite et une meilleure performance de bruit, ce qui signifie que tu dois augmenter la taille de la puce en général.

C'est aussi une des raisons pour lesquelles SiPho et Tower Semi montent en flèche. Traditionnellement, le fonctionnement du monde des transceivers était le suivant : tu commences avec un EML, qui est essentiellement une seule puce monolithique en phosphure d'indium qui contient le modulateur qui fait osciller la lumière de haut en bas et le laser à onde continue, le tout sur la même puce en phosphure d'indium. Et l'EML a toujours de meilleures performances que la photonique sur silicium pour des raisons physiques. Et généralement, après un ou deux ans, après chaque génération de transceivers (comme 400G ou 800G), les gens commencent à passer au SiPho pour économiser de l'argent. Tu trouves comment rendre les performances du SiPho suffisamment bonnes et tu économises de l'argent car au lieu d'acheter un gros EML, tu achètes un laser à onde continue beaucoup plus petit et tu le mets dans le module SiPho et tu modules là.

Mais bon, cette fois-ci, SiPho a décollé parce que tout le monde se dit : « Attends, il y a une pénurie d'EML », et ensuite les mêmes personnes qui fabriquent les EML fabriquent aussi les lasers CW et ils réaffectent leur capacité au CW parce que c'est une marge plus élevée et qu'il y a plus de demande. Donc maintenant, la demande CPO tue l'offre d'EML qui était déjà largement sous-approvisionnée. Et maintenant, les transceivers 1,6T sont la première génération où SiPho est dominant, presque dès le départ. Je pense qu'en six mois, il avait la part majoritaire. Je ne connais pas les chiffres exacts, mais c'est complètement différent. Si tu regardes chaque génération de transceivers et la part de marché SiPho vs EML, cette fois-ci c'est complètement différent. Et c'est parce qu'il y a une pénurie tellement paralysante de phosphure d'indium.

En ce qui concerne le prochain, je dirais la mémoire, car il n'y a tout simplement pas de capacité de salle blanche. Quelqu'un m'a posé cette question, qui n'est pas complètement stupide : « Oh, Samsung, ils ont des fabs logiques et des fabs mémoire, pourquoi ne réaffectent-ils pas la ligne de fab logique à la mémoire ? » Parce que les fabs mémoire sont complètement différentes dans l'équipement qu'elles utilisent, le processus et tout. Donc tu n'as que trois entreprises capables de fabriquer de la DRAM. Elles sont toutes complètement réservées. Il n'y a pas de capacité qui arrive de sitôt.

C'est Hynix, Micron et Samsung ?

Oui, ces trois-là. Donc c'est le deuxième pire goulot d'étranglement. Mais les gens en sont assez conscients.

Y a-t-il une grande différence entre les trois fabricants de mémoire ?

Personnellement, je ne pense pas que ça ait de l'importance. Il y a beaucoup de drames et de bruit. Il y a une telle pénurie. Tout se vendra avec des marges brutes de 80 %. Qui s'en soucie ? Historiquement, SK Hynix était nettement en tête et Samsung était en quelque sorte en train de s'autodétruire. C'était assez mauvais. Et Micron était en quelque sorte en deuxième position. Et maintenant, il y a beaucoup de drames sur les vitesses des dies HBM4, tout ce bruit des fuiteurs de la chaîne d'approvisionnement. Fondamentalement, avec HBM, tout le HBM avant HBM4, 3E, 3, tout ça, le die de base, qui contient un tas de circuits logiques pour l'interface, était fabriqué sur un nœud de processus DRAM interne. Maintenant, la raison pour laquelle c'est important, c'est que c'est moins cher parce que les gars de la DRAM utilisent leurs propres fabs pour le fabriquer. Mais la qualité des transistors est bien pire. La DRAM est conçue pour des transistors lents et minuscules et des condensateurs géants, pas pour la conception logique, donc tu es limité en vitesse.

Donc avec HBM4, tout le monde a été en quelque sorte forcé d'abandonner cette stratégie. Enfin, ils auraient dû abandonner cette stratégie. Ce qui s'est passé, c'est que SK Hynix est allé chez TSMC et a commencé à utiliser un processus de classe 12 nanomètres. Donc bien meilleur que la camelote qu'ils pouvaient assembler avec le processus DRAM interne. Mais c'est quand même du 12 nanomètres, pas très bon. Samsung a son propre nœud logique interne SF4X et ce n'est pas du 4 nanomètres, je dirais qu'au mieux il est à égalité avec TSMC N6, ou entre TSMC N6 et N7. C'est assez bon pour ce qu'il doit faire. Micron est stupide. Ils ont dit : « Non, on va utiliser notre propre processus DRAM interne. » Et ils se sont en quelque sorte tiré une balle dans le pied et se sont retardés. Et il y a tout ce drame : « Oh non, Micron, ils ne vont pas entrer dans Nvidia Rubin. » Et personne ne s'en soucie. Ils vendront juste plus de DRAM standard ou de HBM3E à des prix exorbitants. Rien de tout cela n'a d'importance. Les trois vont vendre tout ce qu'ils ont à des prix assez élevés. Et l'écart de qualité est maintenant assez proche. Avant, le HBM3 de Samsung était si mauvais que personne ne pouvait l'utiliser. À aucun prix certaines personnes n'utilisaient le HBM3 de Samsung parce qu'il avait beaucoup de problèmes de puissance. Il bouffait de l'énergie. Mais maintenant, ils sont tous assez proches pour que, d'accord, disons que Nvidia a des normes plus élevées et rejette le HBM4 de Micron, ils vendront le HBM4 à quelqu'un d'autre ou ils vendront simplement de la DRAM standard avec des marges brutes insensées. Cela n'affectera pas financièrement Micron. Donc il y a eu beaucoup de drames en coulisses à ce sujet et je pense que c'est franchement stupide.

Quand tu dis mémoire, tu parles spécifiquement de DRAM ou de HBM et DRAM ?

Oui, quand je dis DRAM, j'inclus HBM là-dedans. C'est la même chose. La mémoire, je la catégorise en DRAM et NAND flash. Ce sont les deux catégories. La DRAM, c'est toute la mémoire qui n'est pas de la NAND flash.

Le troisième goulot d'étranglement que tu as mentionné, ce sont les fabs logiques ?

Tu peux voir Intel monter en flèche, ça se règle. Le truc, c'est que TSMC n'a tout simplement pas assez de capacité. Ils ont été trop conservateurs. Il y a six mois, Samsung n'avait pratiquement aucune utilisation, presque aucune, sur leur logique avancée. Et Intel était interne uniquement. Maintenant, des entreprises externes affluent et Samsung obtient également une utilisation assez élevée. Donc il y a eu une sorte de flex où la situation logique semblait vraiment mauvaise en février. Maintenant, c'est mieux. C'est encore assez mauvais, mais ça ne s'est pas aggravé. La mémoire et le phosphure d'indium se sont aggravés au cours des six derniers mois. La logique s'est améliorée, mais c'est encore assez mauvais car il faut beaucoup de temps pour construire ces lignes, et encore une fois, il n'y a que trois acteurs : Samsung, Intel, TSMC.

Quels autres goulots d'étranglement se sont aggravés au cours des six derniers mois ?

Non, c'est principalement ces deux-là en termes de catégorie. Je ne pense pas que les semi-conducteurs de puissance deviendront mauvais, mais je pense que c'est la catégorie la plus intéressante, car il y a beaucoup de capacité libre parce que la situation des véhicules électriques n'était pas bonne.

Peux-tu expliquer les semi-conducteurs de puissance ?

Les semi-conducteurs de puissance changent la puissance d'une tension à une autre. Tu peux le voir comme ça. Tu as ton réseau électrique qui est de plusieurs milliers de volts en courant alternatif. Tu dois le convertir en courant alternatif plus bas, puis tu dois finalement le convertir en tension continue. 800 volts CC, 400 volts CC, 240 volts CA. Et finalement, après plusieurs étapes, ta puce logique haut de gamme consomme environ 1,2 volt, à peu près. Pour être plus précis, chaque puce logique haut de gamme, les puces 3 nanomètres, la tension standard est d'environ 0,75 volt. Et puis il y a des tensions côté haut d'environ 1,1 volt ou 1,5 volts. Donc tu dois passer d'une tension très élevée à une tension beaucoup plus basse pour la puce. Tu as donc besoin de plusieurs étages de conversion. Et il existe ces matériaux appelés matériaux à large bande interdite, le carbure de silicium et le nitrure de gallium, qui sont bien meilleurs que le silicium pour des raisons physiques.

Plus efficaces, donc tu économises sur les coûts énergétiques et moins de refroidissement, ce genre de choses ?

Oui, exactement. Plus efficaces. Et ils peuvent tolérer des tensions beaucoup plus élevées. Tu essaies de mettre une puce en silicium à la même place, elle brûle, elle se grille.

Quel est ton préféré parmi ceux que tu as mentionnés : TI, Navitas, onsemi, Infineon ?

Eh bien, ce week-end, je publierai l'article. Il est presque terminé. En ce moment, dans le GaN, TI et Navitas sont à égalité pour la première place et Infineon est un deuxième loin derrière. onsemi prétend avoir quelque chose d'incroyable appelé GaN vertical. Mais ce ne sont que des slides. Pas de fiches techniques, pas de spécifications réelles. C'est juste : « On a fabriqué un truc et ça va avoir tous ces chiffres incroyables. » D'accord, bien sûr. Donc onsemi, peut-être qu'ils ont quelque chose, peut-être pas. Dans le carbure de silicium, je n'ai pas encore compris, j'ai besoin de quelques jours de plus. Mais l'acteur intéressant dans le carbure de silicium, c'est une action mème, mais ce n'est pas non plus une action mème. C'est Wolfspeed.

Parle-moi de Wolfspeed.

Ils ont massivement surconstruit leur capacité. Ils sont 100 % carbure de silicium et ils sont intégrés verticalement. Ils fabriquent les wafers, les substrats, ils fabriquent les dispositifs, ils font tout en interne.

Aparté : les hedge funds te contactent et veulent juste avoir ton avis sur des trucs, et tu le fais parce que c'est amusant et que ça te permet de voir quelles questions ils posent ?

J'apprends aussi. Je comprends comment ces gars pensent. Parce que je ne suis qu'une fourmi. Je ne fais pas bouger le marché. Ces gars font bouger le marché. Ils partagent aussi des idées. Spécifiquement, Wolfspeed vient d'une conversation avec un hedge fund.

Wolfspeed vient d'une conversation avec un hedge fund ?

Ça vient de cinq. C'est une action très intéressante. Ils sont intégrés verticalement, 100 % basés aux États-Unis. Ils ont surconstruit le carbure de silicium, et ils ont été tués par la concurrence chinoise et le ralentissement des véhicules électriques. Ils ont littéralement fait faillite, chapitre 11. Ils sont sortis du chapitre 11 assez récemment, je pense il y a environ quatre mois. Je dois vérifier. Mais c'est très récent. Tout le monde a arrêté d'acheter chez eux parce que ton fournisseur est en faillite. Donc leur utilisation d'usine est d'environ 30 %, paraît-il. Très, très faible. Et maintenant ils sont de retour. Et le truc, c'est que si le marché bascule en quelque sorte, cette action est un 5X. C'est tellement levé et débile. Mais elle vient littéralement de faire faillite. Et elle a des marges brutes négatives. Tu peux regarder leur dernier rapport de résultats. Leur marge brute est de moins 20 %. Et leurs prévisions sont : « Nous continuons de nous attendre à des marges brutes négatives. » Ils perdent littéralement de l'argent sur chaque puce qu'ils produisent parce qu'ils sont tellement sous-utilisés.

Maintenant, ce qui est intéressant, et pourquoi les gens me contactaient, c'est que Wolfspeed a sorti cette puce en carbure de silicium de 10 kilovolts. Ces puces sont littéralement juste un transistor, un transistor super, super costaud qui doit gérer des niveaux insensés de tension et de courant. Actuellement, les transistors en carbure de silicium les plus hautement évalués en tension sur le marché se situent dans la gamme de 1700 à 2000 volts. Infineon a un composant de 3,3 kilovolts. Personne n'a rien au-dessus sauf Wolfspeed. Wolfspeed dit : « Oh, on peut fabriquer un composant de 10 kilovolts. » Et je regarde la fiche technique et ce truc est insensé. Je ne sais pas comment diable ils l'ont fabriqué. Et ce n'est pas immédiatement évident de savoir si c'est mieux ou pire. Parce que les transistors sont juste des interrupteurs, et idéalement, quand tu allumes le transistor, tu veux que ce soit un interrupteur parfait, sans résistance. Mais ce n'est jamais vrai. Tu vas avoir une certaine résistance parasite. Donc quand un transistor est allumé, il agit comme une minuscule résistance (c'est simplifié). Je regarde la résistance parasite de ce composant Wolfspeed, et la capacité parasite de grille, qui nuit à la vitesse de commutation, et je le compare à des composants complètement différents, comme des composants de 2000 et 3000 volts de concurrents. Les parasites sont pires, mais tu n'as besoin que d'un seul de ceux-ci au lieu de trois. J'ai dû regarder des simulations de circuits pour comprendre. Je pense que le composant de 10 kilovolts est en fait assez bon. Et il sera utile pour l'infrastructure. Il est complètement inutile dans le centre de données. Et quand je dis ça à certains de ces gars des fonds, ils disent : « Oh non, ce n'est pas utile dans le centre de données. » Je leur dis : « Mec, tu passes à côté de la vue d'ensemble. Les transformateurs à semi-conducteurs. Tu veux une régulation de charge pour le réseau électrique entre la haute tension CA et le centre de données. »

Donc je suis beaucoup plus optimiste sur la distribution d'énergie qui se trouve juste à l'extérieur du centre de données que dans le centre de données. J'ai l'impression que tout le monde se concentre sur qui va gagner le rack d'alimentation dans le design Nvidia et le design OCP, physiquement dans le centre de données. Et c'est une opportunité attrayante. Mais les trucs à l'extérieur du centre de données, entre le centre de données et le réseau électrique, sont aussi super intéressants. En fait, sans doute plus intéressants. Donc oui, j'adore les semi-conducteurs de puissance. Je pense que ça va être la prochaine chose qui va décoller et devenir un goulot d'étranglement. Ce ne sera pas le principal goulot d'étranglement car il y a tellement de capacité supplémentaire qui traîne, puisque les véhicules électriques sont en quelque sorte morts. Mais c'est le plus excitant, là où les choses vont changer.

Tu es spécifiquement plus enthousiaste à propos de la distribution d'énergie à l'extérieur du centre de données plutôt qu'à l'intérieur ?

Tu as déjà vu en voiture ces trucs circulaires avec ces grosses boîtes près des sous-stations électriques ? Ce sont des transformateurs traditionnels. La façon dont ils fonctionnent, c'est que tu as un noyau de fer géant et puis tu as un tas d'enroulements en cuivre d'un côté et des enroulements en cuivre de l'autre côté. Et ce sont essentiellement des dispositifs principalement passifs où tu convertis du 100 kilovolts CA en 35 kilovolts CA, puis tu convertis le 35 kilovolts CA en 7 kilovolts CA, puis tu le convertis en 240 volts, 120 volts CA qui va dans ta maison. Ou en 2000 kilovolts CA qui va aux clients industriels, pour transmettre l'électricité sur de longues distances. Tu veux une tension extrêmement élevée pour réduire les pertes de puissance. Mais pour l'utiliser réellement, tu dois l'abaisser avec des transformateurs. Ces transformateurs sont généralement ces trucs passifs volumineux et ils sont nuls car il faut beaucoup de temps pour les acheter. Tu passes une commande maintenant (et c'était avant le truc de l'IA), et 12 à 18 mois plus tard ils te le donnent parce que c'est un énorme morceau de métal. Il faut juste beaucoup de temps pour le fabriquer.

Ce que les gens ne comprennent pas, je pense, c'est qu'ils ont un énorme problème avec les centres de données d'IA. Parce que, réfléchissez : imaginez que vous travaillez pour une compagnie d'électricité, PG&E ou autre. Vous avez ces nouveaux clients qui se connectent à votre réseau et que vous devez gérer, avec une charge qui monte et descend de façon agressive. Ces gars-là, ils disent : « Oh, on a besoin d'un gigawatt maintenant. » Et cinq minutes plus tard : « Non, en fait, on a besoin que de 800 mégawatts. » C'est un cauchemar satanique pour les opérateurs de réseau. Et je ne sais pas si vous avez vu ça, ça a circulé sur Twitter l'année dernière : l'équipe PyTorch a ajouté un flag spécial appelé « Power Plant No Blow Up ». C'était un truc amusant qui a fait le tour. Alors, à quoi sert ce flag ? Le problème, c'est que vous avez beaucoup de GPU, 10 000 GPU, 100 000 GPU. Ils font des calculs pour l'entraînement, puis une partie d'entre eux arrête de calculer ou calcule à un rythme beaucoup plus lent parce qu'ils font de l'interconnexion, ils communiquent entre eux, du all reduce et tout ça. Et ça provoquait une instabilité sur le réseau électrique. Et l'opérateur du réseau dit : « Quoi que vous fassiez, arrêtez, on va vous couper. C'est dangereux. Vous déstabilisez le réseau. » Donc, ce que fait le flag dans PyTorch, c'est que si le GPU n'a pas besoin de faire des calculs, on le force à en faire à pleine vitesse quand même. Il fait des calculs inutiles et envoie le résultat nulle part. Disons que votre puce tourne à 500 watts. Normalement, vous voudriez qu'elle descende à 200 watts si elle ne travaille pas. Mais là, non, on ne veut pas qu'elle descende à 200 watts. On la maintient à 500 watts tout le temps parce qu'on ne veut pas que l'opérateur du réseau se fâche contre nous. Et la raison pour laquelle les opérateurs de réseau sont en colère, c'est que, si vous pensez à un système électrique, quand vous avez ces composants passifs, ces transformateurs passifs, toute variation de la charge se répercute sur le réseau et le déstabilise. C'était acceptable dans le passé parce que les gens du réseau électrique géraient ça, et il y a des solutions pour stabiliser les réseaux. Mais maintenant, ce n'est plus le cas.

On a parlé des transformateurs classiques. Il existe maintenant des transformateurs à semi-conducteurs. Je ne sais pas pourquoi on les appelle « solid state » parce que les transformateurs précédents sont aussi à l'état solide, ils sont passifs. Au lieu d'avoir un morceau de fer et des enroulements de cuivre, on construit des circuits avec des puces en carbure de silicium et on peut faire la même chose : convertir du courant alternatif haute tension en courant alternatif basse tension, ou même directement du courant alternatif haute tension en courant continu. Pourquoi personne n'a fait ça avant ? Ça existe depuis 2020. C'est plus cher. Vous pouvez vous plaindre autant que vous voulez des transformateurs traditionnels, mais ils sont bon marché et vous attendez 12 mois et vous les recevez. Les transformateurs à semi-conducteurs sont beaucoup plus chers, mais ils ont un énorme avantage : vous pouvez faire de la régulation de charge. Vous pouvez programmer dynamiquement le transformateur à semi-conducteurs pour garantir que le courant et la tension des deux côtés sont à peu près les mêmes. Vous pouvez modifier la fréquence de commutation. Donc si la charge augmente, vous pouvez commuter à une fréquence plus élevée, ou si la charge diminue, vous commuter à une fréquence plus basse.

Et ils utilisent des semi-conducteurs de puissance dans les transformateurs à semi-conducteurs.

Oui, ce sont des dispositifs actifs. C'est essentiellement un tas de transistors. Au lieu d'avoir des dispositifs passifs, des inductances, des enroulements de cuivre et des diodes, ce sont des transistors. On allume et on éteint des transistors pour gérer la puissance, pas seulement la convertir, mais aussi la réguler pour obtenir un 800 volts propre, pas 800 volts plus ou moins 20 volts ou autre. Ou fournir 1000 ampères, pas 1000 ampères plus ou moins 10 %. Vous pouvez réguler. Et c'est énorme, car au lieu de gaspiller de l'argent avec le flag « Power Plant No Blow Up » dans PyTorch, vous pouvez baisser la puissance du GPU, vous gagnez tellement en efficacité. Et les opérateurs de réseau sont aussi plus contents de vous. Souvent, les problèmes de permis, disons que vous essayez de construire un centre de données et les permis ne passent pas, et vous vous demandez pourquoi. C'est parce que la compagnie d'électricité dit : « Vous allez déstabiliser le réseau. On ne peut pas faire ça. » Et maintenant vous pouvez dire : « Eh bien, je vais installer des transformateurs à semi-conducteurs et voici comment je ne vais pas déstabiliser votre réseau. » Et la compagnie d'électricité dit : « D'accord, je vous vends de l'électricité, branchez-vous. » Donc les gens ont contourné ce goulot d'étranglement de diverses manières créatives. Mais je pense qu'il est temps d'adopter les transformateurs à semi-conducteurs et d'en accepter le coût, car la valeur est là. Oui, vous payez plus pour le boîtier qui convertit l'électricité. Mais vous obtenez tous ces avantages. Je pense que ça va commencer à décoller dans l'année à venir. C'est plutôt une histoire pour la seconde moitié de 2027. Mais la façon dont les actions fonctionnent, les gens anticipent et achètent avant. Les actions sont tournées vers l'avenir. Donc ça commence à se produire maintenant et je pense que ça va vraiment décoller dans les 36 prochains mois.

Vous seriez plus enthousiaste à propos des entreprises de semi-conducteurs de puissance qu'à propos de celles qui vendent les transformateurs à semi-conducteurs ?

En général oui, car au moins mon style d'investissement personnel, je comprends l'ingénierie, ou du moins j'essaie, et je peux déterminer la différenciation. Je compare et je peux voir quelle puce est meilleure que quelle autre, qui peut facturer une prime. Les gens qui achètent ces puces et construisent le boîtier, il y a aussi de la valeur là, à cause de l'aspect contrôle. Disons que le boîtier contient mille transistors très puissants. Si vous n'avez pas les circuits de protection et le contrôle, c'est extrêmement dangereux. Vous pouvez faire exploser tout ce qui est connecté, envoyer une surtension. Il y a donc des considérations de conception minutieuses dans la façon dont vous assemblez ces semi-conducteurs de puissance. Il y a deux actions ici. Pas mal de gens m'ont pitché ça et je ne prenais pas ça au sérieux. Et puis quand la 15e personne m'envoie ça, je me dis : « OK, d'accord, je vais lire. » Il y a deux sociétés qui s'appellent SolarEdge et Enphase Energy. Leur historique, c'est la fabrication de micro-onduleurs pour panneaux solaires. Le problème avec les installations de panneaux solaires, c'est que les panneaux sont en courant continu, mais votre maison fonctionne en courant alternatif, donc vous devez convertir chaque panneau solaire du courant continu au courant alternatif correct. Et il y a tout un tas de trucs de sécurité, il faut contrôler tout ça. Donc ces gars fabriquaient ces petits micro-onduleurs pour les installations solaires résidentielles. Et depuis que les incitations fiscales pour le solaire résidentiel ont dégringolé, ces gars se sont complètement plantés. Vous pouvez regarder le cours de leurs actions. Il y a eu une bulle vers 2021, et maintenant ils ont perdu 90 %. Ce sont des charognards maintenant. Et ces gars se tournent vers les transformateurs à semi-conducteurs. Ils voient l'opportunité. Et je n'ai pas eu le temps de creuser complètement, mais je pense que c'est légitime. C'est super dégénéré. C'est une idée super stupide. Mais je pense que ça pourrait marcher en tant qu'action. Parce qu'ils ont beaucoup d'expérience dans l'assemblage et les circuits de protection de ce genre de trucs. Et c'est probablement plus facile que ce qu'ils font dans le monde solaire, car au lieu d'avoir ça réparti sur tout un toit, vous mettez tout dans un seul boîtier et vous pouvez faire la protection contre les surintensités beaucoup plus facilement. Et ils ont même une technologie différenciée. Enphase a un ASIC de contrôle en 22 nanomètres. Ils ont conçu leur propre puce en 22 nm pour contrôler tous ces micro-onduleurs, car il faut faire un peu de calculs et toute une série de signaux différents pour toutes ces parties analogiques. C'est un problème de systèmes distribués. En gros, vous devez dire à 10 000 transistors à quelle vitesse ils doivent commuter, et aussi détecter les défauts et tout ça. Donc ils ont un ASIC de contrôle pour ça, ce qui simplifie les choses. C'est un véritable avantage concurrentiel.

Et Delta Electronics ?

Oui, Delta est le gros. Vous avez Delta, Vertiv, Eaton et tous ces grands. C'est leur cœur de métier. C'est ce qu'ils font déjà. Et les actions ont déjà monté. Ce qui est attrayant avec SolarEdge et Enphase, c'est qu'ils ont été laissés pour morts et personne n'y prête attention. Et ces actions, si ça marche, elles font x5. Vous voulez courir après quelque chose qui a déjà beaucoup monté comme Vertiv, ou vous voulez courir après quelque chose de dégénéré ? C'est amusant. Ce n'est pas une idée terrible. Ça pourrait marcher. Vous voulez parier, mettez un demi pour cent de votre portefeuille là-dedans. Pourquoi pas.

Que demandent les hedge funds ?

Ils veulent généralement mon avis sur des trucs parce que mon livre est public et que je surperforme tout le monde, même si avec des niveaux de risque insensés, attention. Beaucoup de ces gars sont neutres au marché, donc ma performance n'est pas juste à comparer à la leur. Mais je m'en sors plutôt bien. Ils me demandent mon avis sur des trucs, et souvent ça tourne autour de sujets techniques parce que je ne connais rien à l'évaluation. Parfois, quand un nouveau fonds est lancé, ils demandent : « Oh, que penses-tu de l'évaluation ? » Tu ne lis pas ce que j'écris ? Mais oui, des trucs d'ingénierie. Par exemple, l'histoire de Wolfspeed. Aucun d'eux ne sait si ce carbure de silicium de 10 kilovolts est bon et où il serait utilisé. Et je ne pense même pas que Wolfspeed eux-mêmes sachent comment l'utiliser, parce qu'ils ont mis « alimentation de réacteur à fusion nucléaire » dans la fiche technique et dans leur communiqué de presse. Je me dis : « Vous cherchez vraiment loin. » Souvent, la direction d'une entreprise raconte des trucs à ces financiers et ils se demandent : « Est-ce qu'ils disent la vérité ? » Et moi je réponds : « Oui ou non, ou c'est compliqué, vous devriez poser ces questions de suivi. » Donc c'est surtout technique, mais pas à 100 %.

Cerebras, ton avis maintenant.

J'adore. J'ai quelques critiques sévères. Andrew Feldman (@andrewdfeldman) en est apparemment très douloureusement conscient. Ils sont en FP16, ce qui est une erreur stupide. S'ils implémentent le FP4, ils obtiennent 3 à 4 fois plus de capacité rien qu'avec ça. Et c'est un fruit facile à cueillir. C'est juste de la logique numérique. Ils doivent aussi améliorer leur E/S pour décharger le cache KV. Et je n'achète pas cet argument du style : « Oh, c'est assez bon. » C'est une excuse bidon. Si vous avez l'opportunité de rendre votre produit 10 fois meilleur, vous le rendez 10 fois meilleur. Ne vous contentez pas de la médiocrité. Enfin, leurs marges brutes indiquent que leur rendement est super mauvais. Ils prétendent publiquement que leur rendement au niveau du wafer est de 100 %, et je les crois, ce qui signifie que leur rendement après encapsulation du wafer est horrible. C'est entre 20 et 40 %. Je ne sais pas pourquoi c'est aussi mauvais, mais ils doivent corriger ça. J'ai toujours des critiques à leur égard, et c'est plutôt que je veux être un investisseur activiste. J'achète quelques-unes de leurs actions. Je ne vais pas disparaître. Je suis haussier mais aussi sévère parce que ça pourrait être tellement mieux. Andrew Feldman est dans le déni à propos du problème d'E/S. Et je lui dis : « Non, mec, arrête d'être dans le déni et répare-le. Tu peux l'améliorer. Rends le produit meilleur. »

Tu es toujours baissier sur les neoclouds ?

Ouais, un peu. Regarde ce qui est arrivé à CoreWeave le trimestre dernier. Je pense qu'ils ont des coûts plus élevés à cause de toutes les pénuries, l'optique et la mémoire. Et tous les financiers demandaient : « Est-ce que vous répercutez les coûts sur le client via le contrat ? » Et le PDG de CoreWeave a essayé de répondre deux fois et je n'ai aucune idée de la réponse. Parce que l'action est en baisse, je suppose que les financiers ont interprété que non, ils se font avoir. Ils ont signé un contrat à long terme et ils ne peuvent pas répercuter les coûts.

Des idées sur les neoclouds les plus susceptibles de mourir ?

Les plus petits. CoreWeave est assez gros. Oracle est assez gros. Nebius est probablement assez gros. Je ne sais pas pour mourir, mais il y aura un problème à un moment donné. Le niveau d'endettement ici. Dès qu'il y a un ralentissement, ou même si les taux d'intérêt augmentent, il pourrait y avoir des hausses de taux au second semestre de cette année, et ça leur fera très mal. C'est juste un mauvais business. Il y a tellement d'autres bonnes choses dans lesquelles investir. Faites ça. Je ne sais pas pourquoi les gens veulent posséder ces merdes.

Terafab ?

Il n'y a pas assez d'informations, à part qu'ils semblent peut-être licencier le procédé Intel 14A. C'est mon interprétation de ce qui se passe. Il n'y a pas d'informations.

Le déploiement du CPO se fera sans trop de problèmes ?

Je ne pense pas qu'il y aura de problèmes. Les gens qui s'inquiètent de la fiabilité ont complètement tort et ne comprennent pas l'ingénierie. Les problèmes seront la pénurie de phosphure d'indium, c'est vraiment très grave. Mais le déploiement, non, je ne crois pas que ce sera un problème. Si vous faites les choses correctement, si vous faites vos devoirs, ça ira. Ce sera même plus fiable que les émetteurs-récepteurs.

Un avis sur Amkor ?

Non, je ne suis pas trop les acteurs du packaging.

Et Ibiden ou Unimicron ?

Non, je ne sais pas. Pas d'avis.

Nokia ou Infinera ?

Oh, oui. Ça a le potentiel d'être une version beaucoup moins chère de Ciena. Donc si vous vous dites : « Wow, Ciena a beaucoup monté, l'évaluation est élevée », eh bien, vous pouvez simplement prendre Nokia et ils essaient de faire la même chose. Donc je pense que c'est un investissement value légitime. C'est l'une des rares choses où l'évaluation est raisonnable. Je n'y suis pas en ce moment, mais j'ai été dedans et dehors et j'ai besoin de plus de temps pour y réfléchir. Mais oui, j'aime ça.

Quelle est ta façon préférée de jouer le phosphure d'indium ?

Principalement Lumentum. Et comme truc plus risqué, tu peux faire AXT, et pour le semi-cap, la société allemande AIXTRON. Donc ces trois-là.

Qu'est-ce qui est le plus survendu à ton avis en ce moment ?

Je dirais le microLED parce que je pense que c'est une arnaque. Il y a environ sept alternatives au microLED et elles sont toutes objectivement meilleures. Donc oui, je déteste le microLED.

GE Vernova.

J'en possède beaucoup. J'ai acheté un tas d'actions à environ 170 dans l'un de mes comptes long-only. Mon prix moyen se situe entre 170 et 250. Et ça est monté jusqu'à la lune et, eh bien, je suppose que je ne vendrai jamais ça. Donc oui, c'est génial. Les turbines à gaz. J'ai eu de la chance, quelqu'un m'a donné le tuyau tôt. C'est un fossé de très haute qualité. Ils sont l'un des seuls à pouvoir fabriquer ça. Mais à ce stade, ils sont complètement réservés et l'action a tellement bougé que je ne suis pas sûr de comment on peut la faire monter plus haut. D'où viendrait la capacité, ou les hausses de prix ? Je ne sais pas.

Quelques-uns de ton portefeuille long-only : Besi, Rigaku, TSMC ou Fujikura, lequel est le plus excitant ?

Rigaku.

Ça, ce sont les rayons X pour le packaging avancé ?

Besi a déjà tellement monté, donc acheter à ces niveaux, je ne sais pas. Mais Rigaku, les acteurs traditionnels sont Camtek et Onto, et ils font de l'inspection optique pour le packaging avancé. Ces machines à rayons X étaient traditionnellement utilisées pour la R&D. Disons que vous êtes TSMC et que vous essayez de développer votre nœud 2 nanomètres, la partie R&D, vous avez besoin de regarder vraiment à l'intérieur et de comprendre ce qui se passe, vous achetez quelques-unes de ces machines Rigaku et vous les utilisez pour la R&D et vous ne les réutilisez jamais. Maintenant, on en est arrivé au point où, à cause des transistors gate-all-around, de l'alimentation par l'arrière et des tolérances beaucoup plus serrées sur la prochaine génération de packaging avancé, vous devez utiliser ces machines à rayons X. Vous êtes foutu avec l'optique. Donc Rigaku passe d'une niche R&D à la production. Et Onto sait qu'ils sont foutus parce qu'ils ont acheté 27 % de Rigaku dans le cadre d'un partenariat stratégique. Et en gros, le logiciel qui tourne sur les machines Rigaku est le logiciel Onto. Donc beaucoup de gens disent : « Oh, c'est haussier pour Onto. » Non, pas du tout. Ils savent qu'ils ne peuvent pas fabriquer les machines, alors ils vont acheter un quart de la capitalisation boursière de la société qui peut fabriquer les machines et se contentent de vendre des logiciels à côté. Genre, achetez Rigaku. Donc oui, c'est mon semi-cap de niche préféré. J'adore.

De ton compte de trading : Tower Semi, Lumentum, Intel, Bloom, Semtech, lequel est le plus excitant ?

Semtech. Définitivement Semtech. Les autres ont déjà beaucoup monté. Semtech, je pense que les gens ne comprennent toujours pas complètement ce qu'ils fabriquent.

Ma compréhension très naïve, c'est que ça fait mieux fonctionner le cuivre ?

C'est vrai, mais ce n'est qu'une petite partie de l'histoire. Ils fabriquent des amplificateurs analogiques et des égaliseurs analogiques. Et la beauté de la chose, c'est que ça marche dans les câbles cuivre actifs, ça marche sur les PCB, ça marche dans l'optique linéaire enfichable, ça marche dans les émetteurs-récepteurs traditionnels, ça marche dans le truc Arista XPO, ça marche dans l'optique près du boîtier. C'est partout, bordel. Ce n'est pas que le cuivre, c'est tout. C'est incroyable. Et ils ont les composants de la plus haute qualité. C'est essentiellement un duopole entre eux et MACOM. Et les composants Semtech sont tout simplement meilleurs. J'ai vu les fiches techniques. J'ai utilisé ces trucs. Donc il y a beaucoup de financiers qui font des appels avec des experts, un type du business : « Oh oui, on a une double source, bla bla bla. » Je me dis : « Mec, dans quelle proportion ? C'est probablement 90 % Semtech parce que les composants Semtech sont bien meilleurs. » Donc oui, Semtech a encore beaucoup de marge de progression. C'est incroyable. C'est partout. Pas seulement le cuivre.

Sur les différents segments, faible, moyen ou élevé, à quel point penses-tu que ce sera tendu ? HBM.

Oui, élevé.

Photonique silicium, optique, CPO.

Élevé aussi. Vu ce qui est arrivé à Tower.

Qu'est-il arrivé à Tower ?

Les gens paient Tower d'avance pour une capacité en 2027, 2028. Leur action a monté d'environ 15 %. C'est une course de plusieurs milliards de dollars. Ils sont complets.

Y a-t-il un sous-ensemble de l'optique que tu considères comme le plus important ?

La partie phosphure d'indium, les lasers.

Packaging avancé.

Je ne pense pas que ce sera un si gros problème parce qu'Intel monte en puissance. Intel a beaucoup de capacité en Malaisie, je pense.

Avis sur EMIB ?

Oui, EMIB est bon. Intuitivement, vous pouvez considérer EMIB comme la même chose que CoWoS-L. Il y a des détails techniques, mais du point de vue du concepteur, c'est la même chose. Le problème avec EMIB il y a 18 mois, c'est qu'Intel était un peu idiot dans ses règles de conception et son service client, et c'était horrible. Et puis Lip-Bu Tan est arrivé, a viré un tas de gens, et maintenant c'est bon. Et maintenant les gens déplacent des choses vers EMIB parce que, un, TSMC n'a pas assez de capacité CoWoS, et deux, TSMC préfère utiliser son espace de salle blanche pour des marges brutes de 60-70 % sur le N3 plutôt que pour le CoWoS. Donc je pense que la situation du packaging avancé, du moins par rapport à d'autres choses, ne sera pas aussi mauvaise que les gens le pensent. D'autres choses seront pires.

Substrats ABF.

Je n'en sais pas assez.

HBF.

Je n'aime pas du tout la mémoire flash à haute bande passante. Je ne pense pas que ce soit une bonne solution car elle aura des problèmes d'endurance. Donc je n'aime pas ça. Je ne veux même pas considérer ça comme un goulot d'étranglement. Je pense juste que c'est une mauvaise idée. Si vous allez utiliser de la flash pour ce genre de choses, alors vous devez la rendre enfichable. Et si c'est enfichable, vous n'avez pas besoin de l'empiler. Vous pouvez simplement la mettre autour du contrôleur CXL et la placer dans un serveur quelque part.

Wafers.

Wafers de phosphure d'indium, assez mauvais. Wafers de carbure de silicium, non. Wafers normaux non plus, ça va probablement.

PCB.

C'est mauvais. Les trucs haute vitesse, la plus haute qualité pour la haute vitesse qui supporte le SerDes 200G, oui, c'est assez mauvais. Tout le monde est plus ou moins complet.

Tu avais un favori là-dedans ?

J'ai tradé dans et hors de TTMI, mais maintenant c'est tellement monté que je ne veux pas m'embêter avec ça. Donc oui, je ne sais pas qui jouer là-dessus. Il y a aussi beaucoup d'acteurs que je ne suis pas à Taïwan. C'est l'un des secteurs avec lesquels je ne joue pas.

Énergie et transformateurs.

Excitant, oui. Goulot d'étranglement, non. Il y a beaucoup de capacité d'usine inutilisée. Mais le plus excitant, oui.

Excitant parce que c'est techniquement intéressant pour toi ?

Techniquement intéressant et c'est la prochaine chose qui va décoller. Par exemple, une grande partie de la raison pour laquelle l'action Lumentum n'a pas bougé sur les résultats, elle a baissé puis remonté, c'est que Hurlston dit à tout le monde : « Eh bien, nous avons tout vendu pour les deux prochaines années », et ça dit aux financiers : « OK, donc ça ne va pas s'améliorer en termes de hausse. » Wolfspeed a le potentiel de faire x5. Ça peut être vraiment stupide. Et puis tous les gars des semi-conducteurs de puissance classiques, Infineon, TI, onsemi, STM, ils peuvent doubler. Ils peuvent doubler. Ce n'est pas intégré dans les prix. D'autres choses le sont. Pas ça.

Commutateurs réseau.

Ça va. Ça entre juste en concurrence avec les wafers logiques et il faut un peu de CoWoS, mais pas beaucoup. Ça va.

Fibre optique.

Ce n'est pas génial en ce moment. Il y a quelques problèmes. Je ne pense pas que ce soit aussi mauvais que d'autres choses, donc disons moyen. En particulier la fibre à maintien de polarisation. C'est un type plus cher nécessaire dans certaines situations.

Refroidissement liquide.

Ça va. Je n'ai entendu aucun problème.

Assemblage et test.

On peut monter en puissance là-dessus. Ça monte en puissance. Ce n'est pas difficile de monter en puissance.

CPU.

Gros problème. Oui, gros problème. Intel peut monter en puissance dans une certaine mesure. C'est pour ça que l'action a tellement monté. AMD, ils ont monté en puissance dans une certaine mesure en utilisant leur ancienne conception de CPU sur N5 et ils la remettent en production. Mais maintenant qu'ils ont fait ça, si la situation des CPU empire, que vont-ils faire ? Si je suis AMD, est-ce que je veux prendre mon allocation TSMC, vendre des GPU ou des CPU ? Il faut choisir. ARM n'a pas de wafers. Qualcomm. Aussi peiné que je sois de l'admettre, la seule chose qui peut aider la situation des CPU, c'est Qualcomm parce qu'ils ont beaucoup de wafers chez TSMC.

Mais le truc, c'est que Qualcomm est le seul grand acteur qui a de la capacité de wafers et qui peut la réorienter vers les CPU, parce que si Android continue de chuter, ils ont toujours ces wafers commandés chez TSMC. Ils peuvent simplement dire à TSMC d'imprimer la conception du CPU à la place. Et c'est pour ça que Qualcomm a tellement monté, parce que les gens espèrent. Qualcomm a échoué trois fois dans les CPU pour centre de données. C'est leur troisième ou quatrième tentative. S'ils n'y arrivent pas cette fois, il n'y a en fait aucun espoir. Il faut juste que ça fonctionne. Si ça fonctionne, les gens achèteront et ils gagneront beaucoup d'argent avec, et ça sauvera l'entreprise de l'implosion d'Android et des procès imminents d'Apple.

As-tu un favori pour les CPU ?

Je préfère Intel pour les CPU parce que rien ne me fera acheter Qualcomm. Mais des gens dans les fonds m'ont demandé : « Oh, devrais-je acheter Qualcomm pour les CPU ? » Eh bien, tu peux si tu veux faire confiance à ces abrutis. Mais moi non. Mais bien sûr, si tu veux y aller, vas-y. J'admets qu'ils ont beaucoup de capacité et qu'ils pourraient y arriver.

La DRAM serait aussi élevée ?

Oui, je considère fondamentalement la DRAM et le HBM comme équivalents.

Disques durs.

Pas d'avis. Je suppose qu'avec la pénurie de NAND, les disques durs se resserrent peut-être aussi. Je n'en sais pas assez.

Coquilles de centres de données.

Je ne suis pas ces trucs. Pas d'avis.

Les semi-conducteurs de puissance seraient élevés pour toi ?

Non, c'est bas maintenant. Ce n'est pas un goulot d'étranglement maintenant, mais ça le sera dans un an. C'est pourquoi c'est le plus intéressant, parce qu'il y a du potentiel de hausse.

NAND.

Je pense que la DRAM a une prime. La NAND est aussi en pénurie comme la DRAM, mais je pense que la NAND est plus dangereuse car elle est plus sujette à la surcapacité que la DRAM. Mais oui, goulot d'étranglement élevé, mais je dirais que je préfère la DRAM à la NAND.

Y a-t-il des changements de modèle, comme un contexte long, plus de RL, des modèles du monde, dont tu penses qu'ils vont beaucoup modifier la demande en matériel ?

Je pense sincèrement que tout le monde se dirige vers des longueurs de contexte plus longues. Il y a une valeur économique là-dedans. Les gens sont prêts à payer pour plus de longueur de contexte. Donc ça va nuire à toute la mémoire, à tout. C'est juste l'avis général de haut niveau. Je ne suis pas beaucoup l'architecture des modèles. Mais du côté économique, oui, les gens veulent des longueurs de contexte super longues ou une longue chaîne de tokens.

Si tu étais Jensen, quel approvisionnement essaierais-tu de verrouiller ensuite ?

Il a déjà verrouillé tout l'approvisionnement pour tout. J'allais dire la fibre, puis il a conclu l'accord avec Corning. Je pense que cet homme est un dieu et qu'il a déjà tout verrouillé. Je pense qu'il l'a vraiment fait.

Est-ce que tu paies pour des sources d'information et lesquelles ?

J'ai un abonnement à SemiAnalysis, Fabricated Knowledge, FundaAI, et j'ai Citrini. Ce sont les seuls quatre pour lesquels je paie.

Trois à cinq comptes X que tu aimes.

J'aime Clive Chan (@itsclivetime) d'OpenAI, mais il ne poste presque jamais rien. Il y a le gars Suspended Cap (@ContrarianCurse), il est intéressant. TBU (@TBU12345678). J'aime beaucoup TBU. Outspoken Geek (@OutspokenGeek). Jukan (@jukan05) donne de bonnes infos. Max Cherney (@chernandburn) de Reuters. Je l'aime bien. Thomas, il ne poste presque jamais, mais Thomas Sohmers (@trsohmers) de Positron, parfois il poste des trucs utiles. Sravan (@SKundojjala) de SemiAnalysis poste du bon contenu de temps en temps. Et puis Citrini (@citrini). Oh, Bucket Shop Capital (@bucketshopcap). Je l'aime bien. Dan Nystedt (@dnystedt).

Les gens du côté vendeur que tu apprécies. Stacy Rasgon en fait partie.

Ouais, j'aime Stacy Rasgon (@BernsteinRasgon) et Vivek Arya (B of A). Timothy Arcuri (UBS). En gros, quiconque a du cran et pose une question piquante, je l'aime.

Qu'est-ce qui t'a fait capituler sur le HBM ?

C'est plutôt une thèse à long terme. Ce qui m'a fait capituler, c'est essentiellement la thèse de Nick Gagnet de Coatue. L'idée que les fabricants de mémoires vont se revaloriser, qu'ils ne seront plus basés sur le price to book, mais sur le BPA.

Comment penses-tu que ta façon de jouer la mémoire va finir par se concrétiser ?

Je ne sais pas, j'y réfléchis encore. Hynix va bientôt avoir un ADR. Je ne suis pas sûr d'attendre ça ou de retourner chez Micron.

Tu fais une configuration à deux comptes, un long only et un trading, juste pour garder l'esprit clair ?

Ouais, psychologiquement, ces deux dernières semaines, j'ai eu plusieurs jours où mon compte trading était en baisse d'un quart de million de dollars et je suis complètement imperturbable parce que j'ai mon compte long only. Alors les gens me demandent : « Oh, comment tu fais pour être si fou, comment tu gères cette volatilité ? » Parce que je m'en fiche. J'ai un compte séparé. Je prends très au sérieux mon propre conseil : n'investis pas ce que tu ne peux pas te permettre de perdre. Mon compte trading pourrait tomber à zéro et ça irait. J'ai toujours mes comptes long only. Et ce n'est pas sain d'avoir accès au margin et tout ton argent au même endroit. C'est comme ça que je gère le risque.

Quelle est l'entreprise que tu recommanderais à tes parents, un achat et conservation sur 10 ans ?

Intel, parce qu'Intel est un placement long terme dingue. Aussi Broadcom, Keysight. SiTime, mais peut-être pas à ces prix-là. Nvidia, évidemment. TSMC. Ce sont des achats long terme, les yeux fermés.

Broadcom, je suppose que tous leurs clients cherchent agressivement à réduire leur dépendance envers eux, ou ce n'est pas un problème ?

Google essaie. Ça ne se passe pas bien, je te le dis. À part Lumentum, l'autre grand acteur du phosphure d'indium est en fait Broadcom. Peu de gens le savent. Broadcom a une division laser gigantesque. Une entreprise très bien diversifiée.

@insane_analyst

Use YouMind to read viral articles deeply

Articles viraux récents

Préparez-vous pour l'AX2026 !

La newsletter de juin du GOAT

J'ai rendu mon agent Hermes 10 fois plus rapide sans changer de modèle

L'économie de l'IA : le prochain chapitre

Présentation d'Open USD

Le calendrier de sortie des 30 ans du JCC Pokémon est dévoilé