Bewertung der Engpässe in der KI-Lieferkette: Interview mit Irrational Analysis (@insane_analyst)

Hier ist mein Interview mit Irrational Analysis (@insane_analyst) über Engpässe in der KI-Lieferkette. Keine Anlageberatung, ich besitze oder könnte einige davon in Zukunft besitzen.

Welche alternativen Beschleuniger könnten in drei bis fünf Jahren einen sehr bedeutenden Teil des Trainings oder der Inferenz übernehmen?

Training: Ich denke, alle sind irgendwie null. Inferenz: Ich bin ein sehr großer Fan von Positron und Cerebras, aber aus sehr unterschiedlichen Gründen. Wer noch? MatX. Das Problem mit MatX ist, dass ich nicht genug Informationen habe. Vielleicht ist es gut, aber ich weiß nichts über sie. Die kurze Antwort wäre also Positron und Cerebras. Es gibt auch Taalas, an dessen Prämisse ich nicht glaube, aber es ist sehr cool und ich will sie ein bisschen anpreisen, denn wenn die Prämisse funktioniert, ist es fantastisch. Aber ich glaube nicht, dass die KI-Leute tolerant gegenüber der Prämisse sein werden. Ja, das sind so die großen drei, die ich wirklich, wirklich mag, mit MatX an der Seite, weil ich nicht genug über sie weiß. Ich versuche immer noch, sie dazu zu bringen, mit mir zu reden.

Die Taalas-Prämisse, mit der du nicht einverstanden bist, sind die festen Gewichte?

Was sie tun, ist, eine obere Maskenschicht zu verwenden, um die Gewichte fest einzubrennen. Sobald die Gewichte festgelegt sind, kannst du sie nicht mehr ändern. Und angesichts der Geschwindigkeit, mit der sich KI-Modelle ändern – alle zwei Wochen gibt es GPT 5.5 und dann 5.6. Wenn du mit Leuten sprichst, die bei diesen Unternehmen arbeiten, ändert sich das Modell intern ständig. Am Ende des Modells steht eine Hexadezimalzahl. Alle paar Wochen gibt es ein Update. Die Gewichte ändern und verfeinern sich ständig.

Taalas sagt nun, dass sie Fine-Tuning unterstützen. Ich denke, sie meinen damit, dass der aktuelle Chip eine gewisse Modifikation der Gewichte erlaubt, aber nicht annähernd so viel, wie man möchte. Ihr aktueller Chip besteht zu zwei Dritteln aus fest codierten Gewichten und zu einem Drittel aus einer reinen SRAM-Maschine. Der Grund, warum sie Fine-Tuning unterstützen können, ist, dass ein Drittel SRAM ist und du eine Teilmenge der Gewichte ändern oder Fine-Tuning betreiben kannst, LoRA-Zeug. Und sie reden im Grunde mit Kunden und sagen: Nun, dein Modell läuft umso schneller, je mehr du fest codierst, aber du hast diesen Kompromiss. In einer idealen Welt könnte jemand ein Modell entwerfen, bei dem 90 % der Gewichte fest codiert sind (ich erfinde diese Zahlen). Es würde super schnell laufen. Und dann werden 10 % für LoRA oder zum Aktualisieren der Gewichte verwendet. Ob irgendein großer Fisch dieses Maß an Einschränkung akzeptieren wird, weiß ich nicht. Ich glaube nicht. Aber die Technik hinter dem, was Taalas macht, ist tatsächlich super, super clever.

Sie verwenden eine obere Maskenschicht. Chips haben heutzutage etwa 14 Schichten, nennen wir es 14 oder 15 Schichten. Sie nehmen eine der Schichten im oberen Drittel der Maske und verwenden diese, um die Gewichte zu programmieren und fest zu codieren. Wenn du darüber nachdenkst, dauert ein normaler Chip-Entwurf mindestens drei Monate, normalerweise länger, für das Design. Dann musst du tape-out machen, dann dauert es fünf bis sechs Monate, bis die Chips zurückkommen, und dann musst du sie verifizieren. Taalas musste eine Reihe von benutzerdefinierten EDA-Tools für ihren Compiler, den Verifikations-Stack und das Chip-Design entwickeln, und sie behaupten, dass sie einen neuen Modellentwurf in einem Tag schaffen. Irgendwann. Im Moment dauert es etwa eine Woche. Also eine Woche für das Design, und weil sie nur die obere Schicht ändern, eine der oberen Schichten, können sie Wafer auf Vorrat halten. Wenn du zu TSMC oder einer anderen Fabrik gehst, ist das in der Industrie sehr üblich: Du sagst: „Hey, ich möchte, dass du X Wafer zu 70 % Fertigstellung bereithältst, mach den letzten Teil nicht fertig, weil wir F&E betreiben oder so.“ Taalas kann also eine viel schnellere Durchlaufzeit haben, als ich ursprünglich erwartet hatte. Eine Woche für das neue Design und dann etwa zwei Monate. Das ist meine Schätzung, sicher nicht sechs Monate. Innerhalb von zwei Monaten kannst du die Chips zurückbekommen und sie betreiben. Und sie behaupten, dass sie einige sehr clevere Verilog-Compiler-Tools und Threaded-Simulationstools entwickelt haben, um mit den Standard-EDA-Tools zu interagieren und alles sehr gut zu verifizieren. Die Post-Silicon-Validierung sollte also nichts sein, weil die Infrastruktur des Chips bereits validiert ist und du nur die Gewichte änderst. Sie haben einen Prozess, der von Anfang bis Ende mindestens ein Jahr dauerte, auf theoretisch zwei bis drei Monate verkürzt, was nicht schlecht ist.

Aus der Perspektive der Modellarchitektur bin ich eher ein Hardware-Typ. Ich verstehe Modellarchitektur nicht. Ich habe mich schwer getan herauszufinden: Wie hast du etwas, bei dem die meisten Gewichte fest sind und du nur einige Gewichte änderst, wie Gewichte in einer einzigen Schicht oder so? Und dann habe ich LoRA gefunden und Leute gefragt, die KI richtig verstehen, und sie sagten mir: „Oh nein, LoRA kann man nicht skalieren oder so. Das ist dumm. Nur Verlierer verwenden LoRA.“ Aber wenn die Prämisse funktioniert, wenn sie einen Kunden finden, der bereit ist, LoRA oder ein anderes algorithmisches System zu verwenden, bei dem ein großer Teil der Gewichte fest ist und wir dieses Modell ständig bedienen werden, sodass es wirtschaftlich ist – Taalas, ihre Wirtschaftlichkeit ist fantastisch. Der Chip ist spottbillig. Er braucht kein HBM oder irgendeinen Speicher. Er braucht keine fortschrittliche Verpackung. Sogar die PCB – sie sind wirklich latenzbegrenzt bei der Chip-zu-Chip-Kommunikation, überhaupt nicht bandbreitenbegrenzt. Also verwenden sie PCIe und CXL, und ihre eigentliche Hauptgrenze im Moment ist, dass sie nicht die neueste Version von CXL auf ihrem Chip haben, und anscheinend gibt CXL 3.0 ihnen einige Funktionen, die ihnen deutlich helfen werden. Aber im Moment ist es noch in Ordnung. Du wirst also eine fantastische, unglaubliche Leistung haben (buchstäblich in keiner anderen Architektur möglich) zu spottbilligen Preisen. Es gibt nur diese Einschränkung, dass ein großer Teil der Gewichte, wahrscheinlich zwischen 50 und 90 %, fest sein muss und du sie nicht ändern kannst. Um sie zu ändern, müsstest du alle oder die meisten deiner Chips wegwerfen und dann zwei bis drei Monate warten, und die Kosten für ein neues Design liegen bei etwa einer Viertelmillion Dollar.

Nimm den CEO von Taalas. Er hatte ein Interview, in dem er sagte, die Kosten für das Chip-Design, eine neue Version des Chips, seien „so viel wie ein H100-Server“. Nehmen wir an, du betreibst ein Rechenzentrum, das ein Modell mit Taalas-Chips bedient, und du entscheidest dich, alle deine Taalas-Chips wegzuwerfen, weil das Modell aktualisiert werden muss. Du musst diese Investition abschreiben, du musst Taalas zusätzliche 300.000 bis 500.000 Dollar geben. Im schlimmsten Fall stellen sie in zwei bis drei Monaten neue Chips für dich her, und du setzt sie ein. Und wieder: kein Speicherproblem. Es gibt nicht einmal ein PCB-Problem. Du kannst minderwertige PCB-Materialien verwenden, weil sie nur wirklich langsames PCIe betreiben. Es könnte also funktionieren. Ich weiß nur nicht genug über Modelle, um zu sehen, ob es funktioniert.

Verschiedene Ebenen des Stacks: Welche werden deiner Meinung nach in den kommenden Jahren am stärksten versorgungsengpässen ausgesetzt sein?

Ja, es ist irgendwie alles. Wenn du mich im Januar oder Februar gefragt hättest, hätte ich eine ganz andere Antwort gegeben, aber jetzt ist alles knapp.

Warum ist der Markt etwa letzten September so durchgedreht?

Das verstehe ich nicht. Manchmal ist der Markt wirklich seltsam, und ich rede mit vielen dieser Hedgefonds-Typen und denke: „Ihr seid schlau, warum merkt ihr das erst jetzt?“ Es ist komisch.

Ist die Makro-Perspektive, dass jetzt alle kapieren: Okay, die Capex der Hyperscaler werden weiter steigen, zumindest im absoluten Wert?

Ja, die Makro-Sache ist, dass die Leute ständig hin und her schwenken. Ich gebe dir ein lustiges Beispiel. Mir wurde gesagt, dass die traditionellen Energieinvestoren alle auf Short bei Bloom sind, weil sie denken: „Oh, Bloom ist zu teuer, Erdgasturbinen sind einfach billiger, das ist eine Blase.“ Und ich so: „Leute, es geht um die Zeit bis zur Stromversorgung. Ihr habt den Zug komplett verpasst.“

Sie verstehen die Zwänge dieser Kundengruppe nicht.

Ich weiß. Du verstehst nicht, warum die Leute das wählen. Es ist nicht, weil es billiger ist. Die Wirtschaftlichkeit pro Megawatt oder so ist deutlich schlechter. Aber du kannst es jetzt haben. Und wenn du dein Rechenzentrumsprojekt um mindestens sechs Monate verzögern musst – ich rede mit mehr KI- und Halbleiter-fokussierten Hedgefonds, und die sagen dann: „Oh, wir kennen diese anderen Energie-Hedgefonds, die auf Short bei Bloom sind. Warum sollte man selbstmörderisch genug sein, um das zu shorten?“ Es passieren viele seltsame Dinge in der Finanzwelt. Das kann ich nicht erklären.

Welche anderen Ebenen werden zum Engpass?

Indiumphosphid ist so schlimm. Es ist wirklich verrückt. Ich weiß nicht, was viele Leute tun werden, aber Indiumphosphid, alles, was mit Indiumphosphid zu tun hat, ist wirklich, wirklich, wirklich schlimm.

Indiumphosphid wird für Laser und Optik verwendet, weil Silizium kein Licht erzeugen kann. Und die Leute verstehen immer noch nicht, wie schlimm es ist, weil CPO die Anforderungen an Laser in Bezug auf die Rauschleistung erhöht.

Das ist Aixtron, zum Beispiel?

Oh, ja. Sie stellen die Ausrüstung für die Indiumphosphid-Herstellung her. Sie sind nicht unbedingt der Engpass – nun, sie sind es wahrscheinlich – aber sie bauen mehr Maschinen, und die Lumentums, Coherents und Sumitomos dieser Welt kaufen diese Maschinen. Ich bin long auf dieses Zeug. Es geht mehr um die Kapazität von Lumentum und Coherent. Die Substrat-Welt, AXT, Sumitomo, IQE, all diese Jungs, sie sind der Engpass.

Was ist IQE?

Es gibt dieses britische Unternehmen, ich glaube, sie machen die Epitaxie. Es gibt eine Reihe von Namen in dieser Indiumphosphid-Herstellungskette. Und im Moment ist das alles im Grunde eine Katastrophe.

Es gibt einfach nicht genug Indiumphosphid für die Welt, oder?

Ja, nun, die Indiumphosphid-Minen sind, glaube ich, im Moment in Ordnung. Aber die Verarbeitung von Indiumphosphid zum Kristall, dann das Wafernehmen, dann das Epitaxieren des Wafers und dann das Drucken der Laser auf den Wafer – all das ist eine komplette Katastrophe. Denn die Art, wie CPO-Laser funktionieren, ist, dass sie eine viel höhere Leistung benötigen, was bedeutet, dass die Die-Größe deutlich größer sein muss, und sie benötigen viel schmalere Linienbreiten und eine bessere Rauschleistung, was bedeutet, dass du die Die-Größe im Allgemeinen vergrößern musst.

Das ist auch ein Grund, warum SiPho und Tower Semi durch die Decke gehen. Traditionell funktionierte die Transceiver-Welt so: Du beginnst mit EML, das im Grunde ein einzelner monolithischer Indiumphosphid-Chip ist, der den Modulator, der das Licht auf und ab bewegt, und den Dauerstrichlaser auf demselben Indiumphosphid-Chip vereint. Und EML schneidet aus physikalischen Gründen immer besser ab als Silizium-Photonik. Und in der Regel passiert nach ein oder zwei Jahren, nach jeder Generation von Transceivern (wie 400G oder 800G), dass die Leute anfangen, zu SiPho zu wechseln, um Geld zu sparen. Du findest heraus, wie du die SiPho-Leistung gut genug machst, und du sparst Geld, weil du jetzt anstatt eines großen EML einen viel kleineren Dauerstrichlaser kaufst und ihn einfach in das SiPho-Modul einbaust und dort modulierst.

Aber jedenfalls ist SiPho diesmal durch die Decke gegangen, weil alle denken: „Moment, es gibt eine EML-Knappheit“, und dann verlagern dieselben Leute, die EMLs herstellen, auch die CW-Laser ihre Kapazität auf CW, weil es margenstärker ist und mehr Nachfrage besteht. Jetzt bringt die CPO-Nachfrage die EML-Versorgung um, die bereits massiv unterversorgt war. Und jetzt sind 1,6T-Transceiver die erste Generation, bei der SiPho fast von Anfang an dominant ist. Ich glaube, innerhalb von sechs Monaten hatte es die Mehrheit. Ich kenne die genauen Zahlen nicht, aber es ist völlig anders. Wenn du dir jede Transceiver-Generation und dann den SiPho- vs. EML-Marktanteil ansiehst, ist es diesmal völlig anders. Und das liegt daran, dass es eine so lähmende Indiumphosphid-Knappheit gibt.

Was den nächsten betrifft, würde ich Speicher sagen, weil es einfach keine Reinraumkapazität gibt. Jemand hat mich eine Frage gefragt, die nicht völlig dumm ist: „Oh, Samsung hat Logik-Fabs und Speicher-Fabs, warum verlagern sie nicht einfach die Logik-Fab-Linie auf Speicher?“ Weil die Speicher-Fabs völlig anders sind, was die verwendete Ausrüstung und den Prozess und alles betrifft. Du hast also nur drei Unternehmen, die DRAM herstellen können. Sie sind alle komplett ausgebucht. Es kommt in absehbarer Zeit keine Kapazität hinzu.

Das sind Hynix, Micron und Samsung?

Ja, diese drei. Das ist der zweitschlimmste Engpass. Aber die Leute sind sich dessen ziemlich bewusst.

Gibt es einen großen Unterschied zwischen den drei Speicherherstellern?

Ich persönlich denke nicht, dass es darauf ankommt. Es gibt viel Drama und Lärm. Es gibt eine solche Knappheit. Alles wird mit etwa 80 % Bruttomarge verkauft. Wen interessiert das? Historisch gesehen war SK Hynix entscheidend in Führung, und Samsung hat sich quasi selbst verbrannt. Es war ziemlich schlimm. Und Micron war ungefähr auf dem zweiten Platz. Und jetzt gibt es im Grunde viel Drama um die HBM4-Die-Geschwindigkeiten, all diesen Lärm von den Lieferketten-Leakern. Im Grunde wurde bei HBM, all dem HBM vor HBM4, 3E, 3, alles, der Basis-Die, der eine Reihe von Logikschaltungen für die Schnittstelle enthält, auf einem internen DRAM-Prozessknoten hergestellt. Der Grund, warum das wichtig ist, ist, dass es billiger ist, weil die DRAM-Leute einfach ihre eigenen Fabs dafür nutzen. Aber die Qualität der Transistoren ist viel schlechter. DRAM ist für langsame, winzige Transistoren und riesige Kondensatoren ausgelegt, nicht für Logikdesign, also bist du in der Geschwindigkeit begrenzt.

Mit HBM4 wurden alle irgendwie gezwungen, diese Strategie aufzugeben. Nun, sie hätten diese Strategie aufgeben sollen. Was passierte, war, dass SK Hynix zu TSMC ging und einen 12-Nanometer-Klasse-Prozess verwendete. Also viel besser als der Mist, den sie mit dem internen DRAM-Prozess zusammenstellen konnten. Aber es ist immer noch 12 Nanometer, nicht sehr gut. Samsung hat seinen eigenen internen SF4X-Logikknoten, und es ist nicht 4 Nanometer, ich würde sagen, bestenfalls gleichauf mit TSMC N6 oder irgendwo zwischen TSMC N6 und N7. Es ist ziemlich gut für das, was es tun muss. Micron ist dumm. Sie sagten: „Nein, wir werden unseren eigenen internen DRAM-Prozess verwenden.“ Und sie haben sich quasi ins Bein geschossen und sich selbst verzögert. Und es gibt all dieses Drama: „Oh nein, Micron schafft es nicht in Nvidia Rubin.“ Und niemanden interessiert es. Sie werden einfach mehr normalen DRAM oder HBM3E zu himmelhohen Preisen verkaufen. Nichts davon spielt eine Rolle. Alle drei werden alles, was sie haben, zu ziemlich hohen Preisen verkaufen. Und die Qualitätslücke ist jetzt ziemlich gering. Früher war Samsungs HBM3 so schlecht, dass niemand es verwenden konnte. Zu keinem Preis würden bestimmte Leute Samsungs HBM3 verwenden, weil es viele Leistungsprobleme hatte. Es hat einfach Strom gesoffen. Aber jetzt sind sie alle nah genug beieinander, dass – sagen wir, Nvidia hat höhere Standards und lehnt Microns HBM4 ab, sie werden HBM4 an jemand anderen verkaufen oder einfach normalen DRAM zu irrsinnigen Bruttomargen verkaufen. Das wird Micron finanziell nicht beeinträchtigen. Es gab also viel Drama hinter den Kulissen, und ich finde es ehrlich gesagt dumm.

Wenn du Speicher sagst, meinst du dann speziell DRAM oder HBM und DRAM?

Ja, wenn ich DRAM sage, schließe ich HBM mit ein. Es ist alles dasselbe. Speicher kategorisiere ich in DRAM und NAND-Flash. Das sind die beiden Kategorien. DRAM ist alles, was Speicher ist und nicht NAND-Flash.

Der drittgrößte Engpass, den du genannt hast, sind Logik-Fabs?

Du kannst sehen, dass Intel durch die Decke geht, es wird behoben. Die Sache ist, dass TSMC einfach nicht genug Kapazität hat. Sie waren zu konservativ. Vor sechs Monaten hatte Samsung praktisch keine Auslastung, fast keine, bei ihrer fortschrittlichen Logik. Und Intel war nur intern. Jetzt drängen externe Unternehmen herein, und Samsung hat auch eine ziemlich hohe Auslastung. Es gab also eine gewisse Flexibilität, bei der die Logiksituation im Februar wirklich schlecht aussah. Jetzt ist es besser. Es ist immer noch ziemlich schlecht, aber es hat sich nicht verschlechtert. Speicher und Indiumphosphid haben sich in den letzten sechs Monaten verschlechtert. Logik hat sich verbessert, ist aber immer noch ziemlich schlecht, weil es lange dauert, diese Linien aufzubauen, und wieder gibt es nur drei Player: Samsung, Intel, TSMC.

Welche anderen Engpässe haben sich in den letzten sechs Monaten verschlechtert?

Nein, hauptsächlich diese beiden in Bezug auf die Kategorie. Ich glaube nicht, dass Power-Halbleiter schlimm werden, aber ich denke, sie sind die interessanteste Kategorie, weil es viel freie Kapazität gibt, da die Elektrofahrzeug-Situation nicht gut war.

Kannst du Power-Halbleiter erklären?

Power-Halbleiter wandeln Strom von einer Spannung in eine andere um. Du kannst es dir so vorstellen: Du hast dein Stromnetz mit mehreren tausend Volt Wechselstrom. Du musst das in niedrigeren Wechselstrom umwandeln, und dann musst du es schließlich in Gleichspannung umwandeln. 800 Volt Gleichstrom, 400 Volt Gleichstrom, 240 Volt Wechselstrom. Und schließlich, nach mehreren Schritten, zieht dein High-End-Logikchip etwa 1,2 Volt, ungefähr. Um genauer zu sein: Jeder High-End-Logikchip, die 3-Nanometer-Chips, die Standardspannung liegt bei etwa 0,75 Volt. Und dann gibt es einige High-Side-Spannungen bei etwa 1,1 Volt oder 1,5 Volt. Du musst also von sehr hoher Spannung auf eine viel niedrigere Spannung für den Chip heruntergehen. Du benötigst mehrere Stufen der Umwandlung. Und es gibt diese Materialien, die Wide-Bandgap-Materialien, Siliziumkarbid und Galliumnitrid, die aus physikalischen Gründen viel besser sind als Silizium.

Effizienter, also sparst du Energiekosten und weniger Kühlung, so etwas?

Ja, genau. Effizienter. Und es kann viel höhere Spannungen vertragen. Wenn du versuchst, einen Siliziumchip an dieselbe Stelle zu setzen, brennt er durch, er brutzelt.

Welcher ist dein Favorit von denen, die du genannt hast: TI, Navitas, onsemi, Infineon?

Nun, dieses Wochenende werde ich den Beitrag haben. Er ist fast fertig. Im Moment bei GaN sind TI und Navitas gleichauf auf dem ersten Platz, und Infineon ist ein entfernter Zweiter. onsemi behauptet, etwas Erstaunliches zu haben, genannt vertikales GaN. Aber es sind nur Slides. Keine Datenblätter, keine tatsächlichen Spezifikationen. Es ist nur: „Wir haben ein Ding gemacht, und es wird all diese fantastischen Zahlen haben.“ Okay, sicher. Also onsemi, vielleicht haben sie etwas, vielleicht nicht. Bei Siliziumkarbid habe ich es noch nicht herausgefunden, ich brauche noch ein paar Tage. Aber der interessante Player bei Siliziumkarbid ist – es ist eine Meme-Aktie, aber es ist auch keine Meme-Aktie. Es ist Wolfspeed.

Erzähl mir von Wolfspeed.

Sie haben massiv Überkapazitäten aufgebaut. Sie sind reines Siliziumkarbid und vertikal integriert. Sie stellen die Wafer, die Substrate, sie stellen die Bauelemente her, sie machen alles im Haus.

Nebenbei: Hedgefonds melden sich bei dir und wollen nur deine Meinung zu Sachen, und du tust es, weil es Spaß macht und du so siehst, welche Fragen sie stellen?

Ich lerne auch. Ich verstehe, wie diese Jungs denken. Denn ich bin nur eine Ameise. Ich bewege den Markt nicht. Diese Jungs bewegen den Markt. Sie teilen auch Ideen. Speziell Wolfspeed kam aus einem Hedgefonds-Gespräch.

Wolfspeed kam aus einem Hedgefonds-Gespräch?

Das kam von fünf. Es ist eine sehr interessante Aktie. Sie sind vertikal integriert, 100 % in den USA ansässig. Sie haben Siliziumkarbid überbaut und wurden von der chinesischen Konkurrenz und dem Abschwung bei Elektrofahrzeugen getötet. Sie sind buchstäblich bankrott gegangen, Chapter 11 Insolvenz. Sie sind erst vor relativ kurzer Zeit aus der Chapter 11 Insolvenz herausgekommen, ich glaube vor etwa vier Monaten. Ich muss nachprüfen. Aber es ist sehr aktuell. Alle haben aufgehört, bei ihnen zu kaufen, weil dein Lieferant in der Insolvenz ist. Ihre Fabrikauslastung liegt angeblich bei etwa 30 %. Sehr, sehr niedrig. Und jetzt sind sie zurück. Und die Sache ist: Wenn der Markt irgendwie umschlägt, ist diese Aktie ein 5X. Sie ist so gehebelt und verrückt. Aber sie ist buchstäblich gerade erst bankrott gegangen. Und sie hat negative Bruttomargen. Du kannst dir ihren letzten Gewinnbericht ansehen. Ihre Bruttomarge liegt bei minus 20 %. Und ihre Prognose lautet: „Wir erwarten weiterhin negative Bruttomargen.“ Sie verlieren buchstäblich Geld bei jedem Chip, den sie produzieren, weil sie so unterausgelastet sind.

Das Interessante nun, und warum die Leute mich angepingt haben, ist, dass Wolfspeed diesen 10-Kilovolt-Siliziumkarbid-Chip entwickelt hat. Diese Chips sind buchstäblich nur ein Transistor, ein super, super robuster Transistor, der wahnsinnige Spannungs- und Strompegel aushalten muss. Die derzeit auf dem Markt erhältlichen Siliziumkarbid-Transistoren mit der höchsten Spannungsfestigkeit liegen im Bereich von 1700 bis 2000 Volt. Infineon hat ein 3,3-Kilovolt-Bauteil. Niemand hat etwas darüber hinaus, außer Wolfspeed. Wolfspeed sagt: „Oh, wir können ein 10-Kilovolt-Bauteil herstellen.“ Und ich schaue mir das Datenblatt an, und dieses Ding ist wahnsinnig. Ich habe keine Ahnung, wie zum Teufel sie es gemacht haben. Und es ist nicht sofort offensichtlich, ob es besser oder schlechter ist. Denn Transistoren sind nur Schalter, und idealerweise möchtest du, wenn du den Transistor einschaltest, dass er ein perfekter Schalter ist, keinen Widerstand hat. Aber das ist nie der Fall. Du wirst einen gewissen parasitären Widerstand haben. Wenn ein Transistor eingeschaltet ist, verhält er sich wie ein winziger Widerstand (das ist stark vereinfacht). Ich schaue mir den parasitären Widerstand dieses Wolfspeed-Bauteils an und die parasitäre Gate-Kapazität, die die Schaltgeschwindigkeit beeinträchtigt, und vergleiche es mit völlig anderen Bauteilen, wie 2000- und 3000-Volt-Bauteilen von Wettbewerbern. Die Parasiten sind schlechter, aber du brauchst nur eines davon anstatt drei. Ich musste mir einige Schaltungssimulationen ansehen, um das herauszufinden. Ich denke, das 10-Kilovolt-Bauteil ist tatsächlich ziemlich gut. Und es wird für die Infrastruktur nützlich sein. Im Rechenzentrum ist es völlig nutzlos. Und wenn ich das einigen dieser Fonds-Jungs erzähle, sagen sie: „Oh nein, es ist nicht nützlich im Rechenzentrum.“ Ich so: „Alter, du übersiehst das große Ganze. Festkörpertransformatoren. Du willst Lastregelung für das Stromnetz zwischen der Hochspannungs-Wechselspannung und dem Rechenzentrum.“

Ich bin also viel optimistischer in Bezug auf die Stromversorgung, die direkt außerhalb des Rechenzentrums sitzt, als im Rechenzentrum. Ich habe das Gefühl, dass sich alle darauf konzentrieren, wer das Power-Rack im Nvidia-Design und im OCP-Design gewinnen wird, physisch im Rechenzentrum. Und das ist eine attraktive Gelegenheit. Aber das Zeug außerhalb des Rechenzentrums, das zwischen dem Rechenzentrum und dem Stromnetz sitzt, ist auch super interessant. Tatsächlich, arguably interessanter. Also ja, ich liebe Power-Halbleiter. Ich denke, das wird das nächste Ding sein, das abhebt und zum Engpass wird. Es wird nicht der Hauptengpass sein, weil so viel zusätzliche Kapazität herumliegt, da Elektrofahrzeuge so gut wie tot sind. Aber es ist das aufregendste, wo sich Dinge ändern werden.

Du bist speziell aufgeregter über die Stromversorgung außerhalb des Rechenzentrums im Vergleich zu innen?

Bist du jemals vorbeigefahren und hast diese runden Dinger mit den großen Kästen in der Nähe von Umspannwerken gesehen? Das sind traditionelle Transformatoren. Die Art, wie die funktionieren, ist, dass du einen riesigen Eisenkern hast und dann eine Reihe von Kupferwicklungen auf einer Seite und Kupferwicklungen auf der anderen Seite. Und das sind im Grunde meist passive Geräte, bei denen du 100 Kilovolt Wechselstrom auf etwa 35 Kilovolt Wechselstrom heruntertransformierst, dann die 35 Kilovolt Wechselstrom auf etwa 7 Kilovolt Wechselstrom, und dann transformierst du es auf etwa 240 Volt, 120 Volt Wechselstrom, der in dein Haus geht. Oder etwa 2000 Kilovolt Wechselstrom, der zu Industriekunden geht, zur Übertragung von Strom über große Entfernungen. Du willst extrem hohe Spannung, um die Stromverluste zu reduzieren. Aber um es tatsächlich zu nutzen, musst du es mit Transformatoren heruntertransformieren. Diese Transformatoren sind typischerweise diese passiven, sperrigen Dinger, und sie sind schlecht, weil es lange dauert, sie zu kaufen. Du gibst jetzt eine Bestellung auf (und das ist vor dem KI-Zeug), und 12 bis 18 Monate später bekommst du sie, weil es ein riesiger Metallklumpen ist. Es dauert einfach lange, sie herzustellen.

Was ich denke, dass die Leute nicht verstehen, ist, dass sie ein riesiges Problem mit KI-Rechenzentren haben. Denn überlegt mal: Stellt euch vor, ihr arbeitet bei einem Energieversorger, PG&E oder so. Ihr habt diese neuen Kunden, die ans Netz gehen und an euer Stromnetz angeschlossen werden müssen, deren Last aggressiv auf und ab schwankt. Diese Typen sagen: „Oh, wir brauchen jetzt ein Gigawatt." Und fünf Minuten später: „Nein, eigentlich brauchen wir nur 800 Megawatt." Das ist ein absoluter Albtraum für die Netzbetreiber. Und ich weiß nicht, ob ihr das gesehen habt, es ging letztes Jahr auf Twitter rum, das PyTorch-Team hat ein spezielles Flag namens „Power Plant No Blow Up" hinzugefügt. Das war eine lustige Sache, die die Runde machte. Was macht dieses Flag nun? Das Problem war, dass man viele GPUs hat, 10.000 GPUs, 100.000 GPUs. Die machen eine Menge Berechnungen für das Training, und dann hört ein Teil von ihnen entweder auf zu rechnen oder rechnet mit einer viel niedrigeren Rate, weil sie die Verbindung untereinander herstellen, miteinander kommunizieren, All-Reduce und so weiter. Und das verursachte Instabilität im Stromnetz. Und der Netzbetreiber sagt: „Was auch immer ihr tut, hört auf damit, sonst trennen wir euch vom Netz. Das ist gefährlich. Ihr destabilisiert das Netz." Was das Flag in PyTorch also macht: Wenn die GPU keine Berechnungen durchführen muss, wird sie gezwungen, trotzdem mit maximaler Geschwindigkeit zu rechnen. Einfach sinnlose Berechnungen durchführen und die Ergebnisse ins Nichts schicken. Nehmen wir an, euer Chip läuft mit 500 Watt. In einer normalen Situation würde man wollen, dass er auf 200 Watt runtergeht, wenn er nicht arbeitet. Aber in diesem Fall: Nein, wir wollen nicht, dass er auf 200 Watt runtergeht. Haltet ihn die ganze Zeit bei 500 Watt, weil wir nicht wollen, dass der Netzbetreiber sauer auf uns wird. Und der Grund, warum die Netzbetreiber sauer sind: Wenn man über ein Stromsystem nachdenkt, bei diesen passiven Komponenten, diesen passiven Transformatoren, pflanzt sich jedes Ziehen und Drücken der Last zurück ins Netz und destabilisiert es. Das war in der Vergangenheit in Ordnung, weil die Leute vom Stromnetz das gemanagt haben, und es gibt einige Workarounds, um Netze zu stabilisieren. Aber das ist jetzt nicht mehr der Fall.

Also haben wir über die normalen Transformatoren gesprochen. Es gibt jetzt Festkörpertransformatoren. Ich weiß nicht, warum sie Festkörpertransformatoren heißen, denn die vorherigen Transformatoren sind auch Festkörper, sie sind passiv. Anstatt einen Klumpen Eisen und eine Menge Kupferwicklungen zu haben, baut man ein paar Schaltungen mit Siliziumkarbid-Chips und kann dasselbe tun, Hochspannungs-Wechselstrom in eine niedrigere Wechselspannung umwandeln oder sogar Hochspannungs-Wechselstrom direkt in Gleichstrom umwandeln. Warum haben die Leute das nicht gemacht? Es gibt das seit 2020. Es ist teurer. Man kann sich so viel beschweren, wie man will, über die traditionellen Transformatoren, aber sie sind billig und man wartet 12 Monate und bekommt das Teil. Die Festkörpertransformatoren sind viel teurer, aber sie haben einen enormen, enormen Vorteil. Und zwar kann man Lastregelung betreiben. Man kann den Festkörpertransformator dynamisch programmieren, um sicherzustellen, dass Strom und Spannung auf beiden Seiten ungefähr gleich sind. Man kann die Schaltfrequenz ändern. Wenn also die Last steigt, kann man mit einer höheren Frequenz schalten, oder wenn die Last sinkt, schaltet man mit einer niedrigeren Frequenz.

Und sie verwenden Leistungshalbleiter in den Festkörpertransformatoren.

Ja, das sind also aktive Bauelemente. Es sind im Grunde eine Menge Transistoren. Anstatt passive Bauelemente zu haben, eine Menge Induktivitäten, Kupferwicklungen und ein paar Dioden, sind es Transistoren. Man schaltet Transistoren ein und aus, um die Leistung zu verwalten, nicht nur umzuwandeln, sondern auch zu verwalten, so dass man saubere 800 Volt bekommt, nicht 800 Volt plus/minus 20 Volt oder so. Oder 1000 Ampere liefert, nicht 1000 Ampere plus/minus 10%. Man kann es regeln. Und das ist riesig, denn anstatt Geld mit dem „Power Plant No Blow Up"-Flag in PyTorch zu verschwenden, kann man die GPU heruntertakten, man hat einfach so viele Effizienzgewinne. Und die Netzbetreiber sind auch zufriedener mit einem. Oft ist es so mit dem Genehmigungsmist, sagen wir, man versucht, ein Rechenzentrum zu bauen, und die Genehmigungen kommen nicht durch, und man fragt sich: „Warum ist das passiert?" Es liegt daran, dass der Energieversorger sagt: „Ihr werdet das Netz destabilisieren. Das können wir nicht machen." Und dann kann man sagen: „Nun, ich werde ein paar Festkörpertransformatoren einbauen, und hier ist, wie ich euer Netz nicht destabilisieren werde." Und dann sagt der Energieversorger: „Okay, gut, ich verkaufe euch Strom, schließt euch an." Die Leute haben diesen Engpass also auf verschiedene kreative Weise umgangen. Aber ich denke, jetzt ist die Zeit für Festkörpertransformatoren gekommen, und man sollte die Kosten dafür in Kauf nehmen, denn der Wert ist da. Ja, man zahlt mehr für die Box, die den Strom umwandelt. Aber man bekommt all diese Vorteile. Ich denke, das wird im nächsten Jahr an Fahrt aufnehmen. Das ist eher eine Geschichte für die zweite Hälfte des Jahres 2027. Aber so funktionieren Aktien nun mal: Die Leute erkennen es und kaufen im Vorfeld. Aktien blicken in die Zukunft. Das fängt jetzt also an zu passieren, und ich denke, es wird in den nächsten 36 Monaten richtig abheben.

Wären Sie mehr begeistert von den Leistungshalbleiter-Unternehmen als von den Unternehmen, die die Festkörpertransformatoren verkaufen?

Im Allgemeinen ja, denn zumindest mein persönlicher Anlagestil ist, dass ich die Technik verstehe, oder zumindest versuche, sie zu verstehen, und ich kann die Differenzierung erkennen. Ich vergleiche und kann herausfinden, wessen Chip besser ist als der andere, wer einen Aufpreis verlangen kann. Die Leute, die diese Chips kaufen und die Box bauen, haben auch einen echten Wert, wegen des Steuerungsaspekts. Nehmen wir an, die Box hat tausend sehr starke Transistoren. Wenn man die Schutzschaltung und die Steuerung nicht hat, ist das extrem gefährlich. Man kann alles in die Luft jagen, was daran angeschlossen ist, einen Spannungsstoß senden. Es gibt also sorgfältige Designüberlegungen, wie man diese Leistungshalbleiter zusammensetzt. Es gibt hier zwei Aktien. Eine Reihe von Leuten hat mir das immer wieder vorgeschlagen, und ich habe es nicht ernst genommen. Und als mir dann die 15. Person das schickt, denke ich: „Okay, gut, ich werde es lesen." Es gibt diese beiden Firmen namens SolarEdge und Enphase Energy. Ihre Geschichte ist die Herstellung von Mikro-Wechselrichtern für Solarmodule. Das Problem bei der Installation von Solarmodulen ist, dass die Solarmodule Gleichstrom liefern, aber euer Haus natürlich mit Wechselstrom läuft, also müsst ihr jedes Solarmodul von Gleichstrom in den richtigen Wechselstrom umwandeln. Und dann gibt es eine Menge Sicherheitskram, und man muss das steuern und alles. Diese Firmen haben also diese kleinen Mikro-Wechselrichter-Dinger für private Solaranlagen hergestellt. Seitdem die Steueranreize für private Solaranlagen den Bach runtergegangen sind, sind diese Firmen komplett abgestürzt. Ihr könnt euch den Aktienkurs ansehen. Es gab eine Blase um 2021 herum, und dann sind sie um 90% gefallen. Sie sind jetzt nur noch Abfallfischer. Und diese Firmen schwenken jetzt auf Festkörpertransformatoren um. Sie sehen die Gelegenheit. Und ich hatte noch keine Zeit, mich vollständig damit zu befassen, aber ich denke tatsächlich, dass es legitim ist. Es ist super degen. Es ist eine super dumme Idee. Aber ich denke, es würde tatsächlich als Aktie funktionieren. Denn sie haben sehr viel Erfahrung mit der Montage und der Schutzschaltung für dieses Zeug. Und das ist wahrscheinlich sogar einfacher als das, was sie in der Solarwelt machen, denn anstatt es über ein ganzes Dach zu verteilen, packt man einfach alles in eine Box und kann den Überstromschutz viel einfacher bewerkstelligen. Und sie haben sogar eine differenzierte Technologie. Enphase hat einen 22-Nanometer-Steuerungs-ASIC. Sie haben ihren eigenen 22-Nanometer-Chip entwickelt, um all diese Mikro-Wechselrichter zu steuern, weil man ein gewisses Maß an Mathematik und eine Reihe verschiedener Signale an all diese analogen Teile senden muss. Es ist ein Problem verteilter Systeme. Im Grunde muss man etwa 10.000 Transistoren sagen, mit welcher Geschwindigkeit sie schalten müssen, und dann auch Fehler erkennen und so weiter. Sie haben also einen Steuerungs-ASIC dafür, und das vereinfacht ihre Sache. Das ist ein legitimer Wettbewerbsvorteil.

Was ist mit Delta Electronics?

Ja, Delta ist der Große. Es gibt also Delta und Vertiv und Eaton und all diese großen Jungs. Das ist ihr Kerngeschäft. Das machen sie bereits. Und die Aktien sind bereits gestiegen. Das Attraktive an SolarEdge und Enphase ist, dass sie für tot erklärt wurden und niemand mehr auf sie achtet. Und diese Aktien, wenn sie funktionieren, 5X. Will man etwas jagen, das bereits stark gestiegen ist, wie Vertiv, oder will man etwas Degenhaftes jagen? Es macht also Spaß. Es ist keine schreckliche Idee. Es könnte funktionieren. Wenn man zocken will, steckt man ein halbes Prozent seines Portfolios da rein. Klar, warum nicht.

Was fragen die Hedgefonds?

Sie wollen im Allgemeinen meine Meinung zu Dingen, weil mein Buch öffentlich ist und ich sie alle übertreffe, wenn auch mit einem wahnsinnigen Risikoniveau, wohlgemerkt. Viele dieser Leute sind marktneutral, also ist meine Performance nicht fair mit ihrer zu vergleichen. Aber ich schlage mich ziemlich gut. Sie fragen mich nach Meinungen und so, und oft dreht es sich um technische Dinge, weil ich nichts von Bewertung verstehe. Manchmal, wenn es einen neuen Fonds gibt, fragen sie: „Oh, was denkst du über die Bewertung?" Lest ihr nicht, was ich schreibe? Aber ja, technische Sachen. Zum Beispiel die Wolfspeed-Sache. Keiner von ihnen weiß, ob dieses 10-Kilovolt-Siliziumkarbid gut ist und wo es eingesetzt werden würde. Und ich glaube nicht einmal, dass Wolfspeed selbst weiß, wie es eingesetzt werden würde, denn sie haben die Stromversorgung für Kernfusionsreaktoren in das Datenblatt und in ihre Pressemitteilung aufgenommen. Ich denke mir: „Ihr strengt euch wirklich sehr an." Oft erzählt das Management dieser Firmen diesen Finanzleuten etwas, und die fragen: „Sagen sie die Wahrheit?" Und ich sage: „Ja oder nein, oder es ist kompliziert, ihr solltet diese Folgefragen stellen." Es ist also meistens technisch, aber nicht zu 100% technisch.

Cerebras, Ihre Meinung jetzt.

Ich liebe es. Ich habe einige harte Kritik. Andrew Feldman (@andrewdfeldman) ist sich dessen anscheinend sehr schmerzhaft bewusst. Sie sind auf FP16, was ein dummer Fehler ist. Wenn sie FP4 implementieren, bekommen sie dadurch im Grunde eine 3- bis 4-fache Kapazität. Und das ist eine einfache, tief hängende Frucht. Es ist nur digitale Logik. Sie müssen auch ihre E/A reparieren, um den KV-Cache auszulagern. Und ich kaufe dieses Argument nicht, dass es gut genug ist. Das ist eine lahme Ausrede. Wenn man die Möglichkeit hat, sein Produkt 10-mal besser zu machen, dann macht man sein Produkt 10-mal besser. Gebt euch nicht mit Mittelmäßigkeit zufrieden. Und schließlich deuten ihre Bruttomargen darauf hin, dass ihre Ausbeute extrem schlecht ist. Sie behaupten öffentlich, dass ihre Ausbeute auf Wafer-Ebene 100% beträgt, und ich glaube ihnen, was bedeutet, dass ihre Ausbeute beim Verpacken des Wafers schrecklich ist. Sie liegt irgendwo zwischen 20 und 40%. Ich weiß nicht, warum sie so schlecht ist, aber sie müssen das beheben. Ich habe immer noch Kritik an ihnen, und es ist eher so, dass ich ein aktivistischer Investor sein möchte. Ich kaufe einige ihrer Aktien. Ich gehe nicht weg. Ich bin optimistisch, aber auch hart, weil es so viel besser sein könnte. Andrew Feldman verleugnet das E/A-Problem. Und ich denke mir: „Nein, Alter, hör auf, es zu verleugnen, und repariere es einfach. Du kannst es besser machen. Mach das Produkt einfach besser."

Sind Sie immer noch pessimistisch gegenüber Neoclouds?

Ja, irgendwie. Seht euch an, was letztes Quartal mit CoreWeave passiert ist. Ich denke, im Grunde haben sie höhere Kosten wegen all der Engpässe, der Optiken und des Speichers. Und alle Finanzleute fragten: „Gebt ihr die Kosten durch den Vertrag an den Kunden weiter?" Und der CoreWeave-CEO hat versucht, diese Frage zweimal zu beantworten, und ich habe keine Ahnung, was die Antwort ist. Da die Aktie gefallen ist, nehme ich an, die Finanzleute haben interpretiert, dass sie über den Tisch gezogen werden. Sie haben einen langfristigen Vertrag unterschrieben und können die Kosten nicht weitergeben.

Irgendwelche Gedanken dazu, welche Neoclouds am ehesten sterben werden?

Die kleineren. CoreWeave ist groß genug. Oracle ist groß genug. Nebius ist wahrscheinlich groß genug. Ich weiß nicht, ob sie sterben, aber irgendwann wird es ein Problem geben. Das Niveau der Verschuldung hier. Sobald es einen Abschwung gibt, oder selbst wenn die Zinsen steigen, könnte es in der zweiten Jahreshälfte Zinserhöhungen geben, und das wird sie ziemlich hart treffen. Es ist einfach ein schlechtes Geschäft. Es gibt so viele andere tolle Dinge, in die man investieren kann. Macht das einfach. Ich weiß nicht, warum Leute diesen Mist besitzen wollen.

Terafab?

Es gibt nicht genug Informationen, außer dass es so aussieht, als ob sie vielleicht den Intel 14A-Prozess lizenzieren. Das ist meine Vermutung, was da los ist. Es gibt keine Informationen.

Der CPO-Ramp wird ohne allzu viele Probleme stattfinden?

Ich glaube nicht, dass es Probleme geben wird. Die Leute, die sich um die Zuverlässigkeit sorgen, liegen völlig falsch und verstehen die Technik nicht. Die Probleme werden die Indiumphosphid-Knappheit sein, die wirklich, wirklich schlimm ist. Aber die Bereitstellung, nein, ich glaube nicht, dass das ein Problem sein wird. Wenn man es richtig macht, wenn man seine Hausaufgaben macht, wird es gut. Es wird sogar zuverlässiger sein als Transceiver.

Irgendeine Meinung zu Amkor?

Nein, ich verfolge die Verpackungsanbieter nicht zu sehr.

Was ist mit Ibiden oder Unimicron?

Nein, ich weiß nicht. Keine Meinung.

Nokia oder Infinera?

Oh, ja. Es hat das Potenzial, eine viel billigere Version von Ciena zu sein. Wenn man also denkt: „Wow, Ciena ist stark gestiegen, die Bewertung ist hoch", nun, dann könnte man einfach Nokia nehmen, und sie versuchen, dasselbe zu tun. Ich denke also, es ist ein legitimes Value-Investment. Es ist eines der wenigen Dinge, bei denen die Bewertung vernünftig ist. Ich bin im Moment nicht dabei, aber ich war schon rein und raus, und ich brauche mehr Zeit, um darüber nachzudenken. Aber ja, ich mag es.

Was ist Ihr bevorzugter Weg, um auf Indiumphosphid zu setzen?

Im Grunde Lumentum. Und als riskantere Sache kann man AXT nehmen, und für Halbleiterausrüstung die deutsche Firma AIXTRON. Also diese drei.

Was ist Ihrer Meinung nach im Moment am meisten überbewertet?

Ich würde sagen, microLED, weil ich denke, dass es ein Schwindel ist. Es gibt etwa sieben Alternativen zu microLED, und sie sind alle objektiv besser. Also ja, ich hasse microLED einfach.

GE Vernova.

Ich besitze eine Menge. Ich habe eine Menge Aktien zu etwa 170 in einem meiner Long-Only-Konten gekauft. Mein Durchschnittspreis liegt irgendwo zwischen 170 und 250. Und es ist durch die Decke gegangen, und nun, ich denke, ich werde das nie verkaufen. Also ja, es ist großartig. Gasturbinen. Ich hatte Glück, jemand hat mir früh einen Tipp gegeben. Es ist ein sehr hochwertiger Burggraben. Sie sind einer der wenigen, die das herstellen können. Aber an diesem Punkt sind sie komplett ausgebucht, und die Aktie hat sich so stark bewegt, ich bin mir nicht sicher, wie man die Aktie noch höher treiben kann. Woher kommt die Kapazität oder die Preiserhöhungen? Ich weiß es nicht.

Ein paar aus Ihrem Long-Only-Buch: Besi, Rigaku, TSMC oder Fujikura, was ist am aufregendsten?

Rigaku.

Das sind Röntgenstrahlen für Advanced Packaging?

Besi hat sich schon so stark bewegt, also weiß ich nicht, ob man auf diesen Niveaus kaufen sollte. Aber Rigaku, die traditionellen Player sind Camtek und Onto, und sie machen optische Inspektion für Advanced Packaging. Diese Röntgengeräte wurden traditionell für F&E-Zwecke eingesetzt. Nehmen wir an, ihr seid TSMC und versucht, euren 2-Nanometer-Knoten zu entwickeln, im F&E-Teil müsst ihr wirklich genau hineinschauen und herausfinden, was los ist, ihr kauft eine Handvoll dieser Rigaku-Maschinen, verwendet sie für F&E und verwendet sie nie wieder. Jetzt ist es so weit gekommen, dass man aufgrund von Gate-All-Around-Transistoren, Backside Power Delivery und den viel engeren Toleranzen in der nächsten Generation von Advanced Packaging diese Röntgengeräte einsetzen muss. Mit optischen Geräten ist man aufgeschmissen. Rigaku wechselt also von der Nische F&E zur Produktion. Und Onto weiß, dass sie am Arsch sind, denn sie haben 27% von Rigaku als strategische Partnerschaft gekauft. Und im Grunde läuft auf den Rigaku-Maschinen die Onto-Software. Eine Menge Leute denken: „Oh, das ist bullish für Onto." Nein, ist es nicht. Sie wissen, dass sie die Maschinen nicht herstellen können, also kaufen sie ein Viertel der Marktkapitalisierung des Unternehmens, das die Maschinen herstellen kann, und verkaufen nur noch Software nebenbei. Kauft einfach Rigaku. Also ja, das ist mein Lieblings-Nischen-Halbleiterausrüster. Ich liebe es.

Aus Ihrem Trading-Konto: Tower Semi, Lumentum, Intel, Bloom, Semtech, was ist am aufregendsten?

Semtech. Definitiv Semtech. Die anderen sind schon stark gestiegen. Bei Semtech glaube ich immer noch nicht, dass die Leute vollständig verstehen, was sie herstellen.

Mein sehr naives Verständnis ist, dass es Kupfer besser funktionieren lässt?

Das stimmt, aber es ist nur ein kleiner Teil der Geschichte. Sie stellen analoge Verstärker und analoge Entzerrer her. Und das Schöne ist, dass das in aktiven Kupferkabeln funktioniert, das funktioniert auf Leiterplatten, das funktioniert in linear steckbaren Optiken, das funktioniert in traditionellen Transceivern, das funktioniert in dem Arista XPO-Ding, das funktioniert in optischen Systemen in Chipnähe. Es ist verdammt alles. Es ist nicht nur Kupfer, es ist alles. Es ist erstaunlich. Und sie haben die hochwertigsten Teile. Es ist im Grunde ein Duopol zwischen ihnen und MACOM. Und die Semtech-Teile sind einfach besser. Ich habe die Datenblätter gesehen. Ich habe diese Dinge benutzt. Es gibt also viele Finanzleute, die diese Expertenanrufe mit irgendeinem Geschäftsmann machen: „Oh ja, wir haben eine Doppelbeschaffung, bla, bla, bla." Ich denke mir: „Alter, in welchem Verhältnis? Es sind wahrscheinlich 90% Semtech, weil die Semtech-Teile viel besser sind." Also ja, Semtech hat noch viel Luft nach oben. Das ist verdammt großartig. Es ist überall. Es ist nicht nur Kupfer.

Bei den verschiedenen Segmenten, niedrig, mittel oder hoch, wie eng denken Sie, dass es sein wird. HBM.

Ja, hoch.

Siliziumphotonik, Optik, CPO.

Auch hoch. Angesichts dessen, was mit Tower passiert ist.

Was ist mit Tower passiert?

Die Leute zahlen Tower im Voraus für Kapazität in den Jahren 2027, 2028. Ihre Aktie ist um etwa 15% gestiegen. Es ist ein Multi-Milliarden-Dollar-Lauf. Sie sind ausverkauft.

Gibt es eine Teilmenge der Optik, die Sie für am wichtigsten halten?

Den Indiumphosphid-Teil, die Laser.

Advanced Packaging.

Ich glaube nicht, dass das so eine große Sache sein wird, weil Intel viel hochfährt. Intel hat meiner Meinung nach viel Kapazität in Malaysia.

EMIB-Ansichten?

Ja, EMIB ist gut. Intuitiv kann man sich EMIB als im Grunde dasselbe wie CoWoS-L vorstellen. Es gibt einige technische Details, aber aus der Perspektive eines Designers ist es dasselbe. Das Problem mit EMIB vor 18 Monaten war, dass Intel in seinen Designregeln und im Kundenservice ziemlich idiotisch war, und es war schrecklich. Und dann kam Lip-Bu Tan und feuerte eine Reihe von Leuten, und jetzt ist es gut. Und jetzt verlagern die Leute Sachen auf EMIB, weil, erstens, TSMC nicht genug CoWoS-Kapazität hat, und zweitens, TSMC seinen Reinraumplatz lieber für 60-70% Bruttomarge auf N3 nutzt als für CoWoS. Ich denke also, dass die Situation bei Advanced Packaging, zumindest im Vergleich zu anderen Dingen, nicht so schlimm sein wird, wie die Leute denken. Andere Dinge werden schlimmer sein.

ABF-Substrate.

Ich weiß nicht genug.

HBF.

Ich mag High-Bandwidth-Flash überhaupt nicht. Ich denke nicht, dass es eine gute Lösung ist, weil es Haltbarkeitsprobleme geben wird. Ich mag es einfach nicht. Ich will es nicht einmal als Engpass betrachten. Ich denke einfach, es ist eine schlechte Idee. Wenn man Flash für diese Art von Dingen verwenden will, dann muss man es sockelbar machen. Und wenn es sockelbar ist, muss man es nicht stapeln. Man kann es einfach um den CXL-Controller herum platzieren und irgendwo in einen Server stecken.

Wafer.

Indiumphosphid-Wafer, ziemlich schlecht. Siliziumkarbid-Wafer, nein. Normale Wafer auch nein, das ist wahrscheinlich in Ordnung.

Leiterplatten.

Es ist schlecht. Das Hochgeschwindigkeitszeug, die hochwertigsten Teile für die hohe Geschwindigkeit, die 200G SerDes unterstützen, ja, das ist ziemlich schlecht. Jeder ist irgendwie ausverkauft.

Hatten Sie einen Favoriten dort?

Ich habe mit TTMI gehandelt, rein und raus, aber jetzt ist es so stark gestiegen, dass ich mich nicht damit befassen möchte. Also ja, ich weiß nicht, wen ich da spielen soll. Es gibt auch viele Player in Taiwan, die ich nicht verfolge. Es ist einer der Sektoren, mit denen ich mich nicht befasse.

Strom und Transformatoren.

Aufgeregt, ja. Engpass, nein. Es gibt eine Menge ungenutzter Fab-Kapazität. Aber am meisten aufgeregt, ja.

Aufgeregt, weil es technisch interessant für Sie ist?

Technisch interessant und es ist das nächste Ding, das abheben wird. Ein großer Grund, warum die Lumentum-Aktie sich nach den Gewinnzahlen nicht bewegt hat, sie fiel und stieg dann wieder, ist, dass Hurlston allen erzählt: „Nun, wir haben alles für die nächsten zwei Jahre ausverkauft", und das sagt den Finanzleuten: „Okay, es wird also nicht besser in Bezug auf das Aufwärtspotenzial." Wolfspeed hat das Potenzial, 5X zu machen. Es kann tatsächlich dumm sein. Und dann all die normalen Leistungshalbleiter-Jungs, Infineon, TI, onsemi, STM, sie können sich verdoppeln. Sie können sich verdoppeln. Es ist nicht eingepreist. Anderes ist eingepreist. Das ist es nicht.

Netzwerk-Switches.

Es ist in Ordnung. Es konkurriert nur mit den Logik-Wafern, und es wird etwas CoWoS benötigt, aber nicht so viel. Es ist in Ordnung.

Glasfaser.

Es ist im Moment nicht großartig. Es gibt einige Probleme. Ich glaube nicht, dass es so schlimm ist wie andere Dinge, also sagen wir mittel. Insbesondere polarisationserhaltende Faser. Es gibt einen teureren Typ, der in bestimmten Situationen benötigt wird.

Flüssigkeitskühlung.

Es ist in Ordnung. Ich habe keine Probleme gehört.

Montage- und Testkram.

Das kann man hochfahren. Das wird hochgefahren. Es ist nicht schwierig, hochzufahren.

CPUs.

Großes Problem. Ja, großes Problem. Intel kann bis zu einem gewissen Grad hochfahren. Deshalb ist die Aktie so stark gestiegen. AMD, sie sind etwas hochgefahren, indem sie ihr älteres CPU-Design auf N5 verwenden und das wieder hochfahren. Aber jetzt, wo sie das getan haben, wenn sich die CPU-Situation verschlechtert, was werden sie dann tun? Wenn ich AMD wäre, würde ich meine TSMC-Allokation nehmen und GPUs oder CPUs verkaufen? Man muss sich entscheiden. ARM hat keine Wafer. Qualcomm. So sehr ich es hasse, zuzugeben, das Einzige, was der CPU-Situation helfen kann, ist Qualcomm, weil sie viele Wafer bei TSMC haben.

Aber die Sache ist die, dass Qualcomm der einzige große Player ist, der Wafer-Kapazität hat und sie auf CPUs umstellen kann, denn wenn Android weiterhin von der Klippe fällt, haben sie diese Wafer immer noch bei TSMC bestellt. Sie können TSMC einfach sagen, sie sollen das CPU-Design drucken. Und deshalb ist Qualcomm so stark gestiegen, weil die Leute hoffen. Qualcomm ist bei Data-Center-CPUs schon dreimal gescheitert. Das ist ihr dritter oder vierter Versuch. Wenn sie es diesmal nicht schaffen, gibt es tatsächlich keine Hoffnung mehr. Es muss nur funktionieren. Wenn es funktioniert, werden die Leute es kaufen, und sie werden eine Menge Geld damit verdienen, und es wird das Unternehmen vor dem Android-Implosion und den bevorstehenden Klagen von Apple retten.

Haben Sie einen Favoriten bei CPUs?

Ich bevorzuge Intel für CPUs, weil nichts mich dazu bringen wird, Qualcomm zu kaufen. Aber Leute bei Fonds haben mich gefragt: „Oh, soll ich Qualcomm für CPUs kaufen?" Nun, das kannst du tun, wenn du diesen Idioten vertrauen willst. Aber ich tue es nicht. Aber sicher, wenn du gehen willst, dann geh. Ich gebe zu, dass sie viel Kapazität haben und es schaffen könnten.

DRAM wäre auch hoch?

Ja, ich betrachte DRAM und HBM im Grunde als gleichwertig.

Festplatten.

Keine Meinung. Ich nehme an, da NAND knapp ist, werden Festplatten vielleicht auch knapper. Ich weiß nicht genug darüber.

Rechenzentrums-Hüllen.

Ich verfolge das Zeug nicht. Keine Meinung.

Leistungshalbleiter wären für Sie hoch?

Nein, jetzt ist es niedrig. Es ist jetzt kein Engpass, aber es wird in einem Jahr ein Engpass sein. Deshalb ist es am interessantesten, weil es das Aufwärtspotenzial hat.

NAND.

Ich denke, dass DRAM eine Prämie hat. NAND ist ebenfalls knapp wie DRAM, aber ich denke, NAND ist gefährlicher, weil es anfälliger für Überangebot ist als DRAM. Aber ja, hoher Engpass, aber ich würde sagen, ich bevorzuge DRAM gegenüber NAND.

Gibt es irgendwelche Modelländerungen, wie lange Kontexte, mehr RL, Weltmodelle, von denen Sie erwarten, dass sie die Hardware-Anforderungen stark verändern?

Ich denke wirklich, dass sich alle in Richtung längerer Kontextlängen bewegen. Es hat einen wirtschaftlichen Wert. Die Leute sind bereit, für längere Kontextlängen zu zahlen. Das wird also den gesamten Speicher betreffen, alles. Das ist nur die allgemeine Meinung auf hohem Niveau. Ich verfolge die Modellarchitektur nicht so genau. Aber die wirtschaftliche Seite ist: Ja, die Leute wollen eine super lange Kontextlänge oder eine lange Kette von Token.

Wenn Sie Jensen wären, welche Versorgung würden Sie als nächstes zu sichern versuchen?

Er hat bereits die gesamte Versorgung für alle Dinge gesichert. Ich wollte schon Faser sagen, und dann ging er in den Corning-Deal. Ich denke, der Mann ist ein Gott, und er hat bereits alles gesichert. Ich denke, er hat es tatsächlich geschafft.

Zahlen Sie für irgendwelche Informationsquellen und für welche?

Ich habe ein SemiAnalysis-Abonnement, Fabricated Knowledge, FundaAI, und ich habe Citrini. Das sind die einzigen vier, für die ich bezahle.

Top drei bis fünf Accounts auf X, die Sie mögen.

Ich mag Clive Chan (@itsclivetime) von OpenAI, aber er postet fast nie etwas. Es gibt den Suspended Cap (@ContrarianCurse)-Typen, der ist interessant. TBU (@TBU12345678). Ich mag TBU sehr. Outspoken Geek (@OutspokenGeek). Jukan (@jukan05) liefert gute Informationen. Max Cherney (@chernandburn) von Reuters. Ich mag ihn. Thomas, er postet fast nie, aber Thomas Sohmers (@trsohmers) von Positron postet manchmal nützliche Dinge. Sravan (@SKundojjala) von SemiAnalysis postet ab und zu gute Sachen. Und dann Citrini (@citrini). Oh, Bucket Shop Capital (@bucketshopcap). Ich mag ihn. Dan Nystedt (@dnystedt).

Sell-Side-Leute, die du magst. Stacy Rasgon ist einer.

Ja, ich mag Stacy Rasgon (@BernsteinRasgon) und Vivek Arya (B of A). Timothy Arcuri (UBS). Grundsätzlich mag ich jeden, der Rückgrat hat und eine pikante Frage stellt.

Was war der Auslöser, der dich bei HBM hat einknicken lassen?

Das ist eher eine langfristige These. Der Auslöser war im Grunde die These von Nick Gagnet von Coatue. Die Ansicht, dass die Speicherhersteller neu bewertet werden, nicht mehr auf Basis von Kurs-Buchwert, sondern auf Basis des Gewinns pro Aktie.

Was, glaubst du, wird am Ende dein Weg sein, um in Speicher zu investieren?

Ich weiß es nicht, ich denke noch darüber nach. Hynix bekommt bald eine ADR. Ich bin mir nicht sicher, ob ich einfach darauf warte oder wieder in Micron einsteige.

Du hast ein Zwei-Konten-Setup, Long-Only und Trading, nur um es mental sauber zu halten?

Ja, psychologisch gesehen hatte ich in den letzten zwei Wochen mehrere Tage, an denen mein Trading-Konto um eine Viertelmillion Dollar gefallen ist, und ich bin völlig unbeeindruckt, weil ich mein Long-Only-Konto habe. Die Leute fragen mich dann: „Oh, wie kannst du nur so verrückt sein, wie gehst du mit dieser Volatilität um?“ Weil es mir egal ist. Ich habe ein separates Konto. Ich befolge meinen eigenen Rat sehr ernst: Investiere nicht, was du dir nicht leisten kannst zu verlieren. Mein Trading-Konto könnte auf null gehen und es wäre mir egal. Ich habe immer noch meine Long-Only-Konten. Und es ist nicht gesund, Zugang zu Margin zu haben und sein ganzes Geld an einem Ort zu haben. So manage ich das Risiko.

Welches ist das eine Unternehmen, das du deinen Eltern empfehlen würdest, so ein 10-Jahres-Kaufen-und-Halten?

Intel, denn Intel ist eine wahnsinnig gute langfristige Beteiligung. Auch Broadcom, Keysight. SiTime, aber vielleicht nicht zu diesen Kursen. Nvidia, natürlich. TSMC. Das sind langfristige, blinde Käufe.

Broadcom – ich nehme an, dass alle ihre Kunden aggressiv versuchen, ihre Abhängigkeit von ihnen zu verringern, oder ist das kein Problem?

Google versucht es. Es läuft nicht gut, das kann ich dir sagen. Außer Lumentum ist der andere große Indiumphosphid-Hersteller tatsächlich Broadcom. Nicht viele Leute wissen das. Broadcom hat eine riesige Laser-Sparte. Ein sehr gut diversifiziertes Unternehmen.

@insane_analyst

Use YouMind to read viral articles deeply

Aktuelle virale Artikel

Der GOAT Juni-Newsletter

Update zur Tokenomics

Schluss mit der Endlosschleife: So lassen Sie Claude für sich arbeiten, während Sie schlafen

Wiki-Gedächtnis

Baseball in der Krise: Das weiß jeder

Let It Crash: Wie man den Weg nach dem Absturz ebnet