Evaluación de los cuellos de botella en la cadena de suministro de IA: Entrevista con Irrational Analysis (@insane_analyst)

@chrisbarber
INGLÉShace 2 meses · 14 may 2026
841K
1.4K
202
31
3.7K

TL;DR

Esta entrevista con Irrational Analysis explora las limitaciones del hardware de IA, desde la escasez de fosfuro de indio hasta el auge de los transformadores de estado sólido y aceleradores alternativos como Taalas.

Aquí está mi entrevista con Irrational Analysis (@insane_analyst) sobre los cuellos de botella en la cadena de suministro de IA. NFA, poseo o podría poseer algunas de estas en el futuro.

¿Qué aceleradores alternativos podrían estar haciendo una cantidad muy significativa de entrenamiento o inferencia dentro de tres a cinco años?

Para entrenamiento, creo que todos son más o menos ceros. Para inferencia, soy un gran fanático de Positron y Cerebras, pero por razones muy diferentes. ¿Quién más? MatX. El problema con MatX es que no tengo suficiente información. Así que tal vez sea bueno, pero no sé nada de ellos. Entonces, la respuesta rápida sería Positron y Cerebras. También está Taalas, en cuyo planteamiento no creo, pero es muy interesante y casi quiero promocionarlos un poco porque si el planteamiento funciona, es increíble. Pero no creo que la gente de IA sea tolerante con ese planteamiento. Sí, esos son más o menos los tres grandes que realmente me gustan, con MatX al margen porque no sé lo suficiente sobre ellos. Todavía estoy tratando de que hablen conmigo.

El planteamiento de Taalas con el que no estás de acuerdo son los pesos fijos, ¿verdad?

Lo que hacen es usar una capa de máscara superior para grabar los pesos. Entonces, una vez que tienes los pesos, no puedes cambiarlos. Y dado lo rápido que cambian los modelos de IA, como cada dos semanas sale GPT 5.5 y luego 5.6. Si hablas con la gente que trabaja en estas empresas, internamente el modelo cambia constantemente. Hay un hexadecimal al final del modelo. Cada par de semanas hay una actualización. Los pesos cambian constantemente y se ajustan.

Ahora, lo que Taalas dice es que admiten ajuste fino. Creo que lo que quieren decir es que el chip actual permite cierta modificación de los pesos, pero no tanto como uno quisiera. Su chip actual tiene dos tercios de pesos codificados y un tercio es solo una máquina SRAM. Y la razón por la que pueden admitir ajuste fino es que un tercio es SRAM, y puedes tener un subconjunto de los pesos que puedes cambiar o ajustar, hacer cosas de LoRA. Y básicamente están hablando con clientes y diciendo: "Bueno, tu modelo funcionará mucho más rápido cuanto más codifiques, pero tienes esta compensación". Ahora, en un mundo ideal, alguien podría diseñar un modelo donde el 90% de los pesos estén codificados (me estoy inventando estos números). Funcionaría súper rápido. Y luego el 10% se usaría para LoRA o para actualizar los pesos. Ahora, si algún pez gordo aceptará este nivel de restricción, no lo sé. No creo que sea así. Pero la ingeniería detrás de lo que hace Taalas es realmente súper, súper inteligente.

Están usando una capa de máscara superior. Los chips tienen como 14 capas hoy en día, digamos 14 o 15 capas. Toman una de las capas en el tercio superior de la máscara y la usan para programar los pesos y codificarlos. Entonces, si lo piensas, normalmente un diseño de chip toma un mínimo de tres meses, generalmente más, para hacer el diseño. Luego tienes que hacer el tape-out y luego toma de cinco a seis meses para que los chips regresen, y luego tienes que verificarlos. Taalas tuvo que crear un montón de herramientas EDA personalizadas para su compilador, pila de verificación y diseño de chips, y afirman que les toma un día hacer un nuevo modelo. Eventualmente. Ahora mismo toma como una semana. Entonces, es una semana para hacer el diseño, y luego, como solo están cambiando la capa superior, una de las capas superiores, pueden almacenar obleas. Entonces, si vas a TSMC o a cualquier fábrica, es algo muy común en la industria, puedes decir: "Oye, quiero que tengas X número de obleas al 70% de finalización, no termines la última parte porque estamos en I+D o lo que sea". Así que Taalas puede tener un tiempo de respuesta mucho más rápido de lo que esperaba inicialmente. Es una semana para hacer el nuevo diseño y luego aproximadamente dos meses. Esa es mi estimación, ciertamente no seis meses. Entonces, en dos meses puedes tener los chips de vuelta y puedes ejecutarlos. Y afirman que hicieron algunas herramientas de compilador Verilog muy inteligentes y herramientas de simulación enhebradas para interactuar con las herramientas EDA estándar y verificar todo muy bien. Por lo tanto, la validación posterior al silicio debería ser nada porque la infraestructura del chip ya está validada y solo estás cambiando los pesos. Tomaron un proceso de mínimo un año de principio a fin y lo redujeron teóricamente a dos o tres meses, que no está nada mal.

Desde una perspectiva de arquitectura de modelos, soy más de hardware. No entiendo la arquitectura de modelos. Me costaba entender: "Bueno, ¿cómo tienes algo donde la mayoría de los pesos son fijos y solo cambias algunos de los pesos, como pesos en una sola capa o cosas así?" Y luego encontré LoRA y le pregunté a personas que entienden bien la IA y me dijeron: "Oh no, LoRA no se puede escalar o algo así. Es tonto. Solo los perdedores usan LoRA". Pero si el planteamiento funciona, si encuentran un cliente que esté dispuesto a usar LoRA o algún otro sistema algorítmico donde una gran parte de los pesos sean fijos y vayamos a servir este modelo constantemente para que sea económico, la economía de Taalas es increíble. El chip es súper barato. No necesita HBM ni memoria de ningún tipo. No necesita ningún empaquetado avanzado de ningún tipo. Incluso el PCB, están realmente limitados por latencia en la comunicación chip a chip, no están limitados por ancho de banda en absoluto. Así que usan PCIe y CXL, y su principal limitación actual es que no tienen la última versión de CXL en su chip, y aparentemente CXL 3.0 les está dando algunas características que les ayudarán significativamente. Pero aún así están bien por ahora. Así que tendrás un rendimiento increíble, asombroso (literalmente imposible en cualquier otra arquitectura) a precios súper baratos. Es solo que tienes esta limitación: una gran parte de los pesos, probablemente entre el 50 y el 90%, deben ser fijos y no puedes cambiarlos. Pero para cambiarlos, tendrías que desechar todos tus chips o la mayoría de ellos y luego esperar de dos a tres meses, y el costo de hacer un nuevo diseño es como un cuarto de millón de dólares, aproximadamente.

Toma al CEO de Taalas. Tuvo una entrevista donde dijo que el costo del diseño del chip, una nueva versión del chip, es "lo mismo que un servidor H100". Entonces, digamos que estás operando un centro de datos, está sirviendo algún modelo con chips de Taalas, decides desechar todos tus chips de Taalas porque el modelo necesita ser actualizado. Así que tienes que cancelar ese Capex, tienes que darle a Taalas entre 300 y 500 mil adicionales. En el peor de los casos, te fabrican chips nuevos en dos o tres meses y luego los implementas. Y de nuevo, no hay problema de memoria. Ni siquiera hay un problema de PCB. Puedes usar materiales de PCB de baja calidad porque solo están ejecutando PCIe muy lento. Así que podría funcionar. Simplemente no sé lo suficiente sobre modelos para ver si funcionará.

Diferentes capas de la pila: ¿cuáles crees que terminarán siendo las más restringidas en términos de suministro en los próximos años?

Sí, es más o menos todo. Si me hubieras preguntado en enero o febrero, habría dado una respuesta muy diferente, pero ahora todo está restringido.

¿Por qué el mercado empezó a volverse loco con esto alrededor de septiembre del año pasado?

No lo entiendo. A veces el mercado es muy extraño y hablo con muchos de estos tipos de fondos de cobertura y les digo: "Son inteligentes, ¿por qué se dan cuenta de esto ahora?" Es raro.

¿La visión macro es que todos ahora están entendiendo que el Capex de los hiperescaladores va a seguir aumentando, al menos en valor absoluto?

Sí, lo macro es que la gente está constantemente cambiando de opinión. Te daré un ejemplo divertido. Me han dicho que los inversores tradicionales en energía están todos en corto con Bloom porque piensan: "Oh, Bloom es demasiado caro, las turbinas de gas natural son más baratas, esto es una burbuja". Y yo les digo: "Chicos, se trata de tiempo para obtener energía. Se perdieron el barco por completo".

No entienden las restricciones de este conjunto de clientes.

Lo sé. No entienden por qué la gente elige esto. No es porque sea más barato. La economía por megavatio o lo que sea es significativamente peor. Pero puedes tenerlo ahora. Y si tienes que retrasar tu proyecto de centro de datos un mínimo de seis meses... Estoy hablando con más fondos de cobertura centrados en IA y semiconductores, y luego dicen: "Oh, conocemos a estos otros fondos de cobertura de energía que están en corto con Bloom". Como, ¿por qué serías tan suicida como para ponerte en corto con esto? Hay muchas cosas extrañas que suceden en el mundo financiero. Así que no puedo explicarlo.

¿Qué otras capas terminan siendo cuellos de botella?

El fosfuro de indio está muy mal. Es realmente una locura. No sé qué hará mucha gente, pero el fosfuro de indio, cualquier cosa relacionada con el fosfuro de indio, está muy, muy, muy mal.

El fosfuro de indio es para láseres y óptica, porque el silicio no puede generar luz. Y la gente todavía no entiende lo mal que está, porque CPO está aumentando los requisitos para los láseres en términos de rendimiento de ruido.

Eso es Aixtron, por ejemplo?

Oh, sí. Ellos fabrican el equipo para la fabricación de fosfuro de indio. No son exactamente el cuello de botella, bueno, probablemente lo sean, pero están fabricando más máquinas y los Lumentum, Coherent y Sumitomo del mundo están comprando esas máquinas. Estoy largo en eso. Es más la capacidad de Lumentum y Coherent. El mundo de los sustratos, AXT, Sumitomo, IQE, todos estos tipos, son el cuello de botella.

¿Qué es IQE?

Hay una empresa del Reino Unido, creo que hacen la epitaxia. Hay un montón de nombres en esta cadena de fabricación de fosfuro de indio. Y todo es básicamente un desastre ahora mismo.

Simplemente no hay suficiente fosfuro de indio para el mundo, ¿básicamente?

Sí, bueno, las minas de fosfuro de indio están bien, creo, por ahora. Pero el procesamiento del fosfuro de indio para convertirlo en cristal, luego tomar la oblea, luego epitaxiar la oblea y luego imprimir los láseres en la oblea, todo eso, es un completo desastre. Porque la forma en que funcionan los láseres CPO es que necesitan ser de mucha más potencia, lo que significa que el tamaño del dado tiene que ser significativamente mayor, y necesitan un ancho de línea mucho más estrecho y un mejor rendimiento de ruido, lo que significa que tienes que hacer el tamaño del dado más grande en general.

Así que también es parte de la razón por la que SiPho y Tower Semi están yendo a la luna. Tradicionalmente, la forma en que funcionaba el mundo de los transceptores era comenzar con EML, que es básicamente un solo chip monolítico de fosfuro de indio que tiene el modulador que mueve la luz hacia arriba y hacia abajo y el láser de onda continua, todo en el mismo chip de fosfuro de indio. Y EML siempre funciona mejor que la fotónica de silicio por razones físicas. Y generalmente lo que sucede es que después de uno o dos años, después de cada generación de transceptores (como 400G u 800G), la gente comienza a migrar a SiPho para ahorrar dinero. Descubres cómo hacer que el rendimiento de SiPho sea lo suficientemente bueno y ahorras dinero porque ahora, en lugar de comprar un EML grande, compras un láser de onda continua mucho más pequeño y simplemente lo colocas en el módulo SiPho y modulas allí.

Pero de todos modos, esta vez SiPho ha ido a la luna porque todos piensan: "Espera, hay una escasez de EML, y luego las mismas personas que fabrican EML también fabrican los láseres CW y están reasignando su capacidad a CW porque tiene mayor margen y hay más demanda". Así que ahora la demanda de CPO está devastando el suministro de EML que ya estaba enormemente, enormemente subabastecido. Y ahora, los transceptores de 1.6T son la primera generación donde SiPho es dominante, casi desde el principio. Creo que en seis meses ya tenía la mayoría de la cuota. No sé los números exactos, pero es completamente diferente. Si observas cada generación de transceptores y luego la cuota de mercado de SiPho vs. EML, esta vez es completamente diferente. Y es porque hay una escasez de fosfuro de indio tan paralizante.

En cuanto al siguiente, diría que es la memoria porque simplemente no hay capacidad de sala limpia. Alguien me hizo esta pregunta, que no es completamente estúpida: "Oh, Samsung, tienen fabs de lógica y fabs de memoria, ¿por qué no reasignan la línea de fab de lógica a memoria?" Porque las fabs de memoria son completamente diferentes en el equipo que usan y el proceso y todo. Así que solo tienes tres empresas que pueden fabricar DRAM. Todas están completamente reservadas. No hay capacidad que llegue en el corto plazo.

Que son Hynix, Micron y Samsung, ¿verdad?

Sí, esos tres. Así que ese es el segundo peor cuello de botella. Pero la gente es bastante consciente de eso.

¿Hay mucha diferencia entre los tres fabricantes de memoria?

Personalmente, creo que no importa. Hay mucho drama y ruido. Hay tanta escasez. Todo se venderá con márgenes brutos del 80%. ¿A quién le importa? Históricamente, SK Hynix estaba decididamente a la cabeza y Samsung se estaba autodestruyendo. Estaba bastante mal. Y Micron estaba más o menos en segundo lugar. Y ahora hay básicamente mucho drama sobre las velocidades de los dados de HBM4, todo ese ruido de los filtradores de la cadena de suministro. Básicamente, con HBM, todo el HBM anterior a HBM4, 3E, 3, todo, el dado base, que contiene un montón de circuitos lógicos para la interfaz, se fabricaba en un nodo de proceso DRAM interno. Ahora, la razón por la que esto es importante es que es más barato porque los chicos de DRAM usan sus propias fabs para fabricarlo. Pero la calidad de los transistores es mucho peor. DRAM está diseñado para transistores lentos y pequeños y condensadores gigantes, no para diseño lógico, por lo que estás limitado en velocidad.

Entonces, con HBM4, todos se vieron obligados a abandonar esta estrategia. Bueno, deberían haber abandonado esta estrategia. Lo que sucedió fue que SK Hynix fue a TSMC y comenzó a usar un proceso de clase de 12 nanómetros. Mucho mejor que la basura que podían armar con el proceso DRAM interno. Pero sigue siendo de 12 nanómetros, no muy bueno. Samsung tiene su propio nodo lógico interno SF4X y no es de 4 nanómetros, diría que en el mejor de los casos está empatado con TSMC N6, o en algún lugar entre TSMC N6 y N7. Es bastante bueno para lo que necesita hacer. Micron es tonto. Dijeron: "No, vamos a usar nuestro propio proceso DRAM interno". Y se dispararon en el pie y se retrasaron. Y hay todo este drama: "Oh no, Micron no va a entrar en Nvidia Rubin". Y a nadie le importa. Simplemente venderán más DRAM normal o HBM3E a precios por las nubes. Nada de esto importa. Los tres van a vender todo lo que tienen a precios bastante altos. Y la brecha de calidad ahora es bastante cercana. Solía ser que el HBM3 de Samsung era tan malo que nadie podía usarlo. A ningún precio ciertas personas usaban el HBM3 de Samsung porque tenía muchos problemas de energía. Devoraba energía. Pero ahora todos están lo suficientemente cerca como para que, bueno, digamos que Nvidia tiene estándares más altos y rechaza el HBM4 de Micron, lo venderán a otra persona o simplemente venderán DRAM normal con márgenes brutos increíbles. Esto no afectará financieramente a Micron. Así que ha habido mucho drama detrás de escena sobre esto y creo que es francamente tonto.

Cuando dices memoria, ¿te refieres específicamente a DRAM o a HBM y DRAM?

Sí, cada vez que digo DRAM incluyo HBM en eso. Todo es lo mismo. La memoria la clasifico en DRAM y NAND flash. Esas son las dos categorías. DRAM es todo lo que es memoria y no es NAND flash.

El tercer cuello de botella que mencionaste, ¿las fabs de lógica?

Puedes ver que Intel está yendo a la luna, se está solucionando. La cuestión es que TSMC simplemente no tiene suficiente capacidad. Fueron demasiado conservadores. Hace seis meses, Samsung básicamente no tenía utilización, casi ninguna, en su lógica avanzada. E Intel era solo interna. Ahora hay empresas externas acumulándose y Samsung también está teniendo una utilización bastante alta. Así que hubo una especie de flexibilidad donde la situación de la lógica se veía muy mal en febrero. Ahora está mejor. Todavía está bastante mal, pero no ha empeorado. La memoria y el fosfuro de indio han empeorado en los últimos seis meses. La lógica ha mejorado, pero sigue estando bastante mal porque lleva mucho tiempo construir estas líneas, y de nuevo solo hay tres actores: Samsung, Intel, TSMC.

¿Qué otros cuellos de botella han empeorado en los últimos seis meses?

No, principalmente esos dos en términos de categoría. No creo que los semiconductores de potencia se pongan mal, pero creo que son la categoría más interesante, porque hay mucha capacidad libre debido a que la situación de los vehículos eléctricos no fue buena.

¿Puedes explicar los semiconductores de potencia?

Los semiconductores de potencia cambian la potencia de un voltaje a otro. Puedes pensarlo de esta manera. Tienes tu red eléctrica que tiene múltiples miles de voltios AC. Necesitas convertir eso a AC más bajo y luego eventualmente necesitas convertirlo a voltaje DC. 800 voltios DC, 400 voltios DC, 240 voltios AC. Y eventualmente, después de varios pasos, tu chip lógico de alta gama consume alrededor de 1.2 voltios, aproximadamente. Para ser más correcto, cada chip lógico de alta gama, los chips de 3 nanómetros, el voltaje estándar es como 0.75 voltios. Y luego hay algunos voltajes de lado alto como 1.1 voltios o 1.5 voltios. Así que tienes que ir de un voltaje muy alto a un voltaje mucho más bajo para el chip. Por lo tanto, necesitas múltiples etapas de conversión. Y hay estos materiales llamados materiales de banda ancha, carburo de silicio y nitruro de galio, que son mucho mejores que el silicio por razones físicas.

Más eficientes para ahorrar costos de energía y menos enfriamiento, ¿algo así?

Sí, exactamente. Más eficientes. Y pueden tolerar voltajes mucho más altos. Intentas poner un chip de silicio en la misma posición, se quema, se fríe.

¿Cuál es tu favorito de los que mencionaste: TI, Navitas, onsemi, Infineon?

Bueno, este fin de semana tendré el post. Está casi terminado. Ahora mismo en GaN, TI y Navitas están empatados en primer lugar e Infineon está en un distante segundo lugar. onsemi afirma tener algo increíble llamado GaN vertical. Pero son solo Slides. Sin hojas de datos, sin especificaciones reales. Es solo: "Hicimos algo y va a tener estos números increíbles". Claro, seguro. Así que onsemi, tal vez tengan algo, tal vez no. En carburo de silicio todavía no lo he descubierto, necesito unos días más. Pero el actor interesante en carburo de silicio es, es una acción meme, pero también no es una acción meme. Es Wolfspeed.

Cuéntame sobre Wolfspeed.

Construyeron capacidad en exceso masivamente. Son puro carburo de silicio y están integrados verticalmente. Fabrican las obleas, los sustratos, fabrican los dispositivos, hacen todo internamente.

Aparte: los fondos de cobertura te contactan y solo quieren tu opinión sobre cosas, y lo haces porque es divertido y así ves qué preguntas hacen?

También aprendo. Llego a entender cómo piensan estos tipos. Porque yo soy solo una hormiga. No muevo el mercado. Estos tipos mueven el mercado. También comparten ideas. Específicamente, Wolfspeed surgió de una conversación con un fondo de cobertura.

¿Wolfspeed surgió de una conversación con un fondo de cobertura?

Eso surgió de cinco. Es una acción muy interesante. Están integrados verticalmente, 100% con sede en EE. UU. Sobredimensionaron el carburo de silicio, y fueron destruidos por la competencia china y la desaceleración de los vehículos eléctricos. Literalmente se declararon en bancarrota, Capítulo 11. Salieron del Capítulo 11 solo recientemente, creo que hace como cuatro meses. Tengo que verificarlo. Pero es muy reciente. Todos dejaron de comprarles porque tu proveedor está en bancarrota. Así que su utilización de fábrica es como del 30%, según se dice. Muy, muy baja. Y ahora han vuelto. Y la cuestión es que si el mercado cambia, esta acción es un 5X. Está tan apalancada y es tan loca. Pero literalmente acaba de declararse en bancarrota. Y tiene márgenes brutos negativos. Puedes ver su informe de ganancias más reciente. Su margen bruto es negativo del 20%. Y su guía es: "Seguimos esperando márgenes brutos negativos". Literalmente pierden dinero en cada chip que producen porque están tan subutilizados.

Ahora, lo interesante, y por qué la gente me estaba contactando, es que Wolfspeed presentó este chip de carburo de silicio de 10 kilovoltios. Estos chips son literalmente solo un transistor, un transistor súper, súper resistente que tiene que manejar niveles increíbles de voltaje y corriente. Ahora mismo, los transistores de carburo de silicio con la clasificación de voltaje más alta en el mercado están en el rango de 1700 a 2000 voltios. Infineon tiene una pieza de 3.3 kilovoltios. Nadie tiene nada por encima de eso excepto Wolfspeed. Wolfspeed dice: "Oh, podemos hacer una pieza de 10 kilovoltios". Y estoy mirando la hoja de datos y esto es una locura. No sé cómo demonios lo hicieron. Y no es inmediatamente obvio si es mejor o peor. Porque los transistores son solo interruptores, e idealmente cuando enciendes el transistor, quieres que sea un interruptor perfecto, que no tenga resistencia. Pero eso nunca es cierto. Vas a tener algo de resistencia parásita. Así que cuando un transistor está encendido, actúa como una pequeña resistencia (esto está sobresimplificado). Estoy mirando la resistencia parásita de esta pieza de Wolfspeed, y la capacitancia de puerta parásita, que perjudica la velocidad de conmutación, y comparándola con piezas completamente diferentes, como piezas de 2000 y 3000 voltios de la competencia. Los parásitos son peores, pero solo necesitas una de estas en lugar de tres. Tuve que mirar algunas simulaciones de circuitos para averiguarlo. Creo que la pieza de 10 kilovoltios es bastante buena. Y será útil para infraestructura. Es completamente inútil en el centro de datos. Y cuando le digo esto a algunos de estos tipos de fondos, dicen: "Oh no, no es útil en el centro de datos". Les digo: "Amigo, te estás perdiendo el panorama general. Transformadores de estado sólido. Quieres regulación de carga para la red eléctrica entre el AC de alto voltaje y el centro de datos".

Así que soy mucho más optimista sobre la entrega de energía que está justo afuera del centro de datos que dentro del centro de datos. Siento que todos se están enfocando en quién va a ganar el rack de energía en el diseño de Nvidia y el diseño de OCP, físicamente dentro del centro de datos. Y esa es una oportunidad atractiva. Pero lo que está fuera del centro de datos, entre el centro de datos y la red eléctrica, también es súper interesante. De hecho, posiblemente más interesante. Así que sí, me encantan los semiconductores de potencia. Creo que esa será la próxima cosa que explote y se convierta en un cuello de botella. No será el cuello de botella principal porque hay mucha capacidad extra disponible, ya que los vehículos eléctricos están medio muertos. Pero es el más emocionante donde las cosas cambiarán.

¿Estás específicamente más emocionado por la entrega de energía en el exterior del centro de datos versus el interior?

¿Alguna vez has pasado en coche y has visto esas cosas circulares con esas cajas grandes cerca de las subestaciones eléctricas? Esos son transformadores tradicionales. La forma en que funcionan es que tienes un núcleo de hierro gigante y luego tienes un montón de devanados de cobre en un lado y devanados de cobre en el otro lado. Y estos son básicamente dispositivos mayormente pasivos donde conviertes, por ejemplo, 100 kilovoltios AC a 35 kilovoltios AC, y luego conviertes los 35 kilovoltios AC a 7 kilovoltios AC, y luego lo conviertes a 240 voltios, 120 voltios AC que van a tu casa. O 2000 kilovoltios AC que van a clientes industriales, para transmitir electricidad a largas distancias. Quieres voltaje extremadamente alto para reducir las pérdidas de energía. Pero para usarlo realmente, tienes que reducirlo con transformadores. Estos transformadores son típicamente estas cosas voluminosas pasivas y son malos porque lleva mucho tiempo comprarlos. Haces un pedido ahora (y esto es antes de lo de la IA), y luego de 12 a 18 meses te lo entregan porque es un pedazo de metal gigante. Simplemente lleva mucho tiempo fabricarlo.

Lo que creo que la gente no está entendiendo es que tienen un gran problema con los centros de datos de IA. Porque piensa en esto: supongamos que trabajas en una compañía eléctrica, PG&E o algo así. Tienes estos nuevos clientes que se conectan a tu red y tienes que gestionar su carga, que sube y baja de forma agresiva. Estos tipos dicen: "Oh, necesitamos un gigavatio ahora". Y cinco minutos después: "No, en realidad solo necesitamos 800 megavatios". Esto es una pesadilla satánica para los operadores de la red. Y no sé si viste esto, circuló por Twitter el año pasado: el equipo de PyTorch agregó una bandera especial llamada "Power Plant No Blow Up". Fue algo gracioso que se viralizó. ¿Qué hace esta bandera? El problema era que tienes muchas GPU, 10,000 GPU, 100,000 GPU. Están haciendo un montón de cálculos para el entrenamiento y luego un grupo de ellas deja de hacer cálculos o los hace a una velocidad mucho menor porque están interconectándose, comunicándose entre sí, haciendo all-reduce y todo eso. Y eso estaba causando inestabilidad en la red eléctrica. Y el operador de la red dice: "Hagan lo que sea que estén haciendo, deténganlo, o los vamos a cortar. Esto es peligroso. Están desestabilizando la red". Entonces, lo que hace la bandera en PyTorch es: si la GPU no necesita hacer cálculos, la obliga a hacer cálculos a máxima velocidad de todos modos. Simplemente haz que haga cálculos basura y los envíe a la nada. Digamos que tu chip funciona a 500 vatios. En una situación normal, querrías que bajara a 200 vatios si no está trabajando. Pero en este caso, no, no queremos que baje a 200 vatios. Mantenlo a 500 vatios todo el tiempo porque no queremos que el operador de la red se enoje con nosotros. Y la razón por la que los operadores de la red se enojan es que, si piensas en un sistema eléctrico, cuando tienes estos componentes pasivos, estos transformadores pasivos, cualquier tipo de tirón y empuje de la carga se propaga hacia atrás a la red y la desestabiliza. Esto estaba bien en el pasado porque los encargados de la red gestionaban las cosas, y hay algunas soluciones para estabilizar las redes. Pero ahora ya no es así.

Así que hablamos de los transformadores tradicionales. Ahora existen los transformadores de estado sólido. No sé por qué se llaman transformadores de estado sólido, porque los transformadores anteriores también son de estado sólido, son pasivos. En lugar de tener un trozo de hierro y un montón de devanados de cobre, construyes unos circuitos con chips de carburo de silicio y puedes hacer lo mismo: convertir alto voltaje de CA a un voltaje más bajo de CA, o incluso hacer alto voltaje de CA directamente a CC. ¿Por qué la gente no ha hecho esto? Existe desde 2020. Es más caro. Puedes quejarte todo lo que quieras de los transformadores tradicionales, pero son baratos y esperas 12 meses y recibes el producto. Los transformadores de estado sólido son mucho más caros, pero tienen un beneficio enorme, enorme. Y es que puedes hacer regulación de carga. Puedes programar dinámicamente el transformador de estado sólido para asegurarte de que la corriente y el voltaje en ambos lados sean aproximadamente iguales. Puedes cambiar la frecuencia de conmutación. Así que si la carga sube, puedes conmutar a una frecuencia más alta, o si la carga baja, conmutas a una frecuencia más baja.

Y usan semiconductores de potencia en los transformadores de estado sólido.

Sí, entonces estos son dispositivos activos. Básicamente es un montón de transistores. En lugar de tener dispositivos pasivos, un montón de inductores, devanados de cobre y algunos diodos, son transistores. Estás encendiendo y apagando transistores para gestionar la energía, no solo para convertirla, sino también para gestionarla de modo que obtengas 800 voltios limpios, no 800 voltios más o menos 20 voltios o lo que sea. O entregar mil amperios, no 1000 amperios más o menos 10%. Puedes regularlo. Y eso es enorme porque, en lugar de desperdiciar dinero con la bandera "Power Plant No Blow Up" en PyTorch, puedes bajar la GPU, y obtienes enormes ganancias de eficiencia. Y los operadores de la red también están más contentos contigo. Muchas veces, los permisos, digamos que estás tratando de construir un centro de datos y los permisos no se aprueban, y te preguntas: "¿Por qué pasó esto?" Es porque la compañía eléctrica dice: "Vas a desestabilizar la red. No podemos hacer esto". Y entonces ahora puedes decir: "Bueno, voy a poner algunos transformadores de estado sólido y así es como no voy a desestabilizar tu red". Y entonces la compañía eléctrica dice: "Está bien, te venderé electricidad, conéctate". Así que la gente ha estado sorteando este cuello de botella de varias maneras creativas. Pero creo que ahora es el momento de usar transformadores de estado sólido y asumir el costo, porque el valor está ahí. Sí, estás pagando más por la caja que convierte la electricidad. Pero obtienes todos estos beneficios. Creo que esto comenzará a acelerarse el próximo año. Esto es más una historia de la segunda mitad de 2027. Pero la forma en que funcionan las acciones es que la gente lo descubre y compra por adelantado. Las acciones miran hacia el futuro. Así que esto está empezando a suceder ahora y creo que despegará más en los próximos 36 meses.

¿Estarías más entusiasmado con las empresas de semiconductores de potencia que con las empresas que venden los transformadores de estado sólido?

En general, sí, porque al menos mi estilo de inversión personal es que entiendo la ingeniería, o al menos lo intento, y puedo identificar la diferenciación. Comparo y puedo determinar qué chip es mejor que cuál, quién puede cobrar una prima. Las personas que compran esos chips y construyen la caja también tienen valor, debido al aspecto de control. Digamos que la caja tiene mil transistores muy potentes. Si no tienes el circuito de protección y el control, es extremadamente peligroso. Puedes explotar todo lo que esté conectado, enviar un pico de voltaje. Por lo tanto, hay consideraciones de diseño cuidadosas en cómo se ensamblan estos semiconductores de potencia. Hay dos acciones aquí. Un montón de gente me ha estado insistiendo con esto y no lo tomaba en serio. Y cuando la decimoquinta persona me lo envía, digo: "Está bien, lo leeré". Hay dos empresas llamadas SolarEdge y Enphase Energy. Su historial es fabricar microinversores para paneles solares. El problema con las instalaciones de paneles solares es que los paneles solares son de CC, pero obviamente tu casa funciona con CA, por lo que necesitas convertir cada panel solar de CC a la CA correcta. Y luego hay un montón de cosas de seguridad y tienes que controlarlo todo. Así que estas empresas hacían estos pequeños microinversores para instalaciones solares domésticas. Desde que los incentivos fiscales para la energía solar doméstica se fueron al sur, estas empresas se fueron completamente a la mierda. Puedes ver el precio de sus acciones. Hubo una burbuja alrededor de 2021, y luego bajaron un 90%. Ahora son solo carroñeros. Y estas empresas están girando hacia los transformadores de estado sólido. Ven la oportunidad. Y no he tenido tiempo de investigarlo a fondo, pero creo que es legítimo. Es súper degen. Es una idea súper tonta. Pero creo que funcionaría como acción. Porque tienen mucha experiencia con el ensamblaje y los circuitos de protección de estas cosas. Y esto es, sin duda, más fácil que lo que hacen en el mundo solar, porque en lugar de tenerlo distribuido por todo un techo, lo pones todo en una sola caja y puedes hacer la protección contra sobrecorriente mucho más fácil. E incluso tienen tecnología diferenciada. Enphase tiene un ASIC de control de 22 nanómetros. Diseñaron su propio chip de 22 nanómetros para controlar todos estos microinversores porque necesitas hacer algún nivel de matemáticas y un montón de señales diferentes a todas estas partes analógicas. Es un problema de sistemas distribuidos. Básicamente, tienes que decirle a unos 10,000 transistores a qué velocidad deben conmutar y también detectar fallas y cosas así. Así que tienen un ASIC de control para eso y eso simplifica sus cosas. Es una ventaja competitiva legítima.

¿Qué hay de Delta Electronics?

Sí, Delta es la grande. Tienes a Delta, Vertiv, Eaton y todas estas grandes. Este es su negocio principal. Esto es lo que ya hacen. Y las acciones ya han subido. La parte atractiva de SolarEdge y Enphase es que han sido dadas por muertas y nadie les presta atención. Y estas acciones, si funcionan, se multiplican por 5. ¿Quieres perseguir algo que ya ha subido mucho como Vertiv, o quieres perseguir algo un poco degen? Así que es divertido. No es una idea terrible. Podría funcionar. Quieres apostar, pon medio por ciento de tu cartera en esto. Claro, ¿por qué no?

¿Qué preguntan los fondos de cobertura?

Generalmente quieren mi opinión sobre cosas porque mi libro es público y estoy superando a todos ellos, aunque con niveles de riesgo insanos, eso sí. Muchos de estos tipos son neutrales al mercado, por lo que mi rendimiento no es justo compararlo con el de ellos. Pero me va bastante bien. Me piden opiniones y cosas, y muchas veces se centran en aspectos técnicos porque no sé nada de valoración. A veces, cuando hay un nuevo fondo, preguntan: "Oye, ¿qué opinas de la valoración?" ¿No lees lo que escribo? Pero sí, cosas de ingeniería. Por ejemplo, lo de Wolfspeed. Ninguno de ellos sabe si este carburo de silicio de 10 kilovoltios es bueno y dónde se usaría. Y ni siquiera creo que Wolfspeed sepa cómo se usaría, porque pusieron "suministro de energía para reactores de fusión nuclear" en la hoja de datos y en su comunicado de prensa. Y yo digo: "Chicos, están estirando demasiado la cuerda". Muchas veces, la dirección de la empresa les dice algo a estos financieros y ellos preguntan: "¿Están diciendo la verdad?" Y yo respondo: "Sí o no, o es complicado, deberían hacer estas preguntas de seguimiento". Así que es mayormente técnico, pero no 100% técnico.

Cerebras, tu opinión ahora.

Me encanta. Tengo algunas críticas duras. Andrew Feldman (@andrewdfeldman) aparentemente es muy consciente de ello. Están en FP16, lo cual es un error estúpido. Si implementan FP4, básicamente obtienen de 3 a 4 veces más capacidad solo con eso. Y esto es una fruta madura fácil. Es solo lógica digital. También necesitan arreglar su E/S para descargar la caché KV. Y no compro el argumento de que "oh, es suficientemente bueno". Es una excusa mediocre. Si tienes la oportunidad de hacer tu producto 10 veces mejor, hazlo. No te conformes con la mediocridad. Y finalmente, sus márgenes brutos indican que su rendimiento es muy malo. Afirman públicamente que su rendimiento a nivel de oblea es del 100% y les creo, lo que significa que su rendimiento en el empaquetado de la oblea es horrible. Está entre el 20 y el 40%. No sé por qué es tan malo, pero necesitan arreglarlo. Todavía tengo críticas hacia ellos, y es más como que quiero ser un inversor activista. Estoy comprando algunas de sus acciones. No me voy a ir. Soy optimista pero también duro porque podría ser mucho mejor. Andrew Feldman está en negación sobre el problema de E/S. Y yo le digo: "No, amigo, deja de negarlo y arréglalo. Puedes mejorarlo. Solo haz el producto mejor".

¿Sigues siendo bajista con las neoclouds?

Sí, más o menos. Mira lo que le pasó a CoreWeave el trimestre pasado. Creo que básicamente están teniendo costos más altos debido a todas las escaseces, la óptica y la memoria. Y todos los financieros preguntaban: "¿Están trasladando los costos al cliente a través del contrato?" Y el CEO de CoreWeave intentó responder esto dos veces y no tengo idea de cuál es la respuesta. Como la acción ha bajado, supongo que los financieros interpretaron que no, que los están perjudicando. Firmaron un contrato a largo plazo y no pueden trasladar los costos.

¿Alguna opinión sobre qué neoclouds tienen más probabilidades de morir?

Las más pequeñas. CoreWeave es lo suficientemente grande. Oracle es lo suficientemente grande. Nebius probablemente sea lo suficientemente grande. No sé si morir, pero eventualmente habrá un problema. El nivel de deuda aquí. Tan pronto como haya una recesión, o incluso si hay aumentos de tasas de interés, podría haber aumentos de tasas en la segunda mitad de este año y eso les dolerá bastante. Es simplemente un mal negocio. Hay tantas otras cosas geniales en las que invertir. Solo haz eso. No sé por qué la gente quiere poseer esta basura.

¿Terafab?

No hay suficiente información, aparte de que parece que están licenciando el proceso Intel 14A tal vez. Esa es mi interpretación de lo que está pasando. No hay información.

¿El despliegue de CPO se dará sin demasiados problemas?

No creo que haya problemas. Las personas que se preocupan por la confiabilidad están completamente equivocadas y no entienden la ingeniería. Los problemas serán la escasez de fosfuro de indio, eso es realmente, realmente malo. Pero el despliegue, no, no creo que sea un problema. Si lo haces bien, si haces tu tarea, estará bien. De hecho, será más confiable que los transceptores.

¿Alguna opinión sobre Amkor?

No, no sigo demasiado a los actores del empaquetado.

¿Qué hay de Ibiden o Unimicron?

No, no lo sé. Sin opinión.

¿Nokia o Infinera?

Oh, sí. Tiene el potencial de ser una versión mucho más barata de Ciena. Así que si piensas: "Vaya, Ciena ha subido mucho, la valoración es alta", bueno, podrías comprar Nokia y están tratando de hacer lo mismo. Así que creo que es una inversión de valor legítima. Es una de las pocas cosas donde la valoración es razonable. No estoy en ella ahora, pero he estado entrando y saliendo y necesito más tiempo para pensarlo. Pero sí, me gusta.

¿Cuál es tu forma preferida de jugar con el fosfuro de indio?

Básicamente Lumentum. Y como algo más arriesgado puedes hacer AXT, y luego para semiconductores de capital, la empresa alemana AIXTRON. Así que esas tres.

¿Qué crees que es lo más sobrevalorado en este momento?

Diría que microLED porque creo que es un engaño. Hay como siete alternativas a microLED y todas son objetivamente mejores. Así que sí, simplemente odio microLED.

GE Vernova.

Tengo muchas. Compré un montón de acciones a alrededor de 170 en una de mis cuentas de solo largos. Mi precio promedio está entre 170 y 250. Y se ha ido a la luna y, bueno, supongo que nunca venderé esto. Así que sí, es genial. Turbinas de gas. Tuve suerte, alguien me dio el dato temprano. Es un foso de muy alta calidad. Son de los únicos que pueden fabricar esto. Pero a este punto están completamente reservados y la acción se ha movido tanto que no estoy seguro de cómo se puede hacer que la acción suba más. ¿De dónde vendrá la capacidad, o de dónde vendrán los aumentos de precio? No lo sé.

Algunas de tu cartera de solo largos: Besi, Rigaku, TSMC o Fujikura, ¿cuál es la más emocionante?

Rigaku.

¿Eso son rayos X para empaquetado avanzado?

Besi ya se ha movido mucho, así que comprar a estos niveles, no sé. Pero Rigaku, los actores tradicionales son Camtek y Onto, y hacen inspección de empaquetado avanzado basada en óptica. Estas máquinas de rayos X se usaban tradicionalmente para fines de I+D. Digamos que eres TSMC y estás tratando de desarrollar tu nodo de 2 nanómetros, la parte de I+D, necesitas mirar realmente adentro y descubrir qué está pasando, compras un puñado de estas máquinas Rigaku y las usas para I+D y nunca las vuelves a usar. Ahora ha llegado al punto en que, debido a los transistores gate-all-around, la entrega de energía por la parte posterior y las tolerancias mucho más estrictas en la próxima generación de empaquetado avanzado, tienes que usar estas máquinas de rayos X. Estás jodido con la óptica. Así que Rigaku está pasando de ser un nicho de I+D a producción. Y Onto sabe que están jodidos porque compraron el 27% de Rigaku como una asociación estratégica. Y básicamente, el software que se ejecuta en las máquinas Rigaku es el software de Onto. Así que un montón de gente dice: "Oh, esto es alcista para Onto". No, no lo es. Saben que no pueden fabricar las máquinas, así que compran una cuarta parte de la capitalización de mercado de la empresa que puede fabricarlas y solo venden software aparte. O sea, solo compra Rigaku. Así que sí, ese es mi nicho favorito de semiconductores de capital especializados. Me encanta.

De tu cuenta de trading: Tower Semi, Lumentum, Intel, Bloom, Semtech, ¿cuál es la más emocionante?

Semtech. Definitivamente Semtech. Las otras han subido mucho. Semtech, todavía creo que la gente no entiende completamente lo que fabrican.

Mi entendimiento muy ingenuo es que hace que el cobre funcione mejor?

Eso es cierto, pero es solo una pequeña parte de la historia. Fabrican amplificadores analógicos y ecualizadores analógicos. Y la belleza es que esto funciona en cables de cobre activos, funciona en PCB, funciona en óptica enchufable lineal, funciona en transceptores tradicionales, funciona en la cosa de Arista XPO, funciona en óptica cercana al paquete. Es jodidamente todo. No es solo cobre, es todo. Es increíble. Y tienen las piezas de la más alta calidad. Es básicamente un duopolio entre ellos y MACOM. Y las piezas de Semtech son simplemente mejores. He visto las hojas de datos. He usado estas cosas. Así que hay muchos financieros que hacen estas llamadas con expertos con algún tipo de negocios: "Oh, sí, estamos con doble fuente, bla, bla, bla". Y yo digo: "Amigo, ¿en qué proporción?" Probablemente sea 90% Semtech porque las piezas de Semtech son mucho mejores. Así que sí, Semtech tiene mucho más margen para subir. Esto es jodidamente increíble. Está en todas partes. No es solo cobre.

En los diferentes segmentos, bajo, medio o alto, ¿qué tan ajustado crees que estará? HBM.

Sí, alto.

Fotónica de silicio, óptica, CPO.

También alto. Dado lo que pasó con Tower.

¿Qué pasó con Tower?

La gente le está pagando a Tower por adelantado por capacidad en 2027, 2028. Su acción subió como un 15%. Es una carrera de varios miles de millones de dólares. Se están quedando sin existencias.

¿Hay un subconjunto de óptica que creas que es más importante?

La parte de fosfuro de indio, los láseres.

Empaquetado avanzado.

No creo que sea un gran problema porque Intel está aumentando mucho. Intel tiene mucha capacidad en Malasia, creo.

¿Opiniones sobre EMIB?

Sí, EMIB es bueno. Intuitivamente puedes pensar en EMIB como básicamente lo mismo que CoWoS-L. Hay algunas cuestiones técnicas, pero desde la perspectiva de un diseñador es lo mismo. El problema con EMIB hace 18 meses era que Intel era un poco idiota en sus reglas de diseño y servicio al cliente, y era horrible. Y luego llegó Lip-Bu Tan y despidió a un montón de gente y ahora es bueno. Y ahora la gente está moviendo cosas a EMIB porque, uno, TSMC no tiene suficiente capacidad de CoWoS, y dos, TSMC prefiere usar su espacio de sala limpia para un margen bruto del 60-70% en N3 que usarlo para CoWoS. Así que creo que la situación del empaquetado avanzado, al menos en relación con otras cosas, no será tan mala como la gente piensa. Otras cosas serán peores.

Sustratos ABF.

No sé lo suficiente.

HBF.

No me gusta nada el flash de alto ancho de banda. No creo que sea una buena solución porque tendrá problemas de resistencia. Así que simplemente no me gusta. Ni siquiera quiero verlo como un cuello de botella. Creo que es una mala idea. Si vas a usar flash para este tipo de cosas, entonces necesitas hacerlo enchufable. Y si es enchufable, no necesitas apilarlo. Puedes ponerlo alrededor del controlador CXL y ponerlo en un servidor en algún lugar.

Obleas.

Obleas de fosfuro de indio, bastante mal. Obleas de carburo de silicio, no. Obleas normales tampoco, probablemente esté bien.

PCB.

Está mal. Las cosas de alta velocidad, la más alta calidad para alta velocidad que soportan 200G SerDes, sí, está bastante mal. Todos están más o menos agotados.

¿Tienes algún favorito ahí?

He estado entrando y saliendo de TTMI, pero ahora ha subido tanto que no quiero molestarme. Así que sí, no sé a quién jugar ahí. También hay muchos actores en Taiwán que no sigo. Es uno de los sectores con los que no me meto.

Energía y transformadores.

Emocionado, sí. ¿Cuello de botella? No. Hay mucha capacidad de fabricación inactiva. Pero lo más emocionante, sí.

¿Emocionado porque es técnicamente interesante para ti?

Técnicamente interesante y es lo próximo que va a explotar. Como, una gran razón por la que la acción de Lumentum no se movió en las ganancias, bajó y luego subió de nuevo, es que Hurlston le está diciendo a todos: "Bueno, hemos vendido todo para los próximos dos años", y eso les dice a los financieros: "Está bien, entonces no va a mejorar en términos de upside". Wolfspeed tiene el potencial de multiplicarse por 5. Puede ser realmente estúpido. Y luego todos los tipos de semiconductores de potencia normales, Infineon, TI, onsemi, STM, pueden duplicarse. Pueden duplicarse. No está descontado. Otras cosas ya están descontadas. Esto no.

Switches de red.

Está bien. Solo compite con las obleas de lógica y se necesita algo de CoWoS, pero no es tanto. Está bien.

Fibra óptica.

No está muy bien ahora. Hay algunos problemas. No creo que sea tan malo como otras cosas, así que digamos medio. Específicamente fibra de mantenimiento de polarización. Hay un tipo más caro que se necesita en ciertas situaciones.

Refrigeración líquida.

Está bien. No he oído ningún problema.

Cosas de ensamblaje y prueba.

Se puede aumentar. Se está aumentando. No es difícil de aumentar.

CPUs.

Gran problema. Sí, gran problema. Intel puede aumentar hasta cierto punto. Por eso la acción ha subido tanto. AMD, han aumentado algo en el sentido de que están usando su diseño de CPU más antiguo que está en N5 y lo están re-aumentando. Pero ahora que han hecho eso, si la situación de las CPU empeora, ¿qué van a hacer? Si soy AMD, ¿quiero tomar mi asignación de TSMC, vender GPU o CPU? Tienes que elegir. ARM no tiene obleas. Qualcomm. Por más que odie admitirlo, lo único que puede ayudar a la situación de las CPU es Qualcomm porque tienen muchas obleas en TSMC.

Pero la cosa es que Qualcomm es el único gran jugador que tiene capacidad de obleas y puede pivotar a CPUs porque, si Android sigue cayendo en picada, todavía tienen esas obleas pedidas en TSMC. Pueden decirle a TSMC que imprima el diseño de CPU en su lugar. Y por eso Qualcomm ha subido tanto, porque la gente tiene esperanzas. Qualcomm ha fallado como tres veces en CPU para centros de datos. Este es su tercer o cuarto intento. Si no lo logran esta vez, realmente no hay esperanza. Solo necesita funcionar. Si funciona, la gente lo comprará y ganarán un montón de dinero con ello y salvará a la empresa de la implosión de Android y las demandas inminentes de Apple.

¿Tienes algún favorito para CPUs?

Prefiero Intel para CPUs porque nada me hará comprar Qualcomm. Pero la gente en los fondos me ha preguntado: "Oye, ¿debería comprar Qualcomm para CPUs?" Bueno, puedes si quieres confiar en estos idiotas. Pero yo no. Pero claro, si quieres ir, adelante. Admito que tienen mucha capacidad y podrían lograrlo.

¿DRAM también sería alta?

Sí, básicamente veo DRAM y HBM como equivalentes.

Discos duros.

Sin opinión. Supongo que con NAND escaso, tal vez los discos duros también se estén ajustando. No sé lo suficiente al respecto.

Carcasas de centros de datos.

No sigo esas cosas. Sin opinión.

¿Los semiconductores de potencia serían altos para ti?

No, ahora es bajo. No es un cuello de botella ahora, pero lo será en un año. Por eso es lo más interesante, porque tiene upside.

NAND.

Creo que DRAM tiene una prima. NAND también está en escasez como DRAM, pero creo que NAND es más peligroso porque es más propenso a la sobreoferta que DRAM. Pero sí, cuello de botella alto, pero diría que prefiero DRAM sobre NAND.

¿Hay algún cambio de modelo, como contexto largo, más RL, modelos mundiales, que esperes que cambie mucho la demanda de hardware?

Sinceramente creo que todos se están moviendo hacia longitudes de contexto más largas. Hay valor económico en ello. La gente está dispuesta a pagar por más longitud de contexto. Así que eso va a perjudicar a toda la memoria, todo. Esa es solo la opinión general de alto nivel. No sigo tanto la arquitectura de modelos. Pero el lado económico es, sí, la gente quiere una longitud de contexto súper larga o una cadena larga de tokens.

Si fueras Jensen, ¿qué suministro intentarías asegurar a continuación?

Ya aseguró todo el suministro de todas las cosas. Iba a decir fibra y luego hizo el acuerdo con Corning. Creo que el hombre es un dios y ya ha asegurado todo. Creo que realmente lo ha hecho.

¿Pagas por alguna fuente de información y cuáles?

Tengo una suscripción a SemiAnalysis, Fabricated Knowledge, FundaAI, y tengo Citrini. Esas son las únicas cuatro por las que pago.

Tres a cinco cuentas principales en X que te gusten.

Me gusta Clive Chan (@itsclivetime) de OpenAI, pero casi nunca publica nada. Está el chico de Suspended Cap (@ContrarianCurse), es interesante. TBU (@TBU12345678). Me gusta mucho TBU. Outspoken Geek (@OutspokenGeek). Jukan (@jukan05) da buena información. Max Cherney (@chernandburn) de Reuters. Me gusta. Thomas, casi nunca publica, pero Thomas Sohmers (@trsohmers) de Positron, a veces publica cosas útiles. Sravan (@SKundojjala) de SemiAnalysis publica cosas buenas de vez en cuando. Y luego Citrini (@citrini). Ah, Bucket Shop Capital (@bucketshopcap). Me gusta. Dan Nystedt (@dnystedt).

Gente del lado vendedor que te gusta. Stacy Rasgon es uno.

Sí, me gusta Stacy Rasgon (@BernsteinRasgon) y Vivek Arya (B of A). Timothy Arcuri (UBS). Básicamente, cualquiera que tenga agallas y haga una pregunta picante, me gusta.

¿Qué fue lo que te hizo capitular en HBM?

Esto es más una tesis a largo plazo. Lo que me hizo capitular es básicamente la tesis de Nick Gagnet de Coatue. La visión de que los fabricantes de memoria se van a revalorizar, no van a basarse en precio sobre valor en libros, sino en ganancias por acción (EPS).

¿Cómo crees que terminarás jugando en el sector de memoria?

No sé, todavía lo estoy pensando. Hynix va a tener un ADR pronto. No estoy seguro si esperaré a eso o volveré a Micron.

¿Tienes una configuración de dos libros, solo largo y trading, solo para mantenerlo mentalmente limpio?

Sí, psicológicamente, solo en las últimas dos semanas tuve varios días en los que mi cuenta de trading bajó como un cuarto de millón de dólares y estoy completamente tranquilo porque tengo mi cuenta de solo largo. Entonces la gente me pregunta, oye, ¿cómo eres tan loco, cómo manejas esta volatilidad? Porque no me importa. Tengo una cuenta separada. Me tomo muy en serio mi propio consejo: no inviertas lo que no puedas permitirte perder. Mi cuenta de trading podría llegar a cero y estoy bien. Todavía tengo mis cuentas de solo largo. Y no es saludable tener acceso a margen y todo tu dinero en un solo lugar. Así es como gestiono el riesgo.

¿Cuál es la única empresa que le recomendarías a tus padres, como una compra y retención a 10 años?

Intel, porque Intel es una tenencia a largo plazo increíble. También Broadcom, Keysight. SiTime, pero quizás no a estos precios. Nvidia, obviamente. TSMC. Esas son a largo plazo, cómpralas a ciegas.

Broadcom, supongo que todos sus clientes quieren eliminar agresivamente su dependencia de ellos, ¿o no es un problema?

Google lo está intentando. No le está yendo bien, te lo digo. Aparte de Lumentum, el otro gran jugador de fosfuro de indio es en realidad Broadcom. No mucha gente lo sabe. Broadcom tiene una división de láser gigantesca. Una empresa muy bien diversificada.

@insane_analyst

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales