评估 AI 供应链瓶颈:Irrational Analysis (@insane_analyst) 访谈

@chrisbarber
英语2个月前 · 2026年5月14日
841K
1.4K
202
31
3.7K

TL;DR

本次对 Irrational Analysis 的访谈探讨了 AI 硬件的制约因素,从磷化铟短缺到固态变压器及 Taalas 等替代加速器的兴起。

以下是您要求的简体中文翻译:


以下是我与 Irrational Analysis(@insane_analyst)关于 AI 供应链瓶颈的访谈。非财务建议,本人目前或未来可能持有其中部分资产。

三到五年后,哪些替代加速器可能承担非常大量的训练或推理任务?

训练方面,我认为它们基本都不行。推理方面,我非常看好 Positron 和 Cerebras,但原因截然不同。还有谁?MatX。MatX 的问题是我信息不足。也许它很好,但我对他们一无所知。所以快速回答是 Positron 和 Cerebras。还有 Taalas,我不太相信它的前提,但非常酷,我甚至想稍微吹捧一下——如果前提成立,那将非常惊人。但我觉得 AI 从业者不会容忍这个前提。嗯,这就是我真正看好的三大玩家,MatX 算半个,因为我对它了解不够。我还在努力让他们跟我聊聊。

你不认同的 Taalas 前提是固定权重吗?

他们做的事情是用上层掩膜层来烧录权重。也就是说,一旦权重确定,就无法更改。考虑到 AI 模型变化之快——每两周就有 GPT 5.5、5.6 之类的版本。如果你跟这些公司内部的人聊,模型内部是不断变化的。模型末尾有一个十六进制版本号。每隔几周就有一次更新。权重在不断变化和微调。

现在 Taalas 说他们支持微调。我认为他们的意思是,当前芯片允许对权重进行一定修改,但远达不到你想要的灵活度。他们目前的芯片三分之二是硬编码权重,三分之一是 SRAM 机器。他们能支持微调的原因就是那三分之一是 SRAM,你可以改变其中一部分权重,或者做 LoRA 之类的微调。他们基本上跟客户说:你的模型硬编码越多,运行越快,但这是一个权衡。在理想情况下,有人可以设计一个模型,其中 90% 的权重是硬编码的(我随便说的数字),运行超快,然后 10% 用于 LoRA 或更新权重。至于有没有大客户愿意接受这种限制,我不知道。我觉得不会。但 Taalas 背后的工程其实非常非常聪明。

他们使用上层掩膜层。现在的芯片大概有 14 层,我们就说 14 或 15 层吧。他们取掩膜上层三分之一中的一层,用来编程权重并硬编码进去。所以你想,通常芯片设计最少需要三个月,通常更久。然后流片,再等五到六个月芯片回来,然后验证。Taalas 不得不为他们的编译器、验证栈和芯片设计制作一堆定制 EDA 工具,他们声称一天就能完成一个新模型。最终目标是这样。目前大概需要一周。所以设计只需一周,而且因为他们只改变上层(其中一层),他们可以预存晶圆。如果你去台积电或任何晶圆厂,行业里很常见:你可以说,嘿,我希望你保留 X 数量的晶圆,完成到 70%,最后一点先别做,因为我们在做研发之类的。所以 Taalas 的周转时间比我最初预期的快得多。新设计一周,然后大约两个月。这是我的估计,肯定不是六个月。所以两个月内你就能拿到芯片并运行。他们声称制作了非常巧妙的 Verilog 编译器工具和线程仿真工具,与标准 EDA 工具对接,很好地验证一切。所以硅后验证应该没什么问题,因为芯片的基础设施已经验证过,你只是改变权重。他们把原本至少一年的流程(从开始到结束)缩短到理论上两到三个月,这已经很不错了。

从模型架构的角度看,我更多是硬件背景。我不太懂模型架构。我一直在想:怎么才能让大部分权重固定,只改变一部分权重,比如某一层的权重?然后我发现了 LoRA,我问那些真正懂 AI 的人,他们告诉我:哦不,LoRA 无法扩展之类的。很蠢。只有失败者才用 LoRA。但如果这个前提真的成立——如果他们找到一个愿意用 LoRA 或其他算法系统的客户,其中大部分权重固定,并且这个模型会持续服务,所以经济上可行——那么 Taalas 的经济效益非常惊人。芯片极其便宜。不需要任何 HBM 或任何类型的内存。不需要任何先进封装。甚至 PCB 也……他们在芯片间通信上主要受延迟限制,完全不受带宽限制。所以他们用 PCIe 和 CXL,目前的主要限制是他们的芯片没有最新版本的 CXL,而 CXL 3.0 提供的一些功能会显著帮助他们。但目前也还行。所以你会以极低的价格获得惊人、不可思议的性能(其他任何架构都不可能实现)。只是有一个限制:大部分权重(大概在 50% 到 90% 之间)需要固定,不能更改。要更改的话,你就得扔掉所有或大部分芯片,然后等两到三个月,新设计的成本大约 25 万美元。

拿 Taalas 的 CEO 来说。他在一次采访中说,芯片设计(新版本芯片)的成本“相当于一台 H100 服务器”。所以假设你运营一个数据中心,用 Taalas 芯片服务某个模型,你决定扔掉所有 Taalas 芯片,因为模型需要更新。那么你必须注销那笔资本支出,再给 Taalas 额外 30 到 50 万美元。最坏情况下,他们在两到三个月内为你制造新芯片,然后你部署。同样,没有内存问题,甚至没有 PCB 问题。你可以用低质量的 PCB 材料,因为他们只是运行很慢的 PCIe。所以可能行得通。我只是对模型了解不够,无法判断它是否真的可行。

不同层面的供应链:你认为未来几年哪些环节会最受供应限制?

嗯,基本上所有环节都受限。如果你在 1 月或 2 月问我,我会给出完全不同的答案,但现在什么都受限。

为什么市场从去年 9 月左右开始疯狂?

我不理解。有时候市场真的很奇怪。我跟很多对冲基金的人聊,我说:你们都很聪明,为什么现在才意识到?很奇怪。

宏观观点是不是大家现在都明白了:超大规模企业的资本支出至少绝对值会继续增长?

是的,宏观上人们一直在反复摇摆。我给你举个有趣的例子。有人告诉我,传统能源投资者都在做空 Bloom,因为他们觉得 Bloom 太贵了,天然气涡轮机更便宜,这是个泡沫。我说:伙计们,关键是交付时间。你们完全错过了重点。

他们不了解这群客户的限制。

我知道。你不明白人们为什么选择这个。不是因为更便宜。每兆瓦的经济效益确实差很多。但你现在就能拿到。如果你的数据中心项目至少要延迟六个月……我跟更多关注 AI 和半导体的对冲基金聊,他们说:哦,我们知道其他能源对冲基金在做空 Bloom。为什么有人会自杀式地做空它?金融界有很多奇怪的事情。所以我无法解释。

还有哪些环节会成为瓶颈?

磷化铟的情况非常糟糕。简直离谱。我不知道很多人要怎么办,但磷化铟,任何与磷化铟相关的东西,都非常非常非常糟糕。

磷化铟用于激光器和光学器件,因为硅不能发光。人们仍然不明白它有多糟糕,因为 CPO 对激光器的噪声性能要求提高了。

比如 Aixtron?

哦,是的。他们制造磷化铟生产的设备。他们不算是瓶颈,嗯,可能也是,但他们正在制造更多机器,而 Lumentum、Coherent 和 Sumitomo 这些公司正在购买这些机器。我长期看好这个领域。更关键的是 Lumentum 和 Coherent 的产能。衬底领域,AXT、Sumitomo、IQE 这些公司,它们才是瓶颈。

IQE 是什么?

有一家英国公司,我想他们做外延。磷化铟制造链上有很多名字。现在基本上都是一团糟。

基本上就是全球磷化铟不够用?

嗯,目前磷化铟矿应该还好。但是将磷化铟加工成晶体,然后切晶圆,再外延,再在晶圆上打印激光器——所有这些环节都是一场灾难。因为 CPO 激光器需要更高的功率,这意味着芯片尺寸必须显著增大,而且需要更窄的线宽和更好的噪声性能,这通常也会使芯片尺寸变大。

所以这也是 SiPho 和 Tower Semi 暴涨的部分原因。传统上,光模块世界的工作方式是:从 EML 开始,它基本上是一个单片磷化铟芯片,集成了调制器(上下摆动光)和连续波激光器。由于物理原因,EML 性能总是优于硅光。通常,在每一代光模块(如 400G 或 800G)推出后一两年,人们开始转向 SiPho 以节省成本。你设法让 SiPho 性能足够好,然后省钱,因为现在你不再买大的 EML,而是买一个更小的连续波激光器,放入 SiPho 模块中,在那里调制。

但无论如何,这次 SiPho 暴涨,因为每个人都发现:等等,EML 短缺,而生产 EML 的同一批人也生产 CW 激光器,他们正在将产能重新分配给 CW,因为利润率更高,需求也更大。所以现在 CPO 需求正在扼杀本来就已经严重供不应求的 EML 供应。而且,1.6T 光模块是 SiPho 几乎从一开始就占据主导地位的第一代。我认为在六个月内它就获得了多数份额。我不知道具体数字,但情况完全不同。如果你看每一代光模块中 SiPho 与 EML 的市场份额,这次完全不同。原因就是磷化铟严重短缺。

接下来,我认为是内存,因为没有洁净室产能。有人问过我一个不算完全愚蠢的问题:哦,三星,他们有逻辑晶圆厂和内存晶圆厂,为什么他们不把逻辑产线重新分配给内存?因为内存晶圆厂使用的设备、工艺等完全不同。所以只有三家公司能制造 DRAM。它们全部被订满。短期内没有新产能上线。

是海力士、美光和三星?

是的,这三家。所以这是第二严重的瓶颈。但人们对此已经很清楚了。

三家内存制造商之间差距大吗?

我个人认为不重要。有很多戏剧和噪音。短缺如此严重,所有产品都能以 80% 的毛利率卖光。谁在乎?历史上,SK 海力士明显领先,三星有点自焚,情况很糟。美光大概排在第二。现在有很多关于 HBM4 芯片速度的戏剧,来自供应链泄密者的噪音。基本上,对于 HBM,所有 HBM4 之前的 HBM(3E、3 等),其基础芯片(包含接口逻辑电路)是在内部 DRAM 工艺节点上制造的。这很重要,因为更便宜——DRAM 公司用自己的晶圆厂制造。但晶体管质量差得多。DRAM 是为慢速小晶体管和大电容设计的,不是为逻辑设计,所以速度受限。

到了 HBM4,大家基本上被迫放弃这个策略。嗯,他们早就该放弃了。SK 海力士转向台积电,使用 12 纳米级工艺。这比他们内部 DRAM 工艺能拼凑出来的垃圾好得多。但仍然是 12 纳米,不算很好。三星有自己的内部 SF4X 逻辑节点,不是 4 纳米,我认为最多与台积电 N6 持平,或者介于 N6 和 N7 之间。对于它的用途来说已经不错了。美光很蠢。他们说:不,我们要用自己的内部 DRAM 工艺。结果搬起石头砸自己的脚,延迟了自己。有很多戏剧:哦不,美光进不了英伟达 Rubin。但没人在乎。他们只会以天价卖出更多普通 DRAM 或 HBM3E。这些都不重要。三家公司都会以相当高的价格卖光所有产品。质量差距现在也相当接近了。以前三星 HBM3 太差,没人能用。某些人无论什么价格都不会用三星 HBM3,因为功耗问题很大,非常耗电。但现在它们都足够接近了:好吧,假设英伟达标准更高,拒绝美光的 HBM4,他们会把 HBM4 卖给其他人,或者就以离谱的毛利率卖普通 DRAM。这不会在财务上影响美光。所以幕后有很多戏剧,我认为坦白说很蠢。

你说内存时,特指 DRAM 还是 HBM 和 DRAM?

是的,我说 DRAM 时包括 HBM。都是一回事。我把内存分为 DRAM 和 NAND 闪存两类。DRAM 就是所有非 NAND 闪存的内存。

你提到的第三大瓶颈是逻辑晶圆厂?

你可以看到英特尔暴涨,情况正在改善。问题是台积电就是没有足够产能。他们太保守了。六个月前,三星先进逻辑的利用率几乎为零。英特尔只供内部。现在有外部公司涌入,三星的利用率也相当高了。所以有一些弹性:2 月份逻辑情况看起来非常糟糕,现在好一些了。仍然很糟,但没有恶化。内存和磷化铟在过去六个月恶化了。逻辑有所改善,但仍然很糟,因为建设这些产线需要很长时间,而且只有三个玩家:三星、英特尔、台积电。

过去六个月还有哪些瓶颈恶化了?

没有,主要是这两类。我不认为功率半导体情况会变糟,但我觉得它们是最有趣的类别,因为有很多闲置产能——电动车情况不好。

你能解释一下功率半导体吗?

功率半导体将电能从一种电压转换为另一种电压。你可以这样想:电网是几千伏的交流电。你需要将其转换为较低的交流电,然后最终转换为直流电压。800 伏直流、400 伏直流、240 伏交流。经过几个步骤后,你的高端逻辑芯片大约需要 1.2 伏。更准确地说,每个高端逻辑芯片(3 纳米芯片)的标准电压大约是 0.75 伏。还有一些高侧电压,比如 1.1 伏或 1.5 伏。所以你必须从非常高的电压降到芯片所需的低电压。需要多个转换级。有一种材料叫宽禁带材料——碳化硅和氮化镓——由于物理原因,它们比硅好得多。

更高效,所以节省能源成本,减少冷却?

是的,没错。更高效。而且能承受高得多的电压。你把硅芯片放在同样位置,它会烧掉,会自毁。

在你提到的公司中,你最喜欢哪个:TI、Navitas、onsemi、英飞凌?

嗯,这周末我会发一篇文章。差不多写完了。目前在 GaN 领域,TI 和 Navitas 并列第一,英飞凌是遥远的第二。onsemi 声称有很棒的东西叫垂直 GaN。但只是幻灯片。没有数据表,没有实际规格。只是说:我们做了个东西,会有这些惊人的数字。好吧,当然。所以 onsemi,也许他们有,也许没有。在碳化硅方面我还没搞清楚,还需要几天。但碳化硅领域一个有趣的玩家是——它是个 meme 股票,但也不完全是 meme 股票——Wolfspeed。

跟我说说 Wolfspeed。

他们过度建设了产能。他们是纯碳化硅公司,垂直整合。他们自己制造晶圆、衬底、器件,所有环节都在内部完成。

顺便问一下:对冲基金联系你,只是想听听你的意见,你这么做是因为有趣,这样你也能看到他们问什么问题?

我也在学习。我了解这些人的思维方式。因为我只是个小蚂蚁,我不影响市场。这些人影响市场。他们也分享想法。具体来说,Wolfspeed 就是从一次对冲基金对话中来的。

Wolfspeed 来自一次对冲基金对话?

来自五次。这是一只非常有趣的股票。他们垂直整合,100% 美国本土。他们过度建设了碳化硅,然后被中国竞争和电动车低迷重创。他们真的破产了,第 11 章破产。他们从第 11 章破产中走出来只是最近的事,我想大概四个月前。我得查一下。但非常近期。所有人都停止从他们那里购买,因为你的供应商破产了。所以他们的工厂利用率据说是 30%。非常非常低。现在他们回来了。关键是,如果市场翻转,这只股票能涨 5 倍。杠杆很高,很疯狂。但它刚刚破产。而且毛利率为负。你可以看他们最近的财报。毛利率是负 20%。他们的指引是:我们预计毛利率将继续为负。他们每生产一颗芯片都在亏钱,因为利用率太低。

有趣的是,为什么有人联系我——Wolfspeed 推出了一个 10 千伏的碳化硅芯片。这些芯片基本上就是一个晶体管,一个超级超级结实的晶体管,必须处理 insane 级别的电压和电流。目前市场上最高额定电压的碳化硅晶体管在 1700 到 2000 伏范围。英飞凌有一个 3.3 千伏的器件。除了 Wolfspeed,没有人有更高的。Wolfspeed 说:哦,我们可以做 10 千伏的器件。我看数据表,这东西太疯狂了。我不知道他们到底怎么造出来的。而且并不明显是好是坏。因为晶体管就是开关,理想情况下,当你打开晶体管时,你希望它是一个完美的开关,没有电阻。但这永远不可能。会有一些寄生电阻。所以当晶体管导通时,它就像一个微小的电阻(这是过度简化)。我看这个 Wolfspeed 器件的寄生电阻和寄生栅极电容(影响开关速度),并与竞争对手的完全不同的器件(比如 2000 伏和 3000 伏的器件)比较。寄生参数更差,但你只需要一个这样的器件,而不是三个。我不得不看一些电路仿真来弄清楚。我认为这个 10 千伏的器件实际上相当不错。它对基础设施有用。在数据中心里完全没用。当我告诉一些基金的人时,他们说:哦不,它在数据中心没用。我说:老兄,你忽略了全局。固态变压器。你需要电网高压交流电和数据中心之间的负载调节。

所以我更看好数据中心外部的电力输送,而不是数据中心内部的。我觉得每个人都在关注谁将赢得英伟达设计和 OCP 设计中的电源机架(物理上在数据中心内部)。那是一个有吸引力的机会。但数据中心外部的设备,位于数据中心和电网之间,也非常有趣。实际上,可以说更有趣。所以是的,我喜欢功率半导体。我认为这将是下一个爆发并成为瓶颈的领域。它不会成为主要瓶颈,因为有很多闲置产能(电动车基本死了)。但这是最令人兴奋的领域,事情会发生变化。

你更看好数据中心外部的电力输送,而不是内部的?

你开车经过时有没有看到那些圆形的东西,旁边有电箱?那是传统变压器。它们的工作原理是:有一个巨大的铁芯,一边绕着一堆铜线圈,另一边也绕着一堆铜线圈。这些基本上是被动设备,将 100 千伏交流电转换为 35 千伏交流电,然后 35 千伏转换为 7 千伏,再转换为 240 伏、120 伏交流电进入你家。或者 2000 千伏交流电给工业客户,用于长距离输电。你需要极高电压来减少功率损耗。但实际使用时,必须用变压器降压。这些变压器通常是笨重的被动设备,很糟糕,因为购买它们需要很长时间。你现在下单(在 AI 热潮之前),12 到 18 个月后他们才给你,因为那是一大块金属。制造它需要很长时间。

我认为人们没有理解的是,他们在 AI 数据中心方面面临着一个巨大的问题。因为,想想看,假设你在电力公司工作,比如 PG&E 之类的。这些新客户接入你的电网,你必须管理他们,而他们的负载在剧烈地上下波动。这些人会说,哦,我们现在需要 1 吉瓦。然后五分钟后,不,实际上我们只需要 800 兆瓦。所以这对电网运营商来说简直是噩梦。我不知道你有没有看到,去年 Twitter 上流传着这样一件事,PyTorch 团队添加了一个特殊的标志,叫做“电厂别爆炸”。这是个有趣的事情。那么这个标志是做什么的呢?当时的问题是,你有大量的 GPU,比如 10,000 个 GPU,100,000 个 GPU。它们在进行大量的数学运算用于训练,然后其中一部分要么停止运算,要么以低得多的速率运算,因为它们在进行互联、互相通信、all reduce 等等。这导致了电网的不稳定。电网运营商说,不管你在做什么,停下来,否则我们要切断你的电源。这很危险。你在破坏电网的稳定。所以 PyTorch 中这个标志的作用是,如果 GPU 不需要做数学运算,就强制它无论如何都以最大速度进行运算。让它做无用的计算,然后把结果发送到虚无中。假设你的芯片运行在 500 瓦。在正常情况下,如果它不工作,你会希望它降到 200 瓦。但在这种情况下,不,我们不希望它降到 200 瓦。让它一直保持在 500 瓦,因为我们不想让电网运营商对我们发火。电网运营商生气的原因是,如果你考虑一个电力系统,当你有这些无源组件、这些无源变压器时,任何负载的推拉都会反向传播到电网并使其不稳定。这在过去没问题,因为电网人员会管理这些东西,并且有一些变通方法来稳定电网。但现在情况不同了。

所以我们谈到了传统的变压器。现在有固态变压器。我不知道为什么它被称为固态变压器,因为以前的变压器也是固态的,它们是无源的。不是用一块铁和一堆铜绕组,而是用碳化硅芯片构建一些电路,你可以做同样的事情,将高压交流电转换为低压交流电,甚至直接将高压交流电转换为直流电。为什么人们以前没有这样做?它从 2020 年就存在了。它更贵。你可以随意抱怨传统变压器,但它们很便宜,你等 12 个月就能拿到货。固态变压器要贵得多,但它们有一个巨大的好处。那就是你可以进行负载调节。你可以动态编程固态变压器,确保两侧的电流和电压大致相同。你可以改变开关频率。所以如果负载增加,你可以以更高的频率切换,或者如果负载下降,你可以以更低的频率切换。

他们在固态变压器中使用功率半导体。

是的,所以这些是有源器件。它基本上是一堆晶体管。不是无源器件、一堆电感器、铜绕组和一些二极管,而是晶体管。你通过开关晶体管来管理功率,不仅转换功率,还管理功率,这样你就能得到干净的 800 伏电压,而不是 800 伏正负 20 伏之类的。或者提供 1000 安培,而不是 1000 安培正负 10%。你可以调节它。这非常巨大,因为这样你就不必在 PyTorch 中浪费钱使用“电厂别爆炸”标志,你可以降低 GPU 的功耗,你会获得巨大的效率提升。电网运营商也会对你更满意。很多时候,许可问题,比如你想建一个数据中心,但许可没通过,你会想,为什么会这样?这是因为电力公司会说,你会破坏电网的稳定。我们不能这样做。然后你现在可以说,嗯,我要放一些固态变压器,这是我不破坏你电网的方法。然后电力公司会说,好吧,没问题,我卖给你电,你自己接上。所以人们一直在用各种创造性的方式绕过这个瓶颈。但我认为现在是时候采用固态变压器并承担其成本了,因为价值就在那里。是的,你为转换电力的盒子付了更多钱。但你得到了所有这些好处。我认为这将在明年开始加速。这更像是 2027 年下半年的故事。但股票运作的方式是,人们会提前发现并买入。股票是前瞻性的。所以这现在已经开始发生了,我认为它将在未来 36 个月内起飞。

你会更看好功率半导体公司,而不是销售固态变压器的公司吗?

一般来说是的,因为至少我个人的投资风格是,我理解工程,或者至少尝试理解,并且我能找出差异化。我在比较,我能看出谁的芯片更好,谁能收取溢价。那些购买这些芯片并制造盒子的人,实际上也有价值,因为控制方面。假设盒子里有 1000 个非常强大的晶体管。如果没有保护电路和控制,那是极其危险的。你可能会炸毁所有连接的东西,发送电压尖峰。所以在如何组合这些功率半导体方面有仔细的设计考虑。这里有两支股票。很多人一直在向我推销这个,我并没有认真对待。然后当第 15 个人发给我这个时,我想,好吧,我会读一下。有两家公司叫 SolarEdge 和 Enphase Energy。它们的历史是为太阳能电池板制造微型逆变器。太阳能电池板部署的问题是,太阳能电池板是直流的,但显然你的房子用的是交流电,所以你需要将每个太阳能电池板从直流电转换为正确的交流电。然后还有一堆安全方面的问题,你必须控制它等等。所以这些公司为家庭太阳能部署做这些小型微型逆变器。自从家庭太阳能的税收优惠政策变差后,这些公司完全垮了。你可以看看它们的股价。在 2021 年左右有一个泡沫,然后它们下跌了 90%。它们现在只是底部玩家。而这些公司正在转向固态变压器。他们看到了机会。我还没有时间完全研究这个,但我实际上认为这是合理的。这非常冒险。这是一个非常愚蠢的想法。但我认为它实际上作为一支股票会有效。因为他们在组装和保护电路方面非常有经验。而且这实际上可能比他们在太阳能领域做的事情更容易,因为不是分散在整个屋顶上,你只需把所有东西放在一个盒子里,你可以更容易地进行过流保护。他们甚至有一些差异化的技术。Enphase 有一个 22 纳米的控制 ASIC。他们自己设计了 22 纳米的芯片来控制所有这些微型逆变器,因为你需要做一些数学运算和一系列不同的信号传输给所有这些模拟部件。这是一个分布式系统问题。基本上你必须告诉大约 10,000 个晶体管它们需要以什么速度切换,然后还要检测故障等等。所以他们有一个控制 ASIC,这简化了他们的工作。这是一个真正的竞争优势。

那 Delta Electronics 呢?

是的,Delta 是大的。所以有 Delta、Vertiv、Eaton 所有这些大公司。这是他们的核心业务。他们已经在做这个了。而且这些股票已经上涨了。SolarEdge 和 Enphase 吸引人的地方在于它们已经被抛弃了,没人关注。而这些股票,如果成功,可以涨 5 倍。你是想追逐像 Vertiv 这样已经涨了很多的股票,还是想追逐一些冒险的东西?所以这很有趣。这不是一个糟糕的想法。它可能有效。你想赌一把,把你投资组合的 0.5% 投进去。当然,为什么不呢。

对冲基金问什么?

他们通常想要我对某些事情的意见,因为我的投资组合是公开的,而且我的表现超过了他们所有人,尽管风险水平极高,请注意。这些人很多是市场中性,所以我的表现和他们相比并不公平。但我做得相当不错。他们问我意见之类的事情,很多时候都集中在技术问题上,因为我对估值一无所知。有时当有新基金时,他们会问,哦,你对估值怎么看?你不读我写的东西吗?但好吧,工程方面的事情。例如,Wolfspeed 的事情。他们没人知道这个 10 千伏的碳化硅好不好,以及会用在什么地方。我甚至不认为 Wolfspeed 自己知道它会怎么用,因为他们在数据表和新闻稿中提到了核聚变反应堆的电力输送。我说,你们真是想得太远了。很多时候,公司管理层告诉这些金融人士一些事情,他们会问,他们说的是真的吗?我会说,是或不是,或者很复杂,你应该问这些后续问题。所以主要是技术问题,但不完全是技术问题。

Cerebras,你现在怎么看。

我喜欢它。我有一些严厉的批评。Andrew Feldman 显然对此非常清楚。他们用的是 FP16,这是一个愚蠢的错误。如果他们实现 FP4,基本上就能从中获得 3 到 4 倍的容量。这是一个容易摘的低垂果实。这只是数字逻辑。他们还需要修复 IO 来卸载 KV 缓存。我不买账那种“哦,已经够好了”的论点。这是一个蹩脚的借口。如果你有机会让你的产品好 10 倍,你就应该让它好 10 倍。不要满足于平庸。最后,他们的毛利率表明他们的良率非常差。他们公开声称晶圆级良率是 100%,我相信他们,这意味着他们封装晶圆的良率非常糟糕。大概在 20% 到 40% 之间。我不知道为什么这么差,但他们需要修复这个问题。我仍然对他们有批评,而且这更像是我想成为一个积极的投资者。我买了一些他们的股票。我不会离开。我看好但也很严厉,因为它本可以好得多。Andrew Feldman 否认 IO 问题。我说,不,伙计,别再否认了,修复它。你可以让它更好。只要让产品更好就行了。

你仍然看空 neoclouds 吗?

是的,有点。看看 CoreWeave 上个季度发生了什么。我认为基本上他们因为各种短缺(光学和内存)而成本更高。所有金融人士都在问,你们通过合同把成本转嫁给客户了吗?CoreWeave 的 CEO 试图回答这个问题两次,我完全不知道答案是什么。因为股价下跌了,我猜金融人士解读为,不,他们被坑了。他们签了长期合同,无法转嫁成本。

对最可能倒闭的 neoclouds 有什么看法?

较小的那些。CoreWeave 够大。Oracle 够大。Nebius 可能够大。我不知道倒闭,但最终会有问题。这里的债务水平。一旦出现低迷,甚至如果加息,今年下半年可能会有加息,那会严重伤害他们。这只是一个糟糕的生意。有很多其他很棒的东西可以投资。就投那些吧。我不知道为什么人们想拥有这些垃圾。

Terafab?

没有足够的信息,除了看起来他们可能在授权 Intel 14A 工艺。这是我猜测的解释。没有信息。

CPO 的推进会不会有太多问题?

我认为不会有问题。那些担心可靠性的人完全错了,而且不懂工程。问题将是磷化铟的短缺,那非常非常糟糕。但部署,不,我不相信会有问题。如果你做得对,如果你做好功课,就没问题。它实际上会比收发器更可靠。

对 Amkor 有什么看法?

没有,我不太关注封装玩家。

那 Ibiden 或 Unimicron 呢?

没有,我不知道。没有看法。

Nokia 或 Infinera?

哦,是的。它有潜力成为 Ciena 的便宜版本。所以如果你觉得,哇,Ciena 涨了很多,估值很高,那么你可以买 Nokia,他们也在做同样的事情。所以我认为这是一个合理的价值投资。这是少数几个估值合理的东西之一。我现在没有持有,但我进进出出过,我需要更多时间考虑。但是的,我喜欢它。

你更倾向于用什么方式投资磷化铟?

基本上是 Lumentum。更冒险一点你可以买 AXT,然后是半导体设备公司,德国的 AIXTRON。就这三家。

你认为目前最被炒作的是什么?

我会说是 microLED,因为我认为它是一个骗局。有大约七种 microLED 的替代方案,它们都客观上更好。所以是的,我就是讨厌 microLED。

GE Vernova。

我持有不少。我在 170 左右买了很多,在我的一个多头账户里。我的平均成本在 170 到 250 之间。它已经涨上天了,嗯,我想我永远不会卖它。所以是的,很棒。燃气轮机。我运气好,有人很早就告诉了我。这是一个非常高质的护城河。他们是少数能制造这个的公司之一。但到了这个点,他们已经完全被预订满了,股价也涨了这么多,我不确定股价还能怎么涨。产能从哪里来,或者涨价从哪里来?我不知道。

你多头账户里的几个:Besi、Rigaku、TSMC 或 Fujikura,哪个最令人兴奋?

Rigaku。

那是用于先进封装的 X 射线?

Besi 已经涨了很多,所以在这个水平买入,我不知道。但 Rigaku,传统的玩家是 Camtek 和 Onto,他们做基于光学的先进封装检测。这些 X 射线机传统上用于研发目的。假设你是 TSMC,你在开发 2 纳米节点,研发部分,你需要非常仔细地观察并弄清楚发生了什么,你会买几台 Rigaku 的机器用于研发,之后就不再用了。现在到了这样一个点,由于全环绕栅极晶体管、背面供电以及下一代先进封装更严格的公差,你必须使用这些 X 射线机。用光学是不行的。所以 Rigaku 正从利基研发转向生产。Onto 知道他们完蛋了,因为他们作为战略合作伙伴购买了 Rigaku 27% 的股份。基本上,在 Rigaku 机器上运行的软件是 Onto 的软件。所以很多人说,哦,这对 Onto 是利好。不,不是。他们知道自己造不出机器,所以就去买了能造机器的公司四分之一的市值,然后在旁边卖软件。就像,直接买 Rigaku 就行了。所以是的,这是我最喜欢的专业利基半导体设备公司。我喜欢它。

从你的交易账户:Tower Semi、Lumentum、Intel、Bloom、Semtech,哪个最令人兴奋?

Semtech。绝对是 Semtech。其他的已经涨了很多。Semtech,我仍然认为人们没有完全理解他们制造什么。

我非常浅显的理解是它让铜线工作得更好?

那是真的,但这只是故事的一小部分。他们制造模拟放大器和模拟均衡器。美妙之处在于,这适用于有源铜缆、PCB、线性可插拔光学器件、传统收发器、Arista XPO 的东西、近封装光学器件。它他妈适用于一切。不仅仅是铜,是一切。太棒了。而且他们有最高质量的部件。基本上是他们和 MACOM 的双头垄断。而 Semtech 的部件就是更好。我看过数据表。我用过这些东西。所以有很多金融人士,他们和一些业务人员开专家电话会,哦,是的,我们是双源采购,等等等等。我说,老兄,比例是多少?可能是 90% 的 Semtech,因为 Semtech 的部件好得多。所以是的,Semtech 还有很大的上涨空间。这他妈的太棒了。它无处不在。不仅仅是铜。

在不同的细分领域,低、中、高,你认为会有多紧张。HBM。

是的,高。

硅光子、光学、CPO。

也是高。考虑到 Tower 发生的事。

Tower 发生了什么?

人们提前为 Tower 在 2027、2028 年的产能付款。他们的股票涨了大约 15%。这是一个数十亿美元的行情。他们被卖光了。

你认为光学中哪个子集最重要?

磷化铟部分,激光器。

先进封装。

我认为这不会是什么大问题,因为 Intel 正在大量增加产能。Intel 在马来西亚有很多产能,我想。

对 EMIB 的看法?

是的,EMIB 很好。直观上你可以把 EMIB 看作和 CoWoS-L 一样的东西。有一些技术细节,但从设计师的角度来看,它是一样的。18 个月前 EMIB 的问题是 Intel 的设计规则和客户服务有点愚蠢,非常糟糕。然后 Lip-Bu Tan 来了,解雇了一堆人,现在好了。现在人们正在把东西转移到 EMIB,因为,第一,TSMC 没有足够的 CoWoS 产能,第二,TSMC 宁愿把洁净室空间用于 60-70% 毛利率的 N3,而不是用于 CoWoS。所以我认为先进封装的情况,至少相对于其他东西,不会像人们想象的那么糟。其他东西会更糟。

ABF 基板。

我知道得不够多。

HBF。

我完全不喜欢高带宽闪存。我不认为这是一个好的解决方案,因为它会有耐久性问题。所以我就是不喜欢它。我甚至不想把它看作一个瓶颈。我只是认为这是一个坏主意。如果你要在这类东西上使用闪存,那么你需要让它可插拔。如果它是可插拔的,你就不需要堆叠它。你可以把它放在 CXL 控制器周围,然后放在某个服务器里。

晶圆。

磷化铟晶圆,非常糟糕。碳化硅晶圆,不。普通晶圆也不,可能没问题。

PCB。

很糟糕。高速部分,支持 200G SerDes 的最高质量的东西,是的,非常糟糕。大家都卖光了。

你有喜欢的相关股票吗?

我交易过 TTMI,但现在它涨了太多,我不想碰了。所以是的,我不知道该买哪个。台湾还有很多我不关注的玩家。这是我不碰的领域之一。

电力和变压器。

兴奋,是的。瓶颈,不。有很多闲置的晶圆厂产能。但最兴奋,是的。

兴奋是因为技术上对你来说有趣?

技术上有趣,而且它是下一个会爆发的领域。比如,Lumentum 的股价在财报后没有动,先跌后涨,很大一部分原因是 Hurlston 告诉所有人,我们已经把未来两年的东西都卖光了,这告诉金融人士,好吧,所以上行方面不会更好了。Wolfspeed 有潜力涨 5 倍。它实际上可能很愚蠢。然后所有常规的功率半导体公司,Infineon、TI、onsemi、STM,它们可以翻倍。它们可以翻倍。这还没有被定价。其他东西已经被定价了。这个还没有。

网络交换机。

没问题。它只是与逻辑晶圆竞争,需要一些 CoWoS,但不多。没问题。

光纤。

现在不太好。有一些问题。我不认为它像其他东西那么糟,所以算是中等。特别是保偏光纤。在某些情况下需要一种更贵的类型。

液冷。

没问题。我没听说有什么问题。

组装和测试。

你可以增加产能。正在增加。增加产能并不困难。

CPU。

大问题。是的,大问题。Intel 可以在一定程度上增加产能。这就是为什么股价涨了这么多。AMD,他们已经在某种程度上增加了产能,他们使用的是旧的 CPU 设计,在 N5 上,他们正在重新增加产能。但现在他们这么做了,如果 CPU 情况变得更糟,他们该怎么办?如果我是 AMD,我是要把 TSMC 的产能分配给 GPU 还是 CPU?你必须选择。ARM 没有任何晶圆。Qualcomm。尽管我很不愿意承认,唯一能帮助 CPU 情况的是 Qualcomm,因为他们在 TSMC 有很多晶圆。

但问题是,Qualcomm 是唯一拥有晶圆产能并且可以将其转向 CPU 的大玩家,因为如果 Android 继续断崖式下跌,他们仍然在 TSMC 有那些晶圆的订单。他们可以告诉 TSMC 去打印 CPU 设计。这就是为什么 Qualcomm 涨了这么多,因为人们在期待。Qualcomm 在数据中心 CPU 上已经失败了三次。这是他们的第三次或第四次尝试。如果他们这次不成功,那就真的没希望了。它只需要能工作。如果能工作,人们就会买,他们会从中赚很多钱,并且这将拯救公司免于 Android 的崩溃和 Apple 即将到来的诉讼。

你有喜欢的 CPU 相关股票吗?

我更喜欢 Intel 的 CPU,因为没有什么能让我买 Qualcomm。但基金里的人问过我,哦,我应该买 Qualcomm 的 CPU 吗?嗯,如果你想相信这些蠢货,你可以买。但我不会。但当然,如果你想买,就去吧。我承认他们有很多产能,而且他们可能成功。

DRAM 也会是高吗?

是的,我基本上把 DRAM 和 HBM 视为等同。

硬盘。

没有看法。我猜随着 NAND 短缺,硬盘可能也会变得更紧张。我知道得不够多。

数据中心外壳。

我不追踪那个。没有看法。

功率半导体对你来说会是高吗?

不,现在低。现在不是瓶颈,但一年后会成为瓶颈。所以这就是为什么它最有趣,因为它有上行空间。

NAND。

我认为 DRAM 有溢价。NAND 也像 DRAM 一样短缺,但我认为 NAND 更危险,因为它比 DRAM 更容易供应过剩。但是的,高瓶颈,但我会说 DRAM 比 NAND 更受我青睐。

有没有任何模型变化,比如长上下文、更多强化学习、世界模型,你预计会大幅改变硬件需求?

我真心认为每个人都在朝着更长的上下文长度发展。这里有经济价值。人们愿意为更长的上下文长度付费。所以这会伤害所有内存,一切。这只是总体上的高层面看法。我不太关注模型架构。但经济方面,是的,人们想要超长的上下文长度或长 token 链。

如果你是 Jensen,你会试图锁定什么供应?

他已经锁定了所有东西的供应。我正要说光纤,然后他就进入了 Corning 的交易。我认为这个人是神,他已经锁定了所有东西。我认为他实际上已经做到了。

你付费购买哪些信息来源?

我有 SemiAnalysis 订阅、Fabricated Knowledge、FundaAI,还有 Citrini。就这四个。

你在 X 上喜欢的三个到五个账号。

我喜欢 OpenAI 的 Clive Chan(@itsclivetime),但他几乎从不发帖。还有 Suspended Cap(@ContrarianCurse)那家伙,挺有意思的。TBU(@TBU12345678)。我非常喜欢 TBU。Outspoken Geek(@OutspokenGeek)。Jukan(@jukan05)提供的信息很有价值。路透社的 Max Cherney(@chernandburn)。我喜欢他。Thomas 几乎从不发帖,但 Positron 的 Thomas Sohmers(@trsohmers)偶尔会发些有用的东西。SemiAnalysis 的 Sravan(@SKundojjala)时不时会发些好内容。还有 Citrini(@citrini)。哦,Bucket Shop Capital(@bucketshopcap)。我喜欢他。Dan Nystedt(@dnystedt)。

卖方那边你欣赏的人。Stacy Rasgon 算一个。

是的,我喜欢 Stacy Rasgon(@BernsteinRasgon)和 Vivek Arya(美银)。Timothy Arcuri(瑞银)。基本上,任何有胆量提出尖锐问题的人,我都喜欢。

是什么让你最终在 HBM 上认输的?

这更多是一个长期论点。让我认输的,基本上就是 Coatue 的 Nick Gagnet 的观点——存储制造商将重新估值,不再基于市净率,而是基于每股收益。

你觉得你最终会用什么方式参与存储领域?

我不知道,我还在考虑。SK 海力士很快会有 ADR。我不确定是等那个,还是重新买入美光。

你设置两个账户,一个纯多头,一个交易账户,只是为了保持思路清晰?

是的,从心理上来说,就在过去两周,我有好几天交易账户亏了 25 万美元,但我完全不为所动,因为我还有纯多头账户。所以别人问我,你怎么这么疯狂,怎么能承受这种波动?因为我不在乎。我有单独的账户。我认真遵循自己的建议:不要投入你输不起的钱。我的交易账户就算归零,我也没事。我还有纯多头账户。而且,把保证金和所有资金放在一个账户里并不健康。这就是我管理风险的方式。

你会推荐给父母哪家公司,作为十年持有不动的那种?

英特尔,因为英特尔是一个疯狂的长期持有标的。还有博通、是德科技。SiTime,但可能不是现在这个价格。英伟达,显然。台积电。这些都是长期、闭眼买入的标的。

博通,我猜他们所有的客户都迫切想摆脱对它的依赖,还是说这不是问题?

谷歌在尝试。但进展不顺利,我可以告诉你。除了 Lumentum,另一个主要的磷化铟玩家其实是博通。没多少人知道这一点。博通有一个巨大的激光部门。一家非常多元化的公司。

@insane_analyst

存到 YouMind

使用 YouMind 深度阅读爆款文章

保存原文、追问细节、总结观点,并在一个 AI 工作空间里把爆款文章沉淀成可复用笔记。

了解 YouMind

更多可拆解样本

近期爆款文章

探索更多爆款文章