Báo cáo chuyên sâu mới nhất của Bernstein: Cuộc chiến về kết nối trung tâm dữ liệu AI

Một báo cáo chuyên sâu dài 97 trang gần đây từ Bernstein chỉ ra rằng kết nối đồng và quang trong các trung tâm dữ liệu AI không loại trừ lẫn nhau mà sẽ cùng tồn tại lâu dài trong các kịch bản mở rộng quy mô (scale-up) và mở rộng theo chiều ngang (scale-out). Mặc dù công nghệ CPO (Quang học đóng gói chung) có ưu điểm về điện năng và chi phí, việc triển khai rộng rãi vẫn gặp rào cản do những thách thức trong sản xuất và bảo trì. Việc áp dụng đại trà khó có thể xảy ra trước năm 2028, khiến các kết nối quang như LPO/NPO trở thành những công nghệ dẫn đầu trong giai đoạn chuyển tiếp. Tuy nhiên, CPO đang định hình lại chuỗi giá trị một cách cơ bản, chuyển trung tâm lợi nhuận từ các nhà cung cấp module quang truyền thống sang các nhà thiết kế chip, đóng gói tiên tiến và tích hợp hệ thống.

Một lưu ý đặc biệt về Bernstein: Sanford C. Bernstein là một công ty nghiên cứu đầu tư và quản lý tài sản nổi tiếng thế giới có trụ sở tại Mỹ. Được thành lập năm 1967 và hiện là một phần của AllianceBernstein (AB), đây là một trong những tổ chức nghiên cứu bên bán độc lập lớn nhất và lâu đời nhất. Dưới đây là phân tích chi tiết về báo cáo này.

Vào giữa tháng 2, tôi đã trình bày chi tiết logic cốt lõi về sự tắc nghẽn truyền dẫn trong chuỗi ngành công nghiệp sức mạnh tính toán AI, lưu ý rằng kết nối quang sẽ là một chủ đề AI chính mà thị trường chuyển sang trong giai đoạn 2025-26.

Tôi thực sự chỉ bắt đầu tập trung và nghiên cứu lĩnh vực kết nối quang vào cuối năm ngoái: https://x.com/qinbafrank/status/2015377625167089671?s=20

Báo cáo của Bernstein tập trung vào ba khía cạnh cốt lõi:

Tại sao kết nối lại thay thế sức mạnh tính toán trở thành nút thắt cổ chai mới? Nhịp điệu hiện thực hóa của CPO là gì? Tại sao PCB/Chất nền ABF lại là hướng hiện thực hóa hiệu suất thực tế hơn vào năm 2026? Hãy cùng phân tích.

Thông điệp thực sự của báo cáo này không phải là "CPO sắp bùng nổ", mà là:

Nút thắt cổ chai của các trung tâm dữ liệu AI đang dịch chuyển từ GPU/HBM/CoWoS sang "hệ thống kết nối". Chủ đề đầu tư trong tương lai không phải là chiến thắng đơn độc của CPO, mà là sự nâng cấp tổng thể của quang, điện, đồng, bo mạch, đóng gói và kiểm thử.

Nói một cách thẳng thắn hơn:

Trước đây, thị trường nhìn nhận AI thông qua sức mạnh tính toán GPU.

Bây giờ, thị trường đang xem xét cách các GPU được kết nối.

Trong tương lai, nó sẽ xem xét liệu hiệu suất sử dụng sức mạnh tính toán có thể được giải phóng bởi các hệ thống kết nối hay không.

Đây chính là cái gọi là "Cuộc chiến giành kết nối trung tâm dữ liệu AI" được đề cập trong tiêu đề báo cáo.

1. Tại sao "Kết nối" đang trở thành nút thắt cổ chai mới cho các trung tâm dữ liệu AI?

Một cụm AI không chỉ đơn thuần là xếp chồng GPU. Vấn đề thực sự là các GPU này phải đồng bộ hóa ở tốc độ cao, trao đổi tham số, truyền giá trị kích hoạt, thực hiện AllReduce, và xử lý song song mô hình và dữ liệu. Dù sức mạnh tính toán lý thuyết có mạnh đến đâu, nếu giao tiếp giữa các GPU không theo kịp, hiệu suất sử dụng thực tế sẽ giảm.

Hãy nghĩ về một cụm AI như một nhà máy khổng lồ:

Tại sao kết nối sẽ thay thế sức mạnh tính toán trở thành nút thắt cổ chai mới?

Gốc rễ của điều này nằm ở cách các mô hình lớn được huấn luyện. Có hai phương pháp song song: Tensor Parallelism và Expert Parallelism. Cả hai đều yêu cầu trao đổi dữ liệu quy mô lớn, thường xuyên giữa các GPU.

Lượng dữ liệu trao đổi trong một phiên huấn luyện duy nhất là rất lớn. Trước đây, bạn chỉ cần xếp chồng GPU; bây giờ, bạn càng xếp nhiều, chi phí giao tiếp càng cao. Tại một điểm tới hạn nhất định, việc thêm GPU không còn tăng tốc độ huấn luyện mà còn làm trầm trọng thêm tình trạng tắc nghẽn giao tiếp. Đây là nút thắt cổ chai kết nối.

Bernstein đưa ra một so sánh: bên trong một rack NVIDIA GB30 tiêu chuẩn, cáp đồng được sử dụng giữa các GPU vì khoảng cách ngắn, đồng rẻ và ổn định. Tuy nhiên, phải sử dụng cáp quang giữa các rack vì tín hiệu đồng bị suy hao không thể chấp nhận được khi vượt quá 2 mét. Các module quang ở cả hai đầu cáp quang chuyển đổi tín hiệu điện thành tín hiệu quang và ngược lại.

Vấn đề là một module quang 1.6T tiêu thụ khoảng 30 watt, hơn một nửa trong số đó được tiêu thụ bởi một con chip gọi là DSP (Bộ xử lý tín hiệu số). Với hàng trăm module quang trong một rack, chỉ riêng mức tiêu thụ điện năng của truyền thông quang đã khó có thể kiềm chế.

Do đó, vấn đề thực sự của các trung tâm dữ liệu AI hiện tại không phải là sức mạnh tính toán không đủ, mà là mức tiêu thụ điện năng đang chạm trần. NVIDIA cho biết các bộ chuyển mạch thế hệ mới của họ có thể tiết kiệm 70% điện năng so với các module quang truyền thống. Đối với một bộ chuyển mạch 51.2T, điều này giúp tiết kiệm 500 watt, cho phép lắp thêm nhiều GPU hơn.

NVIDIA đang củng cố câu chuyện này. Vào tháng 3 năm 2025, NVIDIA đã phát hành các bộ chuyển mạch silicon quang học Spectrum-X Photonics và Quantum-X, nhấn mạnh chúng được thiết kế để kết nối hàng triệu GPU trong các nhà máy AI đồng thời giảm năng lượng và chi phí bảo trì. NVIDIA tuyên bố các bộ chuyển mạch quang học của họ có thể đạt 1.6Tb/s mỗi cổng, cải thiện hiệu suất năng lượng gấp 3,5 lần, cải thiện tính toàn vẹn tín hiệu gấp 63 lần và khả năng phục hồi mạng gấp 10 lần.

Logic cốt lõi của báo cáo Bernstein là: giai đoạn tiếp theo của CAPEX AI không chỉ là mua thêm GPU, mà là mua thêm "khả năng kết nối để làm cho GPU hoạt động hiệu quả".

2. Nhận định cốt lõi: Không phải "Đồng thoái, Quang tiến", mà là "Đa đường cùng tồn tại"

Có một quan điểm đơn giản trên thị trường: đồng thoái lui, quang tiến lên.

Nhưng báo cáo này đưa ra một góc nhìn tinh tế hơn: đồng và quang không phải là sự thay thế đơn giản mà sẽ cùng tồn tại lâu dài với các khoảng cách, băng thông, yêu cầu bảo trì và cấu trúc chi phí khác nhau. Bernstein tin rằng kết nối đồng và quang sẽ phát triển riêng biệt trong các kịch bản Scale-up và Scale-out. Nhận định này rất quan trọng.

1. Scale-up: Kết nối trong rack / khoảng cách ngắn, Đồng vẫn mạnh

Scale-up đề cập đến các kết nối tốc độ cao giữa GPU, GPU và bộ chuyển mạch, hoặc trong / gần rack. Các ưu tiên ở đây là:

Độ trễ thấp, chi phí thấp, độ tin cậy cao, khả năng bảo trì và khả năng truyền dẫn khoảng cách ngắn.

Trong kịch bản này, đồng sẽ không sớm biến mất.

Jensen Huang cũng đã tuyên bố rõ ràng: NVIDIA sẽ không sử dụng CPO cho các kết nối chính giữa các GPU hàng đầu vào lúc này vì các kết nối đồng truyền thống hiện đáng tin cậy hơn nhiều so với CPO; NVIDIA sẽ sử dụng CPO trước tiên trong hai chip mạng mới cho các bộ chuyển mạch top-of-rack.

Điều này rất quan trọng. Nó cho thấy CPO là hướng đi, nhưng không phải là sự thay thế hoàn toàn ngay lập tức cho đồng.

Nói cách khác, ở giai đoạn này, logic của NVIDIA là:

Các bộ chuyển mạch có thể áp dụng CPO trước, trong khi phía GPU/XPU nên thận trọng hơn.

Lý do rất đơn giản: GPU là tài sản đắt nhất và quan trọng nhất trong hệ thống. Bạn không thể hy sinh độ tin cậy chỉ để tiết kiệm năng lượng với kết nối quang. Trong một cụm huấn luyện AI, một liên kết thường xuyên bị ngắt kết nối không chỉ gây ra chi phí phần cứng mà còn đồng nghĩa với việc các tác vụ huấn luyện bị gián đoạn, giảm mức sử dụng GPU và tăng độ phức tạp trong lập lịch.

2. Scale-out: Kết nối giữa các rack / giữa các cụm, Quang có lợi thế

Scale-out liên quan đến việc mở rộng cụm GPU lớn hơn, thường liên quan đến lưu lượng đông-tây giữa các rack hoặc trong trung tâm dữ liệu ở khoảng cách xa hơn.

Trong kịch bản này, các giải pháp quang có những lợi thế rõ ràng:

Khoảng cách xa hơn, băng thông cao hơn, cáp nhẹ hơn, tiêu thụ điện năng thấp hơn và mật độ đi dây tốt hơn.

Vì vậy, tương lai không phải là "đồng bị thay thế hoàn toàn bởi quang", mà là:

Phần có giá trị nhất trong báo cáo của Bernstein là nó không dừng lại ở "cổ phiếu khái niệm CPO" mà chia nhỏ kết nối AI thành nhiều tuyến kỹ thuật khác nhau.

3. CPO: Hướng đi quan trọng, nhưng năm 2026 không phải là năm bùng nổ toàn diện

Phần dễ bị hiểu sai nhất của báo cáo này là CPO.

Nhiều người thấy CPO và ngay lập tức kết luận:

Module quang sẽ bị thay thế, CPO sẽ bùng nổ ngay lập tức, và các nhà máy module quang truyền thống sẽ kết thúc.

Cách hiểu này quá thô thiển.

Bernstein dự kiến việc triển khai CPO quy mô nhỏ trong mạng Scale-out sẽ bắt đầu vào nửa cuối năm 2026, chủ yếu để xác minh hiệu suất thực tế và mức độ trưởng thành của chuỗi cung ứng. Tuy nhiên, trong các kịch bản Scale-up quan trọng hơn, việc áp dụng CPO có thể bị trì hoãn cho đến sau nửa cuối năm 2028, vì ngành công nghiệp cần xác minh độ tin cậy lâu dài của CPO ở phía bộ chuyển mạch trước khi áp dụng nó vào các hệ thống XPU có giá trị cao hơn, không dung sai.

Điều này phù hợp với các tuyên bố trước đây của Jensen Huang: CPO sẽ được sử dụng đầu tiên cho các chip chuyển mạch mạng, không phải cho các kết nối chính GPU quy mô lớn.

Do đó, dòng thời gian nên được hiểu như thế này:

Quan điểm của LightCounting cũng ủng hộ "sự tiến hóa dần dần" chứ không phải "chuyển đổi qua đêm". LightCounting dự đoán các module pluggable truyền thống vẫn sẽ thống trị trong 5 năm tới, mặc dù LPO/CPO sẽ chiếm một phần đáng kể trong các cổng 800G và 1.6T từ 2026 đến 2028. Bản tóm tắt quan điểm ngành của EDN cũng đề cập rằng Yole tin rằng việc triển khai CPO quy mô lớn có thể xảy ra trong giai đoạn 2028-2030, trong khi LightCounting tin rằng các module quang vẫn sẽ chiếm phần lớn các liên kết quang của trung tâm dữ liệu trong thập kỷ này, mặc dù các thành phần quang sẽ tiếp tục tiến gần hơn đến ASIC.

Vì vậy, nhận định của tôi là:

CPO là một hướng đi trung và dài hạn, nhưng doanh thu chắc chắn hơn vào năm 2026 sẽ không nhất thiết đến từ các cổ phiếu khái niệm CPO thuần túy, mà đến từ các nâng cấp cần thiết trước thềm CPO: nguồn sáng, kiểm thử, đóng gói, PCB, ABF, CCL, module quang 1.6T và LPO/NPO.

4. LPO/NPO: "Tuyến chính chuyển tiếp" trước khi CPO bùng nổ

Một điểm quan trọng trong báo cáo này là nó không chỉ đơn giản chia các tuyến kỹ thuật thành "module quang truyền thống so với CPO."

Có LPO và NPO ở giữa.

1. LPO là gì?

LPO là viết tắt của Linear Pluggable Optics (Quang học có thể cắm tuyến tính). Có thể hiểu đại khái là: giữ nguyên hệ số dạng pluggable nhưng loại bỏ hoặc làm suy yếu DSP, sử dụng driver tuyến tính và cân bằng phía host để giảm tiêu thụ điện năng.

Ưu điểm: Tiêu thụ điện năng thấp hơn, chi phí có khả năng thấp hơn và vẫn duy trì được khả năng bảo trì.

Nhược điểm: Gỡ rối hệ thống khó hơn, ngân sách liên kết chặt chẽ hơn và yêu cầu cao hơn đối với SerDes phía host và kỹ thuật hệ thống.

Các bản tóm tắt công khai đề cập rằng bằng cách loại bỏ DSP và giao việc xử lý tín hiệu cho các thành phần tuyến tính, LPO có thể giảm đáng kể mức tiêu thụ điện năng so với các module pluggable truyền thống trong khi vẫn giữ được sự tiện lợi của việc bảo trì mô-đun. Bernstein thậm chí tin rằng số lượng xuất xưởng LPO có thể vượt quá CPO vào năm 2030.

2. NPO là gì?

NPO là viết tắt của Near-Packaged Optics (Quang học đóng gói gần), có nghĩa là đặt động cơ quang học gần ASIC hơn, nhưng không được bịt kín hoàn toàn cùng nhau như CPO.

Giá trị của nó nằm ở sự thỏa hiệp:

Điều này cho thấy vài năm tới có thể sẽ không phải là bước "một bước đến CPO", mà là:

Pluggable truyền thống → LPO/NPO → CPO → Optical I/O / optical fabric

Đây là lý do tại sao bạn không thể chỉ nhìn vào CPO vào năm 2026. Các công ty có thể thực sự hiện thực hóa hiệu suất có khả năng là những công ty có thể cung cấp trên nhiều giai đoạn.

Tóm lại, câu chuyện CPO sẽ không được hiện thực hóa vào năm 2026. CPO sẽ chỉ được xuất xưởng với số lượng nhỏ vào nửa cuối năm 2026 cho các kịch bản scale-out, có nghĩa là việc triển khai quy mô lớn giữa các rack sẽ phải chờ đến năm 2028.

Tại sao lại chậm như vậy? Bernstein đưa ra ba lý do:

Thứ nhất, các nhà cung cấp dịch vụ đám mây ngần ngại chuyển đổi. Nếu một module quang truyền thống bị lỗi, việc bảo trì chỉ cần cắm một cái mới trong vài phút. Một CPO được hàn vào bộ chuyển mạch; nếu một động cơ quang bị lỗi, toàn bộ bộ chuyển mạch phải được đưa về nhà máy. Thời gian chết và chi phí bảo trì là những vấn đề lớn đối với Amazon, Google và Microsoft. Hơn nữa, tỷ lệ hỏng hóc của module quang không hề thấp—tiêu chuẩn ngành là một lần hỏng hóc sau mỗi 100.000 giờ, có nghĩa là 9 trên 10.000 module bị lỗi hàng năm, và đó mới chỉ là các lỗi phần cứng.

Bằng cách tích hợp động cơ quang vào chip, độ tin cậy của CPO phải được cải thiện vài bậc độ lớn để trấn an các nhà cung cấp đám mây. Bernstein đã nói rõ rằng sau khi trao đổi với Innolight, một nhà máy module quang Trung Quốc, họ được biết rằng không có khách hàng nào là nhà cung cấp đám mây có kế hoạch triển khai CPO trên quy mô lớn trong giai đoạn 2026-2027. Đây là một tuyên bố nặng ký mà thị trường có thể chưa được nghe.

Thứ hai, các giải pháp chuyển tiếp đã xuất hiện. CPO không phải là lựa chọn duy nhất. Có hai công nghệ trung gian: LPO và NPO. LPO loại bỏ chip DSP tiêu tốn nhiều năng lượng, thay thế nó bằng các thành phần đơn giản hơn. Sự cắt giảm này làm giảm mức tiêu thụ điện năng xuống còn 1/3 so với các module truyền thống trong khi vẫn giữ được hệ số dạng pluggable 800G, hiện đang được sản xuất hàng loạt.

NPO đặt động cơ quang lên PCB bên cạnh chip chuyển mạch, nhưng nó vẫn có thể tháo rời được. Các sản phẩm CPO hiện tại của NVIDIA, nói một cách chính xác, là NPO. Hai giải pháp chuyển tiếp này có thể kéo dài từ 2 đến 3 năm. Vì vậy, các nhà cung cấp đám mây có mọi lý do để sử dụng LPO trước và chờ đợi CPO thực sự trưởng thành.

Thứ ba, trong các kịch bản scale-up, đồng chưa chết. Các kết nối giữa các GPU được gọi là scale-up. Lợi thế về chi phí và độ tin cậy của đồng hiện tại không có giải pháp thay thế.

Bernstein nói rõ rằng từ 2026 đến 2028, scale-up vẫn sẽ bị chi phối bởi đồng. Luxshare là một bên hưởng lợi ở đây, cạnh tranh trực tiếp với Amphenol để giành các đầu nối đồng NVIDIA GB300. Ngoài ra còn có một công nghệ chuyển tiếp gọi là CPC (Đồng đóng gói chung), giúp kéo dài thêm vòng đời của cáp đồng.

LightCounting dự đoán rằng đến năm 2029, đồng vẫn sẽ nắm giữ gần một nửa thị phần của thị trường kết nối 1.6T.

5. Tác động lớn nhất của CPO: Không phải giảm chi phí đơn thuần, mà là sự phân phối lại quỹ lợi nhuận

Ý nghĩa công nghiệp của CPO không chỉ là tiết kiệm năng lượng hay thay thế module quang.

Nó thực sự thay đổi nơi lợi nhuận được tạo ra.

Trong kỷ nguyên pluggable truyền thống, chuỗi giá trị gần như là:

DSP / Chip quang / TOSA/ROSA / Đóng gói Module / Nhà máy Module quang / Nhà máy Chuyển mạch / Nhà cung cấp Đám mây.

Trong kỷ nguyên CPO, nó trở thành:

ASIC chuyển mạch / Động cơ quang / Nguồn Laser bên ngoài / FAU / Đóng gói Tiên tiến / Chế tạo Wafer / Kiểm thử / Tích hợp Hệ thống.

Bernstein đã thực hiện phân tích chi phí cho bộ chuyển mạch CPO NVIDIA Quantum-X800: nó có bốn ASIC chuyển mạch, mỗi ASIC được tích hợp với 18 động cơ quang và 18 mô-đun nguồn sáng bên ngoài. Một bộ chuyển mạch CPO Quantum-X800 đơn lẻ được ước tính có giá khoảng 570.000 USD. Bản tóm tắt cũng lưu ý rằng dưới kiến trúc CPO, DSP bị loại bỏ, động cơ quang được đóng gói chung với chip chuyển mạch và trung tâm giá trị chuyển sang thiết kế chip, đóng gói tiên tiến và chế tạo wafer.

Đây là lý do tại sao báo cáo ủng hộ các hướng này:

Tương đối mà nói, các nhà máy module quang truyền thống sẽ phải đối mặt với một vấn đề: nếu giá trị chuyển từ đóng gói module sang ASIC, đóng gói, động cơ quang và tích hợp hệ thống, quỹ lợi nhuận của họ có thể bị tái cấu trúc.

Nhưng điều này không có nghĩa là các nhà máy truyền thống mất giá trị ngay lập tức. Bởi vì từ 2026 đến 2028, vẫn sẽ có nhu cầu lớn về 800G, 1.6T và LPO/NPO. Cignal AI cũng chỉ ra rằng các module tốc độ cao cho datacom, đặc biệt là 800GbE và các thiết kế 1.6TbE mới nổi, vẫn sẽ là động lực tăng trưởng chính vào năm 2026.

Vì vậy, cách hiểu đúng là:

CPO sẽ thay đổi sự phân phối lợi nhuận của chuỗi ngành module quang, nhưng nó sẽ không loại bỏ các module quang pluggable vào năm 2026.

6. Tại sao báo cáo nhấn mạnh PCB, ABF và CCL là những hướng thực tế hơn cho năm 2026?

Đây là điều tôi tin rằng xứng đáng nhận được sự chú ý nhất của bạn.

CPO có không gian tưởng tượng lớn, nhưng chu kỳ hiện thực hóa của nó muộn hơn. Ngược lại, các nâng cấp cho PCB, ABF và CCL gần gũi hơn với các đơn hàng hiện tại.

Lý do là: ngay cả khi CPO chưa được thương mại hóa trên quy mô lớn, các máy chủ AI và bộ chuyển mạch đã và đang nâng cấp.

Rubin, Rubin Ultra, GB300, ASIC của nhà cung cấp đám mây và ASIC chuyển mạch thế hệ tiếp theo đều đang gia tăng:

Tốc độ bảng đơn, diện tích đóng gói, mật độ năng lượng, yêu cầu về tính toàn vẹn tín hiệu, yêu cầu về tản nhiệt và yêu cầu về vật liệu tổn hao thấp.

Đây là điểm phản trực quan nhất nhưng dễ bị bỏ qua nhất trong báo cáo nghiên cứu này. Những người thực sự kiếm tiền vào năm 2026 là các đường đua "tiền cũ": PCB, HDI, ABF và chất nền.

Tại sao lại phản trực quan? Bởi vì những đường đua này quá truyền thống. PCB là một ngành công nghiệp hàng chục năm tuổi với thị trường toàn cầu 85 tỷ USD vào năm 2025. Nghe có vẻ không hấp dẫn. Mọi người đều đang nhìn chằm chằm vào CPO, module quang và NVIDIA, và không ai muốn dành thời gian nghiên cứu bảng mạch in. Nhưng dữ liệu của Bernstein cho chúng ta biết đường đua này đã âm thầm cất cánh vào năm 2025.

Bernstein đưa ra một loạt con số: Victory Giant Technology, công ty sản xuất bảng mạch HDI (Kết nối mật độ cao), có doanh thu năm 2025 tăng 63% so với cùng kỳ năm ngoái. WUS Printed Circuit, nhà cung cấp MPCB cho NVIDIA GB300, tăng trưởng 45%. Gold Circuit Electronics, nhà cung cấp cho AWS Trainium, tăng trưởng 40%, và Shengyi Electronics, một nhà cung cấp AWS khác, tăng trưởng 40%. Đây là những kết quả hiệu suất thực tế đã xảy ra, không phải là kỳ vọng. Tại sao đường đua này lại tăng? Có ba khía cạnh:

Đầu tiên, hàm lượng PCB trong máy chủ AI đã tăng gấp đôi. Trước đây, một máy chủ NVIDIA H100 với 8 GPU có tổng giá trị HDI và PCB khoảng 100-150 USD mỗi GPU. Đối với rack GB200 NVL72, con số này tăng vọt lên 300 USD mỗi GPU. Điều này có nghĩa là gì? Với mỗi GPU được bán ra, các nhà sản xuất PCB kiếm được gấp đôi.

Và nó vẫn chưa kết thúc. Nền tảng Vera Rubin sắp tới sẽ áp dụng một cấu trúc mới gọi là midplane, thay thế các bộ phận được kết nối bằng đồng trước đây bằng PCB nhiều lớp. Midplane này là một bảng 44 lớp sử dụng tấm phủ đồng cấp M8 cao cấp. Rubin Ultra thế hệ tiếp theo có thể sử dụng bảng cấp M9 78 lớp. Số lớp tăng gấp đôi, vật liệu nâng cấp và giá trị lại tăng gấp đôi.

Thứ hai, vật liệu thượng nguồn là một nút thắt cổ chai. Chất nền ABF yêu cầu một vật liệu chính gọi là T-glass (sợi thủy tinh có hệ số giãn nở nhiệt thấp) để ngăn chip AI làm biến dạng chất nền ở nhiệt độ cao và gây ra hỏng mối hàn.

Hiện tại, chỉ có một công ty trên thế giới có thể đạt được các thông số kỹ thuật T-glass hàng đầu: Nittobo, với giá trị CTE là 2,8%. Các nhà sản xuất khác không thể đạt đến mức này. Công suất mới của Nittobo sẽ không đi vào hoạt động cho đến cuối năm 2026, với các lô hàng chính thức vào năm 2027, có nghĩa là T-glass sẽ bị thiếu hụt liên tục trong suốt năm 2026.

Sự thiếu hụt T-glass có nghĩa là gì? Nó có nghĩa là các nhà sản xuất chất nền ABF có thể tăng giá một cách chính đáng. Unimicron đã thương lượng lại giá với khách hàng. Mô hình của Bernstein dự đoán rằng ASP chất nền ABF sẽ tăng 5%-7% theo quý vào năm 2026, với mức tăng tích lũy hàng năm có thể vượt quá 20%.

Thứ ba, nhà độc quyền vô hình của màng ABF. Màng ABF là vật liệu cốt lõi cho chất nền ABF, được phát minh bởi Ajinomoto, công ty thực phẩm Nhật Bản nổi tiếng với bột ngọt. Vào những năm 90, trong khi nghiên cứu bột ngọt, họ đã vô tình phát hiện ra một loại màng có nguồn gốc từ axit amin đặc biệt có thể đóng vai trò như một lớp giãn nở nhiệt cho chất nền bán dẫn. Kể từ đó, 95% màng ABF trên thế giới đến từ Ajinomoto.

Theo dữ liệu của Bernstein, mảng kinh doanh ABF của Ajinomoto có biên lợi nhuận gộp 60%, với tốc độ tăng trưởng 32% trong năm tài chính 2026, dự kiến sẽ tăng tốc lên 45% trong năm tài chính 2027. Mảng kinh doanh ABF của công ty này đã không thể bị lay chuyển trong 30 năm.

Vì vậy, sự chắc chắn cho năm 2026 không phải là "sự bùng nổ CPO qua đêm", mà là:

Nâng cấp PCB tốc độ cao; Nâng cấp chất nền ABF; Nâng cấp CCL lên vật liệu tổn hao thấp hơn; Nâng cấp lá đồng, vải sợi thủy tinh và vật liệu Dk/Df thấp; và nâng cấp trong kiểm thử và xác minh.

Do đó, một chiến lược thực tế hơn cho năm 2026 là nắm bắt ba loại sự chắc chắn: nhu cầu quang học do quá trình chuyển đổi 1.6T và LPO/NPO mang lại, nâng cấp PCB/ABF/CCL do Rubin/ASIC mang lại, và kiểm thử/FAU/nguồn sáng/đóng gói tiên tiến phải được đầu tư trước khi sản xuất thử CPO.

Thị trường vốn thường mắc một sai lầm: họ thích mua các khái niệm xa nhất, nhưng những thứ mang lại kết quả đầu tiên thường là "cơ sở hạ tầng phải được xây dựng trước khi khái niệm dài hạn xuất hiện."

CPO giống như một ga tàu cao tốc trong tương lai. Nhưng trước khi nhà ga đi vào hoạt động đầy đủ, những người kiếm tiền là những người xây đường, đặt đường ray, cung cấp điện, hệ thống tín hiệu và thiết bị kiểm thử.

7. Trình tự hưởng lợi của chuỗi ngành trong báo cáo này

Nếu chúng ta chia chuỗi ngành kết nối AI thành bốn lớp:

Lớp 1: Những người chiến thắng nền tảng mạnh nhất

Các công ty này không chỉ bán một bộ phận; họ kiểm soát kiến trúc.

NVIDIA

Lợi thế của NVIDIA không chỉ là GPU, mà là GPU + NVLink + InfiniBand + Ethernet + Spectrum-X + Quantum-X + hệ sinh thái phần mềm. Việc NVIDIA tiết lộ chính thức các bộ chuyển mạch mạng silicon quang học đã bao gồm TSMC, Coherent, Corning, Fabrinet, Foxconn, Lumentum, SENKO, SPIL, Sumitomo Electric, TFC Communication, v.v., trong hệ sinh thái của mình.

Điều này cho thấy NVIDIA đang làm một điều: không chỉ bán GPU, mà còn đưa kiến trúc mạng của các nhà máy AI vào dưới sự kiểm soát nền tảng của mình.

TSMC: Trung tâm vô hình của toàn bộ câu chuyện này

Nền tảng COUPE của họ kết hợp chip điện tử và quang tử sử dụng công nghệ lai ghép. Tất cả các khách hàng lớn—NVIDIA, Broadcom, các phòng thí nghiệm AI—đang dịch chuyển về phía TSMC. Bản thân công ty này không kiếm được nhiều từ CPO, nhưng CPO củng cố sự thống trị của TSMC trong lĩnh vực đóng gói tiên tiến và xưởng đúc wafer.

Broadcom

Logic của Broadcom khác. Nó giống như: ASIC chuyển mạch Ethernet + ASIC tùy chỉnh + CPO + hệ sinh thái chip tùy chỉnh của nhà cung cấp đám mây.

Vào tháng 10 năm 2025, Broadcom đã công bố Tomahawk 6 Davisson, bộ chuyển mạch Ethernet CPO thế hệ thứ ba của họ với dung lượng chuyển mạch 102.4Tbps, tuyên bố rằng nó đã được xuất xưởng. Broadcom tuyên bố rằng bằng cách tích hợp các động cơ quang COUPE của TSMC và đóng gói đa chip tiên tiến, nó giảm mức tiêu thụ điện năng kết nối quang xuống 70% đồng thời hỗ trợ scale-up cho 512 XPU và hơn 100.000 XPU trong mạng hai tầng.

Điều này chỉ ra rằng TSMC và Broadcom là những công ty quan trọng cùng với NVIDIA trong mạng AI và chuỗi giá trị CPO.

Lớp 2: Kết nối quang và tốc độ cao với độ chắc chắn cao

Điều này bao gồm: module quang 1.6T, LPO/NPO, silicon quang học, laser, nguồn sáng bên ngoài, FAU và đầu nối quang.

Các hướng đại diện bao gồm Coherent, Lumentum, Fabrinet, Innolight, Eoptolink, SENKO, Corning, Sumitomo, v.v. Danh sách hệ sinh thái chính thức của NVIDIA bao gồm một số công ty liên quan đến quang học, đóng gói và kết nối.

Trọng tâm ở đây không phải là "ai giống CPO nhất", mà là:

Ai có thể đồng thời nắm bắt nhu cầu về 800G/1.6T, LPO/NPO, sản xuất thử CPO, nguồn sáng bên ngoài và FAU.

Các công ty có thể trải dài trên nhiều giai đoạn có tỷ lệ thắng cao hơn các công ty chỉ có một khái niệm duy nhất.

Lớp 3: PCB, ABF, CCL, Vật liệu

Đây là nơi tôi tin rằng năm 2026 rất có thể bị định giá thấp.

Các báo cáo công khai đề cập rằng báo cáo gốc đã đề cập hoặc đề cập đến các công ty như Chroma, Luxshare, Unimicron, NVIDIA, Broadcom, TSMC và Ibiden.

Trong số này, các công ty trong chuỗi chất nền/PCB như Unimicron và Ibiden rất đáng chú ý vì khi độ phức tạp của máy chủ AI tăng lên, PCB và chất nền đóng gói không còn chỉ là những người theo sau mà là những ràng buộc về hiệu suất.

Lớp 4: Thiết bị kiểm thử, Năng suất, Độ tin cậy

Khó khăn lớn nhất đối với CPO không phải là PPT, mà là sản xuất hàng loạt.

Sản xuất hàng loạt phải giải quyết: năng suất ghép nối quang-điện; độ ổn định của nguồn laser bên ngoài; độ tin cậy trong môi trường nhiệt độ cao; ứng suất đóng gói; bảo trì hiện trường; thời gian kiểm thử; tính nhất quán; và các chế độ sửa chữa sau khi hỏng hóc.

Do đó, thiết bị kiểm thử và xác minh độ tin cậy có thể là những lựa chọn "cuốc và xẻng" tuyệt vời.

Những công ty này có thể không phải là những công ty hấp dẫn nhất, nhưng nếu CPO bước vào sản xuất thử, họ thường là những người đầu tiên nhận được đơn đặt hàng.

8. Hàm ý đầu tư: Đừng mua thứ "mang tính khái niệm nhất", hãy mua thứ "khó bị bỏ qua nhất"

Bài học lớn nhất từ báo cáo này cho đầu tư là:

Kết nối AI không phải là một cuộc cách mạng kỹ thuật đơn điểm, mà là sự di chuyển của các điểm nghẽn. Hãy đầu tư vào các điểm nghẽn phổ biến, không phải vào các tuyến đường đơn lẻ.

Điểm nghẽn phổ biến là gì?

Thứ mà không thể bỏ qua, bất kể giải pháp cuối cùng là CPO, LPO, NPO hay nâng cấp các pluggable truyền thống. Ví dụ:

Ngược lại, rủi ro từ một tuyến duy nhất cao hơn.

Ví dụ, nếu bạn chỉ mua "các khái niệm CPO thuần túy", rủi ro là: sản xuất hàng loạt CPO bị trì hoãn, đơn hàng không được thực hiện, và định giá bị cắt giảm trước tiên.

Nếu bạn chỉ mua các module quang truyền thống, rủi ro là: CPO/NPO/LPO tái cấu trúc chuỗi giá trị, và các nguồn lợi nhuận dài hạn bị các nhà máy nền tảng và nhà máy chip/đóng gói chiếm lấy.

Nếu bạn chỉ mua PCB/vật liệu, rủi ro là: khách hàng mở rộng công suất quá nhanh, nguồn cung được giải phóng tập trung, và biên lợi nhuận gộp đảo chiều.

Vì vậy, một sự kết hợp tốt hơn là:

Mua sự chắc chắn trong năm 2026, mua độ co giãn của đơn hàng trong năm 2027, và mua các tùy chọn kiến trúc sau năm 2028.

9. Đánh giá Cá nhân về Tính Hợp lý của Báo cáo

Điều rất hợp lý

Đầu tiên, mở rộng điểm nghẽn AI từ GPU sang các hệ thống kết nối là một hướng đi rất đúng đắn. Các bản phát hành sản phẩm từ NVIDIA và Broadcom đang xác nhận điều này.

Thứ hai, phản đối câu chuyện đơn giản "đồng ra, sợi quang vào" là một nhận định quan trọng. Báo cáo của Reuters về Jensen Huang đã chỉ ra rõ ràng rằng đồng vẫn có lợi thế về độ tin cậy trong các kết nối GPU/XPU lõi trong ngắn hạn.

Thứ ba, quan điểm cho rằng CPO là hướng đi nhưng việc mở rộng quy mô đòi hỏi phải xác minh độ tin cậy cũng hợp lý. Các đánh giá của ngành từ LightCounting và Yole/EDN nghiêng về "di chuyển dần dần chứ không phải thay thế toàn bộ ngay lập tức".

Thứ tư, nhấn mạnh rằng các "khâu tiền tuyến" như PCB/ABF/CCL, thử nghiệm và nguồn sáng có nhiều khả năng được hiện thực hóa trong năm 2026 là rất hữu ích cho đầu tư. Thị trường vốn có xu hướng giao dịch quá mức những câu chuyện xa vời nhất, đồng thời đánh giá thấp các khâu thực sự nhận được đơn hàng trong ngắn hạn.

Điều cần lưu ý

Đầu tiên, các bản tóm tắt công khai có thể "đầu tư hóa" hoặc "giật gân hóa" quan điểm của Bernstein. Ví dụ, cụm từ "Chiến trường AI thực sự không nằm trong chip, mà nằm trong kết nối" thì rất bắt tai, nhưng nói một cách chính xác, GPU/HBM/CoWoS vẫn là những điểm nghẽn lõi; chỉ là tầm quan trọng biên của kết nối đang tăng lên, chứ không phải chip trở nên không quan trọng.

Thứ hai, hướng chuyển dịch giá trị của CPO là đúng, nhưng tốc độ có thể bị thị trường đánh giá quá cao. CPO phải giải quyết các vấn đề trong sản xuất, đóng gói, bảo trì hiện trường, thay thế khi hỏng hóc và độ tin cậy; nó không phải là một công nghệ có thể mở rộng ngay lập tức sau một buổi họp báo.

Thứ ba, giá trị chuyển tiếp của LPO/NPO là rất lớn, nhưng độ khó của việc gỡ lỗi hệ thống của chúng không hề thấp. LPO không chỉ là một "phiên bản tiêu thụ điện năng thấp của pluggable"; nó chuyển rất nhiều độ phức tạp sang phía máy chủ và gỡ lỗi cấp hệ thống.

Thứ tư, mặc dù dòng PCB/ABF/CCL có độ chắc chắn cao, nhưng cũng phải cảnh giác với các chu kỳ mở rộng. Một khi ngành công nghiệp vật liệu và chất nền thấy sự thịnh vượng cao, việc mở rộng công suất rất dễ xảy ra, và nếu nhịp độ nền tảng của khách hàng chậm lại sau đó, biên lợi nhuận gộp sẽ bị ảnh hưởng.

10. Mốc Thời gian Theo dõi trong 2-3 Năm Tới

2026: Đừng chỉ nhìn vào CPO, hãy nhìn vào ba sự chắc chắn

Trọng tâm năm 2026 không phải là sự bùng nổ của CPO, mà là:

Liệu các module quang pluggable 1.6T có mở rộng quy mô hay không;
Liệu LPO/NPO có đạt được nhiều chứng nhận từ nhà cung cấp đám mây/nền tảng switch hơn không;
Liệu PCB/ABF/CCL có tiếp tục tăng giá hoặc mở rộng công suất hay không;
Liệu các thiết bị thử nghiệm liên quan đến CPO, FAU và nguồn sáng ngoài có bắt đầu có đơn hàng thực tế hay không.

Nếu những điều này xảy ra, điều đó có nghĩa là logic của báo cáo đang bước vào giai đoạn hiện thực hóa.

2027: Xem các thí điểm CPO chuyển từ "nguyên mẫu" sang "triển khai khách hàng"

Các chỉ số chính:

Triển khai thực tế của khách hàng đối với NVIDIA Quantum-X / Spectrum-X Photonics;
Mở rộng khách hàng đối với Broadcom Davisson/Tomahawk CPO;
Sự chấp nhận của CoreWeave, Lambda, Meta, Google, Microsoft, Amazon, v.v.;
Ghi nhận doanh thu cho nguồn sáng ngoài CPO, FAU và thiết bị thử nghiệm.

2028 và Xa hơn: Xem liệu CPO có bước vào Giai đoạn Mở rộng Quy mô hay không

Bước ngoặt quan trọng nhất:

Liệu CPO có chuyển từ phía switch sang gần XPU/GPU hay không;
Liệu Optical I/O có bước vào đóng gói ASIC/GPU cao cấp hay không;
Liệu OCS/optical fabric có bắt đầu thay đổi cấu trúc liên kết mạng trung tâm dữ liệu hay không.

Nếu đạt đến bước này, CPO không còn chỉ là một sự thay thế module quang, mà là một sự thay đổi trong kiến trúc tính toán AI.

11. Khung Đầu tư Dựa trên Báo cáo này: Bốn Loại Tài sản, Bốn Logic

Nếu sử dụng báo cáo này để định hướng đầu tư vào cổ phiếu Mỹ, Hồng Kông hoặc A-shares, tôi sẽ chia chúng thành bốn loại.

Chiến lược mà tôi công nhận nhất là:

Mua những người chiến thắng nền tảng cho nắm giữ cốt lõi, mua sự chắc chắn về quang và PCB cho nắm giữ co giãn, và mua các hướng CPO dài hạn với tỷ trọng nhỏ cho nắm giữ quyền chọn.

Tôi không khuyến nghị đặt cược tất cả vốn vào "cổ phiếu khái niệm CPO thuần túy" ngay lập tức.

12. Năm Điểm Rút ra Chính từ Báo cáo này

Điểm nghẽn của các trung tâm dữ liệu AI đang chuyển từ "tính toán nhanh" sang "kết nối nhanh, kết nối ổn định và kết nối tiết kiệm năng lượng."
Ánh sáng sẽ không loại bỏ đồng ngay lập tức, và đồng cũng sẽ không nắm giữ tất cả các kịch bản mãi mãi; các khoảng cách và cấp độ hệ thống khác nhau sẽ chọn các giải pháp khác nhau.
CPO là hướng đi, nhưng doanh thu thực tế hơn trong năm 2026 nằm ở 1.6T, LPO/NPO, nguồn sáng, thử nghiệm, PCB, ABF và CCL.
Tác động thực sự của CPO không phải là làm cho các module quang rẻ hơn, mà là chuyển dịch nguồn lợi nhuận từ đóng gói module truyền thống sang chip, đóng gói, động cơ quang, nguồn sáng, thử nghiệm và nền tảng hệ thống.
Khi đầu tư vào kết nối AI, đừng mua những khái niệm hot nhất; hãy mua những điểm nghẽn khó bỏ qua nhất.

Đây là một báo cáo "cơ sở hạ tầng lớp thứ hai của AI" rất có giá trị. Nó nhắc nhở thị trường: sau GPU, thứ tiếp theo được định giá lại không phải là một bộ phận đơn lẻ, mà là toàn bộ ngăn xếp kết nối AI.

Nhưng không nên đọc đơn giản là "CPO sẽ bùng nổ ngay lập tức." Một cách đọc chính xác hơn là:

2026: Nhìn vào pluggable/LPO/NPO/PCB/ABF/thử nghiệm;

2027: Nhìn vào các đơn hàng thí điểm CPO;

2028 và xa hơn: Xem liệu CPO và Optical I/O có thực sự bước vào kiến trúc lõi tính toán AI hay không.

1. Tại sao "Kết nối" đang trở thành nút thắt cổ chai mới cho các trung tâm dữ liệu AI?

2. Nhận định cốt lõi: Không phải "Đồng thoái, Quang tiến", mà là "Đa đường cùng tồn tại"

1. Scale-up: Kết nối trong rack / khoảng cách ngắn, Đồng vẫn mạnh

2. Scale-out: Kết nối giữa các rack / giữa các cụm, Quang có lợi thế

3. CPO: Hướng đi quan trọng, nhưng năm 2026 không phải là năm bùng nổ toàn diện