多くの人は、AI 競争はチップがすべてだと考えています。最も速い GPU を持っているのは誰か?最高の AI アクセラレーターを持っているのは誰か?最大のデータセンターを持っているのは誰か?最も賢いモデルを持っているのは誰か?
これらはすべて重要です。しかし、AI 競争には、あまり注目されていないものの、同じくらい重要な別の要素があります。それはメモリです。
ここで言うメモリとは、「鍵をどこに置いたか忘れた」という意味の記憶ではありません。AI システムが思考するために必要なデータを保存、移動、配信する物理的なハードウェアとしてのメモリです。AI は計算するだけではありません。AI は、膨大な情報を信じられないほどの速度で記憶し、検索し、比較し、移動し、再利用します。これにより、メモリは AI エコノミー全体における最も重要なボトルネックの 1 つとなっています。
AI がこれほどメモリを必要とする理由
あなたが AI モデルに特定のトピックについて深くリサーチするよう依頼したと想像してください。答えるために、モデルは人間のように「思考」するわけではありません。モデルは、数十億、あるいは数兆もの保存された値に対して、膨大な数の数学的演算を実行します。これらの値は「重み(weights)」と呼ばれます。
重みとは、モデルの学習済み構造です。これは、トレーニング後にモデルが「知っている」ことです。質問をすると、AI システムは答えを生成するために、これらの重みに何度もアクセスする必要があります。モデルが大きければ大きいほど、より多くの重みを持ち、それらを保存してアクセスするためにより多くのメモリが必要になります。
しかし、メモリの問題はそれだけではありません。モデルはあなたのプロンプトも追跡し続ける必要があります。すでに生成した単語を覚えておく必要があります。長いドキュメントを処理したり、コードを分析したり、PDF を要約したり、複数のファイルを比較したり、長い会話のコンテキストを維持したりする必要があるかもしれません。これらすべての一時的な作業情報は、どこかに存在する必要があります。
AI システムは、答えを生成している間、現在使用している情報を保存する場所を必要とします。より大きなモデルは、より多くのメモリを必要とします。より長い会話は、より多くのメモリを必要とします。同時により多くのユーザーがいると、より多くのメモリが必要になります。より多くの画像、動画、ドキュメント、リアルタイムデータも、より多くのメモリを必要とします。
これが、AI が単に計算集約型であるだけでなく、メモリ集約型でもある理由です。

小さな燃料パイプを備えたスーパーカー
チップ企業が AI のパフォーマンスについて語るとき、多くの場合、計算能力について話します。これは通常、チップが 1 秒間に実行できる数学的演算の数を意味します。しかし、ここには落とし穴があります。チップは、アクセスできるデータに対してのみ計算できるということです。
データが計算エンジンに十分な速さで届かなければ、チップはアイドル状態になります。これが AI ハードウェアの厳しい現実です。理論上の計算能力はスライド資料上では素晴らしく見えるかもしれませんが、実際のパフォーマンスは、システムが十分なデータを十分な速さで移動できるかどうかにかかっています。
これがメモリ帯域幅です。帯域幅とは、メモリとプロセッサの間を 1 秒間に移動できるデータの量です。これを高速道路の幅に例えてみましょう。車線が多ければ多いほど、より多くの車が同時に移動できます。メモリ帯域幅が大きければ大きいほど、より多くのデータが同時に AI チップに到達できます。
狭い道路は渋滞を引き起こします。細いパイプは水の流れを制限します。小さな燃料パイプはスーパーカーの能力を制限します。メモリ帯域幅が低いと、AI は制限されます。これが、AI チップが理論上は「高速」でも、実際には期待を裏切る理由です。計算エンジンは準備万端でも、データが渋滞に巻き込まれている可能性があります。

AI は実際にどれだけのメモリを必要とするのか?
現在の典型的な大規模 AI モデルには、およそ 4,000 億の「重み」(トレーニング中に学習したもの)があります。最も一般的な形式で保存すると、そのモデルだけで約 800 ギガバイトのメモリを消費します。これは、約 200 本の HD 映画に相当するサイズです。
しかし、モデルだけがスペースを必要とするわけではありません。モデルとチャットするたびに、システムは会話履歴、アップロードしたドキュメント、そして思考中に作成される増え続ける「メモ」(キーバリューキャッシュと呼ばれる)も保持する必要があります。忙しい日には、1 回の会話だけで簡単に 50 ~ 200 GB もの容量が必要になることがあります。
そして今度は、それを数千、数百万のユーザーが同時に利用する場合を考えてみましょう。すると、1 つのデータセンターだけで、会話を滞りなく処理するために、数万ギガバイト、つまり数十テラバイトものメモリが必要になる可能性があります。
だからこそ、業界は HBM に熱中しているのです。現代の AI チップ 1 つに、100 ~ 200 GB 以上のこの超高速メモリを組み合わせることができます。次世代チップは、さらに多くのメモリを搭載しようとしています。これが不足すると、チップはまるでガソリンタンクが空のフェラーリのように、待機するだけになってしまいます。

HBM: 注目のメモリ
現在のハイエンド AI において最も重要なメモリは HBM(High Bandwidth Memory、広帯域メモリ)です。HBM はメモリを垂直に積み重ねた、まるで小さな超高層ビルのようなものです。メモリチップを回路基板上に平らに配置する代わりに、HBM はメモリの層を互いに積み重ね、GPU や AI アクセラレーターの非常に近くに配置します。
距離が敵であるため、これが重要です。基板上をデータが移動するには時間とエネルギーがかかります。チップのすぐ隣にあるメモリからデータを移動する方がはるかに高速で効率的です。HBM は AI アクセラレーターに、メモリへの巨大で幅広い接続を提供します。細い道ではなく、工場に直接つながる 32 車線の高速道路を建設するようなものです。
これが、NVIDIA、AMD、Google、Amazon、Meta、Microsoft、Broadcom、そしてほぼすべての本格的な AI チップ開発プロジェクト(TERAFAB も含む。詳細は後述)が HBM に深く関心を寄せている理由です。GPU やアクセラレーターが見出しを飾るかもしれませんが、HBM はチップが実際に行える有用な作業の量を決定するのに役立ちます。
HBM は製造も困難です。高度なメモリ製造、垂直積層、極度の精密さ、先進的パッケージング、熱管理、そしてプロセッサとの緊密な連携が必要です。これが、Micron、SK hynix、Samsung が非常に重要になった理由です。彼らはもはや、PC 向けの汎用メモリを販売しているだけではありません。AI 構築の重要な構成要素の 1 つを供給しているのです。
かつて、メモリ企業は循環するコモディティビジネスとして扱われることがよくありました。AI の世界では、ハイエンドメモリ企業は戦略的なインフラサプライヤーとして見られています。

DRAM: 頼りになる主力製品
DRAM(Dynamic Random Access Memory、ダイナミック ランダム アクセス メモリ)は、コンピュータやサーバーで使用される主要なメモリです。これは、ほとんどの人がよく知っている通常のワーキングメモリですが、普段あまり意識することはないかもしれません。16 GB、32 GB、64 GB の RAM を搭載したラップトップを購入する場合、それは通常 DRAM です。
DRAM は、高密度で比較的手頃な価格であり、広く使用されているため重要です。DRAM はサーバー、PC、データセンター、そして多くの AI システムに搭載されています。これは、CPU がデータを管理し、ワークロードを供給し、アプリケーションをサポートし、AI アクセラレーターの周辺のシステム全体を実行するのに役立ちます。
しかし、DRAM には限界もあります。オンチップキャッシュほど高速ではありません。HBM のような極端な帯域幅も持ち合わせていません。また、通常は主要な AI プロセッサから離れた場所にあるため、最も要求の厳しいワークロードに対してチップに十分な速さでデータを供給できないことがあります。
DRAM は、工場の背後にある大きな倉庫のようなものだと考えてください。大量の在庫を保管でき、不可欠ですが、作業員の手元に正確な部品があるほど高速ではありません。AI にはその両方が必要です。大規模なメモリプールと、計算ユニットの近くにある信じられないほど高速なメモリの両方が必要なのです。

SRAM とキャッシュ: 作業台の上のメモリ
SRAM(Static Random-Access Memory、スタティック ランダム アクセス メモリ)は DRAM よりもはるかに高速です。これはチップ内部でキャッシュメモリとして使用されます。キャッシュは、作業台の上に置かれた小さな工具や部品の山のようなものです。わざわざ建物の反対側まで歩いて取りに行く必要はありません。それらはすでにあなたの手元にあります。
そのため、キャッシュは非常に価値があります。AI チップが重要なデータをオンチップキャッシュに保持できる場合、時間とエネルギーを節約できます。チップは HBM や DRAM に頻繁にアクセスしに行く必要がなくなります。これにより、パフォーマンスと効率が向上します。
しかし、問題もあります。SRAM はチップ上で多くの面積を占有します。シリコン面積の点でコストがかかります。チップに数百ギガバイトもの SRAM を単純に搭載することはできません。チップが巨大になり、非常に高価になってしまいます。
そのため、チップ設計者はトレードオフに直面します。どれだけの面積を計算に割り当てるべきか?どれだけをキャッシュに割り当てるべきか?どれだけをインターコネクト、制御ロジック、その他の機能に割り当てるべきか?これは AI チップ設計において最も興味深い部分の 1 つです。アーキテクチャは単なるエンジニアリングではありません。それは、微視的なスケールでの資本配分なのです。
シリコンの 1 平方ミリメートルごとに役割があります。

GDDR: ゲーミング GPU とローカル AI のメモリ
GDDR(Graphics Double Data Rate、グラフィックス ダブル データ レート)は、多くのグラフィックスカードで使用されているメモリです。ゲーミング GPU やワークステーション GPU をお持ちの場合、それが GDDR を使用している可能性は高いです。GDDR は、HBM よりも低コストで高い帯域幅を提供するため重要です。最も極端な AI ワークロードにおいては HBM ほど強力でも効率的でもありませんが、非常に有用です。
これは、自宅で AI モデルを実行することを可能にするメモリです。ゲーミング GPU、クリエイター向けワークステーション、小規模な AI サーバー、ホビイストのセットアップ、ローカルでのモデル実験をサポートします。コンシューマー向け NVIDIA GPU で画像生成モデルを実行している人は、おそらく GDDR に依存しています。小規模な言語モデルをローカルでテストしている開発者は GDDR を使用しているかもしれません。高価なクラウドインフラに移行する前に AI アプリケーションをプロトタイピングしているスタートアップも GDDR を使用しているかもしれません。
これは重要です。なぜなら、すべてのモデルが巨大なハイパースケールデータセンター内で実行される必要があるわけではないからです。一部のモデルは、ワークステーション、ゲーミング PC、小規模サーバー上でローカルに実行できます。

LPDDR: AI をポケットに届けるメモリ
LPDDR(Low-Power Double Data Rate、低電力ダブルデータレート)は、スマートフォン、タブレット、ラップトップ、そして多くのモバイルデバイスで使用される低電力メモリです。これは、AI がクラウドからあなたの手、車、メガネ、時計、ロボットへと移行する際に重要となるメモリです。
LPDDR は消費電力を抑えるように設計されています。これは、電話がデータセンターのように振る舞うことができないため、非常に重要です。メガワット単位の電力を消費することはできません。液体冷却に依存することはできません。ジェットエンジンのような音を立てることもできません。AI がデバイス上でローカルに実行されるためには、メモリは高速で、コンパクトで、省電力で、手頃な価格でなければなりません。
これこそが、エッジ AI にとって LPDDR が非常に重要である理由です。ローカル言語モデルを実行するスマートフォンは、モデルを保存し、あなたのリクエストを処理するために十分なメモリを必要とします。AI ツールをローカルで実行するラップトップは、実用的であるのに十分な速度を持ちながら、バッテリー寿命を損なわないほど効率的なメモリを必要とします。自動運転ソフトウェアを実行する車は、熱、寒さ、振動、過酷な条件下で安全に動作しながら、リアルタイムのセンサーデータを処理できるメモリを必要とします。
ヒューマノイドロボットもローカルメモリを必要とします。視覚、言語、動作、バランス、触覚、環境コンテキストを処理する必要があります。その知能の一部はクラウドに接続されるかもしれませんが、ロボットは一歩踏み出すたびやランプを倒さないように避けるたびに、遠くのサーバーを待っているわけにはいきません。
LPDDR は HBM ほど注目を集めないかもしれませんが、AI がローカルで、パーソナルで、モバイルで、具現化されたものになるためには不可欠です。

NAND フラッシュ: AI の図書館
NAND(NOT-AND の組み合わせ)フラッシュは、長期保存に使用されるメモリです。SSD、携帯電話、ラップトップ、データセンター、カメラ、車両、そして多くの組み込みシステムに搭載されています。NAND は電源がオフでもデータを保持します。
NAND は DRAM や HBM よりも低速ですが、ストレージとしてはるかに安価で高密度です。これは、データが積極的に処理されていないときに保存される場所です。AI において、NAND はトレーニングデータ、モデルファイル、チェックポイント、ログ、動画、画像、ドキュメント、埋め込み、マップ、ユーザーデータを保存します。
NAND は図書館や倉庫のようなものだと考えてください。HBM は高速な組立ラインです。SRAM キャッシュはあなたの手にある工具です。DRAM はアクティブな作業スペースです。
自動運転車の場合、NAND はマップ、運転ログ、知覚データ、ソフトウェアアップデートを保存するかもしれません。ロボットの場合、動作履歴、ローカルモデル、メンテナンスログ、環境データを保存するかもしれません。データセンターの場合、膨大なデータセットとモデルチェックポイントを保存します。
ストレージが遅すぎると、高価な AI アクセラレーターが待機状態に陥る可能性があります。
それは、外科医チームに数百万ドルを支払いながら、手術器具を部屋に運び込む人がいないために待たせるようなものです。
「低速な」メモリでさえ、AI システム全体が巨大なパイプラインを通じてデータを供給することに依存している場合には重要です。

AI データセンターは巨大なメモリマシンである
現代の AI データセンターは、しばしば巨大な計算マシンとして説明されます。それは正しいですが、不完全です。AI データセンターは、巨大なメモリマシンでもあります。
データセンターは、ストレージから CPU へ、CPU から GPU へ、GPU から HBM へ、GPU から別の GPU へ、サーバーから別のサーバーへ、そしてしばしばクラスターから別のクラスターへとデータを移動させる必要があります。すべての移動には、時間、エネルギー、そしてコストがかかります。
これは、サーバーアーキテクチャ、ラック設計、ネットワーキング、冷却、消費電力、総所有コスト(TCO)など、あらゆるものに影響を与えます。メモリシステムの設計が不十分だと、データセンターは高価な GPU を無駄にすることになります。GPU が十分なメモリに十分な速さでアクセスできない場合、パフォーマンスは低下します。メモリが消費する電力が多すぎると、冷却コストが上昇します。メモリ容量が限られていると、同じワークロードを実行するためにより多くのアクセラレーターが必要になるかもしれません。
これが、AI インフラへの資本投資が非常に大きくなる理由です。購入しているのは単なるチップではありません。GPU、HBM、CPU、DRAM、NAND、ネットワーキング、スイッチ、電力供給、冷却、パッケージング、ソフトウェア、そして建物を含む、完全な産業システムを購入しているのです。

パッケージング: 壊れるまで誰も話題にしない部分
HBM は、存在するだけでは役に立ちません。物理的に AI アクセラレーターに接続されていなければなりません。そこで先進的パッケージングが重要になります。
現代の AI チップは、単独で存在する単一のシリコン片ではありません。これらは、ロジックチップ、メモリスタック、インターポーザー、基板、そして高速接続を組み合わせた複雑なパッケージです。重要なパッケージングアプローチの 1 つは、2.5D パッケージングと呼ばれます。基本的な考え方は、GPU またはアクセラレーターと HBM スタックが、それらの間の極めて高速な通信を可能にする特別なベース層上に並べて配置されるというものです。
これにより、メモリはチップにデータを供給するのに十分なほど近く、かつ接続された状態になります。TSMC の CoWoS パッケージング技術は、先進的なプロセッサと HBM の接続を支援するため、特に重要になっています。このパッケージング容量は、AI サプライチェーンにおける主要なボトルネックとなっています。
これは奇妙ですが、重要な点です。世界最高の AI チップを設計できます。ロジックを製造できます。HBM を生産できます。しかし、それらを大規模にパッケージングできなければ、最終製品を出荷することはできません。

メモリの経済性は変わりつつある
何十年もの間、メモリはしばしば循環するコモディティビジネスと見なされてきました。価格が上昇し、企業が供給を増やし、価格が下落し、そのサイクルが繰り返されました。AI はそのストーリーを変えました。
HBM は普通のコモディティメモリではありません。それは特殊で、希少で、製造が難しく、世界で最も価値のある AI システムに不可欠です。これにより、メモリメーカーはより戦略的な重要性と、はるかに大きな価格決定力を得ることになります。
NVIDIA、AMD、またはカスタム AI チップ企業が十分な HBM を入手できなければ、十分なアクセラレーターを出荷できません。クラウドプロバイダーが十分なアクセラレーターを入手できなければ、十分な AI キャパシティを展開できません。AI キャパシティが制約されれば、推論コストは高止まりし、アプリケーションのスケーリングはより遅くなります。
メモリは AI 成長の調整弁となります。これが、SK hynix、Samsung、Micron といった企業が非常に重要である理由です。彼らは単に AI の波に乗っているだけではありません。その波がどれだけ大きくなり得るかを定義する手助けをしているのです。

エージェンティック AI: メモリの増幅器

エージェンティック AI は、将来のメモリ需要の最大の原動力の 1 つになる可能性があります。なぜなら、エージェントは通常のチャットボットセッションとは異なる動作をするからです。チャットボットは質問に答えて停止します。AI エージェントは働き続けます。目的を記憶し、会話を追跡し、ツールを呼び出し、ファイルを開き、結果を確認し、サブタスクに分岐し、オプションを比較し、多くの場合、答えを生成する前に複数の推論ループを実行します。
これにより、メモリの方程式が変わります。

単純な AI クエリでは、モデル、ユーザープロンプト、コンテキストウィンドウ、出力のためにメモリが必要になる場合があります。エージェンティックワークフローにははるかに多くのメモリが必要です。元の指示、以前のステップ、中間結果、ツールの出力、長時間実行されるコンテキスト、並列サブエージェント、永続的な状態のためにメモリが必要になる可能性があります。わかりやすく言えば、チャットボットは短期記憶を必要としますが、エージェントはワーキングメモリ、プロジェクトメモリ、そして開いたファイルで覆われた机を必要とします。
これが、エージェンティック AI が DRAM 需要に段階的な変化(ステップチェンジ)をもたらす可能性がある理由です。Micron のナラティブマップの推定によると、アクティブなエージェント 1 つにつき、典型的なチャットボットのやり取りよりも 5 ~ 10 倍多くのメモリが必要になる可能性があります。なぜなら、エージェントはより長いコンテキスト、ツール履歴、サブエージェントの分岐、外部知識の統合を維持するからです。

重要な点は、エージェンティック AI はクエリの数を増やすだけではないということです。ユーザー 1 人あたりのメモリ集約度を高めます。チャットボットを使用する人間 1 人は、1 つのプロンプトと 1 つの応答を生成するかもしれません。エージェントを使用する人間 1 人は、数十、数百もの舞台裏の操作を引き起こす可能性があります。これを検索して、それを要約して、スプレッドシートを確認して、シナリオを実行して、出力を比較して、計画を修正して、そしてそれを時間をかけて監視する、といった具合です。
つまり、メモリ需要は複数の層で複合的に増加します。
より多くのユーザー × ユーザーあたりのより多くのエージェント × エージェントあたりのより多くのタスク × タスクあたりのより多くのメモリ × より長い持続性。
これは、従来のソフトウェアとは大きく異なる需要曲線です。古いソフトウェアでは、ユーザーはアプリを開き、何かを実行し、閉じました。エージェンティック AI では、ユーザーが離れた後もソフトウェアが動作し続ける可能性があります。受信箱、カレンダー、コードベース、財務モデル、法的文書、カスタマーサービスチケット、工場システムを監視するかもしれません。それぞれの永続的なエージェントは、計算とメモリの小規模で継続的な消費者となります。
これは、メモリがエージェンティック AI の制限リソースの 1 つになるため、Micron にとって重要です。AI エージェントの時代には、GPU だけでなく、それらの GPU の周りの高速メモリ、ハイエンドサーバー DRAM、より大規模なメモリプール、そして最終的には従来の限界を超えてメモリ容量を拡張するための CXL のようなテクノロジーが必要になります。アップロードされた Micron のレポートは、エージェントが長時間実行されるコンテキストを維持し、外部ツールを呼び出すため、従来のチャットボットのやり取りと比較してアクティブユーザーあたりのメモリ需要を何倍にも増幅させることから、AI エージェントを次の段階の需要ベクトルとして具体的に特定しています。
最も簡単な例えは次の通りです。ChatGPT は、賢い従業員に質問することのようなものです。エージェンティック AI は、その従業員を雇って一日中プロジェクトに取り組んでもらうことのようなものです。前者は短い集中を必要とします。後者は、メモリ、ファイル、コンテキスト、ツール、そして継続性を必要とします。

だからこそ、エージェンティック AI は Micron にとって非常に重要になり得るのです。それはメモリを、背景にあるコンポーネントから、中核的なスケーリングの制約へと変えます。AI エージェントがエンタープライズソフトウェア、カスタマーサービス、コーディング、リサーチ、ファイナンス、ヘルスケア、ロジスティクス、個人の生産性のための新しいインターフェースになるのであれば、メモリ需要は直線的には成長しないかもしれません。不連続に成長する可能性があります。
そのような世界では、重要な質問はもはや単に「何個の GPU が構築されるのか?」ではありません。
より良い質問は次のようになります。
世界は何人の永続的な AI ワーカーを稼働させるのか、そして、それぞれが考え、記憶し、推論し、行動するためにどれだけのメモリを必要とするのか?

エッジ AI とロボティクス: メモリはデータセンターを離れる
AI の次の段階は、より大きなデータセンターにおけるより大きなモデルだけではありません。AI は物理的な世界にも移行しています。電話、ラップトップ、車、ロボット、ドローン、医療機器、産業機械、セキュリティカメラ、スマートグラス、家庭用デバイスなどです。
これらのシステムはすべてメモリを必要としますが、異なるバランスのメモリを必要とします。データセンターは大量の電力と高度な冷却を使用できます。ロボットはそうはいきません。電話はそうはいきません。ドローンは間違いなくそうはいきません。
エッジ AI には、高速で、省電力で、コンパクトで、信頼性が高く、手頃な価格のメモリが必要です。工場で働くヒューマノイドロボットを考えてみてください。カメラ、センサー、モーター、バランスシステム、言語インターフェース、タスク計画ソフトウェアを備えています。環境を理解し、自分が何をしているかを記憶し、人間に応答し、障害物を避け、リアルタイムで自分の体を制御する必要があります。
それにはメモリが必要です。単なるストレージではありません。単なるデータベースではありません。実際のワーキングメモリです。
あるいは、自動運転車を考えてみてください。8 台のカメラ、レーダー、超音波センサー、マップ、計画ソフトウェア、そして常に稼働しているニューラルネットワークを備えているかもしれません。リアルタイムで世界を処理する必要があります。「ちょっと待って、メモリバスが混雑している」とは言えません。
物理的な AI は、メモリを安全性の問題にします。AI がチャットボットから自動車やロボットに移行するにつれて、レイテンシが重要になります。電力が重要になります。熱が重要になります。信頼性が重要になります。ローカルメモリが重要になります。
これが、メモリが Tesla、ロボティクス、自動運転、スマートフォン、ラップトップ、医療機器、産業オートメーションにとって中心的な存在である理由です。ロボットの知能は、適切な情報に適切なタイミングでアクセスできなければ役に立ちません。

未来のメモリ: 有望な新技術
将来重要になる可能性のある、いくつかの将来メモリ技術があります。MRAM は磁気状態を使用してデータを保存します。不揮発性で耐久性があり、組み込みシステム、自動車用チップ、産業用デバイス、エッジ AI で役立つ可能性があります。ReRAM は電気抵抗の変化を使用してデータを保存します。低電力デバイス、そしておそらくはメモリ内計算(compute-in-memory)システムに役立つ可能性があります。
相変化メモリ(Phase-change memory)は、材料を異なる物理状態間で変化させることでデータを保存します。DRAM とストレージの間の橋渡しとして研究されてきました。強誘電体メモリ(Ferroelectric memory)は、電気分極を保持する材料を使用します。将来の低電力組み込みシステムで重要になる可能性があります。光メモリ(Optical memory)は、光がある状況下でデータを非常に高速かつ効率的に移動できるため興味深いですが、広く商業化することは依然として困難です。
3D DRAM は、NAND フラッシュが数年前に 3D 構造に移行したのと同様に、上方に構築することでメモリ密度を拡張するのに役立つ可能性があります。Processing-in-memory と compute-in-memory は、核となる問題に直接取り組むため、特に興味深いものです。データをメモリと計算の間で行ったり来たりさせる代わりに、データがすでに存在する場所の近くでいくつかの演算を実行しようと試みます。
これは明白に思えます。食料品がすでにある場所で夕食を作れるのに、なぜ街中を横切ってすべての食料品を運ぶ必要があるのでしょうか?
しかし、実装は困難です。メモリ製造とロジック製造は異なります。
将来のメモリ技術は有望ですが、AI のメモリ問題は、おそらく一つの奇跡的な技術ではなく、スタック全体にわたる多くの改善によって解決されるでしょう。

宇宙における AI: 次のメモリフロンティア
宇宙ベースの AI は未来的に聞こえますが、その論理は単純です。AI はエネルギー、計算、冷却、通信、そしてメモリを必要とします。宇宙は、これらの分野のいくつかにおいて、最終的には利点を提供するかもしれません。軌道上では太陽エネルギーが豊富で中断がありません。熱は宇宙空間に放射できます。衛星はグローバルな通信ネットワークに直接接続できます。そして SpaceX は衛星を軌道に乗せるコストを急速に低下させています。
メモリはさらに重要になるかもしれません。宇宙ベースの AI システムは、単に信号を中継するだけの受動的な衛星ではありません。データをローカルで処理し、推論を実行し、通信を調整し、地球観測データを分析し、自律ロボティクスをサポートし、軌道交通を管理し、グローバルな AI 計算レイヤーの一部として機能する可能性があります。それには、プロセッサの近くにある高性能メモリが必要です。

メモリ企業にとって、これは新たな需要層を生み出す可能性があります。軌道 AI システムには、耐放射線メモリ、低消費電力メモリ、高帯域幅メモリ、不揮発性ストレージ、そしておそらく過酷な環境向けに設計された特殊なメモリアーキテクチャが必要になるでしょう。その制約は地上のデータセンターとは異なります。重量、消費電力、熱設計、信頼性、耐放射線性のすべてが重要です。
最後に... TERAFAB
イーロンはこのプロジェクトを、ロジック、メモリ、パッケージング、テスト、および関連する半導体プロセスを1つの施設に統合するものと説明しました。
Terafab は、イーロンが HBM や先進メモリ生産の一部を内製化できれば、長期的には外部メモリサプライヤーにとって競争上の脅威となる可能性があります。
イーロンは、メモリが重要ではないから Terafab を建設しているわけではありません。AI、ロボティクス、自動運転車、そして宇宙ベースのデータセンターにおいて、メモリが制約要因の1つとなる可能性があるからこそ、Terafab を建設しているのです。






