Tu agente de IA ha llamado. Quiere más memoria.

@CernBasher
INGLÉShace 2 meses · 17 may 2026
299K
404
58
31
610

TL;DR

Este artículo explora el papel fundamental del hardware de memoria (desde HBM hasta DRAM) en el escalado de la IA, destacando cómo la IA agente y la robótica están impulsando un cambio masivo en la demanda de semiconductores.

La mayoría de la gente cree que la carrera de la inteligencia artificial se trata de chips. ¿Quién tiene la GPU más rápida? ¿Quién tiene el mejor acelerador de IA? ¿Quién tiene el centro de datos más grande? ¿Quién tiene el modelo más inteligente?

Todo eso importa. Pero hay otra parte de la carrera de la IA que es menos glamorosa y puede ser igual de importante: la memoria.

No me refiero a la memoria como en "olvidé dónde dejé las llaves". Hablo de la memoria como el hardware físico que almacena, mueve y entrega los datos que los sistemas de IA necesitan para pensar. La IA no solo calcula. La IA recuerda, recupera, compara, mueve y reutiliza enormes cantidades de información a una velocidad increíble. Eso convierte a la memoria en uno de los cuellos de botella más importantes de toda la economía de la IA.

Por qué la IA tiene tanta hambre de memoria

Imagina que le pides a un modelo de IA que haga una investigación profunda sobre un tema. Para responder, el modelo no "piensa" como lo haría una persona. Ejecuta una enorme cantidad de operaciones matemáticas a través de miles de millones o incluso billones de valores almacenados. Esos valores se llaman pesos.

Los pesos son la estructura aprendida del modelo. Son lo que el modelo "sabe" después del entrenamiento. Cuando haces una pregunta, el sistema de IA tiene que acceder a esos pesos una y otra vez para generar una respuesta. Cuanto más grande es el modelo, más pesos tiene y más memoria necesita para almacenarlos y acceder a ellos.

Pero el problema de la memoria no termina ahí. El modelo también tiene que hacer un seguimiento de tu mensaje. Tiene que recordar las palabras que ya ha generado. Puede que necesite procesar un documento largo, analizar código, resumir un PDF, comparar varios archivos o mantener el contexto a lo largo de una conversación larga. Toda esa información de trabajo temporal tiene que vivir en algún lugar.

El sistema de IA necesita lugares para almacenar la información que está usando mientras genera una respuesta. Un modelo más grande necesita más memoria. Una conversación más larga necesita más memoria. Más usuarios al mismo tiempo necesitan más memoria. Más imágenes, videos, documentos y datos en tiempo real necesitan más memoria.

Por eso la IA no solo tiene hambre de capacidad de cómputo. La IA tiene hambre de memoria.

Cern Basher - inline image

El superdeportivo con una tubería de combustible diminuta

Cuando las empresas de chips hablan del rendimiento de la IA, a menudo hablan de potencia de cálculo. Eso generalmente significa cuántas operaciones matemáticas puede realizar el chip por segundo. Pero hay un problema: un chip solo puede calcular con los datos a los que puede acceder.

Si los datos no llegan a los motores de cálculo lo suficientemente rápido, el chip se queda inactivo. Esta es la dolorosa realidad del hardware de IA. La potencia de cálculo teórica puede verse increíble en una presentación, pero el rendimiento en el mundo real depende de si el sistema puede mover suficientes datos con la suficiente rapidez.

Esto es el ancho de banda de la memoria. El ancho de banda es la cantidad de datos que pueden moverse por segundo entre la memoria y el procesador. Piénsalo como el ancho de una autopista. Más carriles significan que más coches pueden circular al mismo tiempo. Más ancho de banda de memoria significa que más datos pueden llegar al chip de IA al mismo tiempo.

Una carretera pequeña crea tráfico. Una tubería estrecha limita el flujo de agua. Una tubería de combustible diminuta limita al superdeportivo. Un ancho de banda de memoria bajo limita la IA. Por eso un chip de IA puede ser "rápido" en teoría pero decepcionante en la práctica. Los motores matemáticos pueden estar listos, pero los datos pueden estar atrapados en el tráfico.

Cern Basher - inline image

¿Cuánta memoria necesita realmente la IA?

Un modelo de IA grande típico hoy en día tiene aproximadamente 400 mil millones de "pesos" (las cosas que aprendió durante el entrenamiento). Almacenado en el formato más común, solo ese modelo ocupa unos 800 gigabytes de memoria, aproximadamente el tamaño de 200 películas en alta definición.

Pero el modelo no es lo único que necesita espacio. Cada vez que conversas con él, el sistema también tiene que almacenar el historial de tu conversación, cualquier documento que hayas subido y una lista creciente de "notas" que hace mientras piensa (llamada caché de clave-valor). En un día ajetreado, una sola conversación puede necesitar fácilmente otros 50–200 GB.

Ahora multiplica eso por miles o millones de usuarios al mismo tiempo. De repente, un solo centro de datos podría necesitar decenas de miles de gigabytes, eso son decenas de terabytes, solo para mantener las conversaciones fluidas.

Por eso la industria obsesiona con la HBM: un solo chip de IA moderno puede ir acompañado de 100–200+ GB de esta memoria ultrarrápida. Los chips de próxima generación ya están presionando para tener aún más. Sin suficiente cantidad, el chip se queda esperando, como un Ferrari con el tanque de gasolina vacío.

Cern Basher - inline image

HBM: La memoria de alto perfil

La memoria más importante en la IA de alto nivel hoy en día es la HBM, o Memoria de Alto Ancho de Banda. La HBM es una memoria apilada verticalmente, como un pequeño rascacielos. En lugar de extender los chips de memoria de forma plana sobre una placa de circuito, la HBM apila capas de memoria una encima de otra y las coloca muy cerca de la GPU o del acelerador de IA.

Esto es importante porque la distancia es enemiga. Mover datos a través de una placa lleva tiempo y energía. Mover datos desde una memoria que está justo al lado del chip es mucho más rápido y eficiente. La HBM proporciona a los aceleradores de IA una conexión enorme y amplia con la memoria. En lugar de una carretera estrecha, es como construir una autopista de 32 carriles directamente hacia la fábrica.

Por eso NVIDIA, AMD, Google, Amazon, Meta, Microsoft, Broadcom y casi todos los proyectos serios de chips de IA (incluyendo TERAFAB, más sobre esto más adelante) se preocupan profundamente por la HBM. La GPU o el acelerador pueden acaparar los titulares, pero la HBM ayuda a determinar cuánto trabajo útil puede realizar realmente el chip.

La HBM también es difícil de fabricar. Requiere fabricación avanzada de memoria, apilamiento vertical, precisión extrema, empaquetado avanzado, gestión del calor y una estrecha coordinación con el procesador. Por eso Micron, SK hynix y Samsung se han vuelto tan importantes. Ya no solo venden memoria genérica para PC. Están suministrando uno de los ingredientes clave del desarrollo de la IA.

En el mundo antiguo, las empresas de memoria a menudo eran tratadas como negocios de materias primas cíclicas. En el mundo de la IA, las empresas de memoria de alta gama parecen más proveedores de infraestructura estratégica.

Cern Basher - inline image

DRAM: El caballo de batalla confiable

La DRAM (Memoria Dinámica de Acceso Aleatorio) es la memoria principal que se usa en computadoras y servidores. Es la memoria de trabajo habitual con la que la mayoría de la gente está familiarizada, aunque no piensen mucho en ella. Cuando compras un portátil con 16 GB, 32 GB o 64 GB de RAM, eso suele ser DRAM.

La DRAM es importante porque es densa, relativamente asequible y ampliamente utilizada. Se encuentra en servidores, PC, centros de datos y muchos sistemas de IA. Ayuda a las CPU a gestionar datos, alimentar cargas de trabajo, soportar aplicaciones y ejecutar el sistema más amplio que rodea a los aceleradores de IA.

Pero la DRAM tiene límites. No es tan rápida como la caché en el chip. No tiene el ancho de banda extremo de la HBM. Y debido a que generalmente está más alejada del procesador principal de IA, no siempre puede alimentar al chip con la suficiente rapidez para las cargas de trabajo más exigentes.

Piensa en la DRAM como el gran almacén detrás de la fábrica. Almacena mucho y es esencial, pero no es tan rápido como tener la pieza exacta al alcance de la mano del trabajador. La IA necesita ambos. Necesita grandes grupos de memoria y una memoria increíblemente rápida cerca de la unidad de cómputo.

Cern Basher - inline image

SRAM y Caché: La memoria en el banco de trabajo

La SRAM (Memoria Estática de Acceso Aleatorio) es mucho más rápida que la DRAM. Se usa dentro de los chips como memoria caché. La caché es como el pequeño montón de herramientas y piezas que están justo en el banco de trabajo. No tienes que cruzar todo el edificio para conseguirlas. Ya están a tu lado.

Eso hace que la caché sea extremadamente valiosa. Cuando un chip de IA puede mantener datos importantes en la caché del chip, ahorra tiempo y energía. El chip no tiene que ir a la HBM o a la DRAM con tanta frecuencia. Eso mejora el rendimiento y la eficiencia.

Pero hay un problema. La SRAM ocupa mucho espacio en el chip. Es cara en términos de área de silicio. Simplemente no puedes poner cientos de gigabytes de SRAM en un chip. El chip se volvería enorme y extremadamente costoso.

Así que los diseñadores de chips se enfrentan a una disyuntiva. ¿Cuánta área debe ir para el cálculo? ¿Cuánto debe ir para la caché? ¿Cuánto debe ir para la interconexión, la lógica de control y otras características? Esta es una de las partes más interesantes del diseño de chips de IA. La arquitectura no es solo ingeniería. Es una asignación de capital a escala microscópica.

Cada milímetro cuadrado de silicio tiene un trabajo.

Cern Basher - inline image

GDDR: La memoria de las GPU para juegos y la IA local

La GDDR (Gráficos de Doble Velocidad de Datos) es la memoria que se usa en muchas tarjetas gráficas. Si tienes una GPU para juegos o una GPU para estaciones de trabajo, es muy probable que use GDDR. La GDDR es importante porque ofrece un alto ancho de banda a un costo menor que la HBM. No es tan potente o eficiente como la HBM para las cargas de trabajo de IA más extremas, pero es increíblemente útil.

Esta es la memoria que permite a las personas ejecutar modelos de IA en casa. Soporta GPU para juegos, estaciones de trabajo para creadores, pequeños servidores de IA, configuraciones para aficionados y experimentación local con modelos. Alguien que ejecuta un modelo de generación de imágenes en una GPU NVIDIA de consumo probablemente está usando GDDR. Un desarrollador que prueba un modelo de lenguaje más pequeño localmente puede estar usando GDDR. Una startup que prototipa aplicaciones de IA antes de pasar a una costosa infraestructura en la nube puede estar usando GDDR.

Eso es importante porque no todos los modelos necesitan ejecutarse dentro de un centro de datos hipersescala gigante. Algunos modelos pueden ejecutarse localmente en estaciones de trabajo, equipos de juego y servidores pequeños.

Cern Basher - inline image

LPDDR: La memoria que lleva la IA a tu bolsillo

La LPDDR (Doble Velocidad de Datos de Bajo Consumo) es una memoria de bajo consumo que se usa en teléfonos inteligentes, tabletas, portátiles y muchos dispositivos móviles. Esta es la memoria que importa cuando la IA se mueve de la nube a tu mano, a tu coche, a tus gafas, a tu reloj o a tu robot.

La LPDDR está diseñada para usar menos energía. Eso es fundamental porque un teléfono no puede comportarse como un centro de datos. No puede consumir megavatios de electricidad. No puede depender de refrigeración líquida. No puede sonar como un motor a reacción. Si la IA va a ejecutarse localmente en los dispositivos, la memoria tiene que ser rápida, compacta, eficiente energéticamente y asequible.

Por eso la LPDDR es tan importante para la IA en el borde. Un teléfono inteligente que ejecuta un modelo de lenguaje local necesita suficiente memoria para almacenar el modelo y procesar tu solicitud. Un portátil que ejecuta herramientas de IA localmente necesita una memoria que sea lo suficientemente rápida para ser útil, pero lo suficientemente eficiente para no destruir la duración de la batería. Un coche que ejecuta software de conducción autónoma necesita una memoria que pueda manejar datos de sensores en tiempo real mientras opera de forma segura en condiciones de calor, frío, vibración y entornos adversos.

Un robot humanoide también necesita memoria local. Tiene que procesar visión, lenguaje, movimiento, equilibrio, tacto y contexto ambiental. Parte de esa inteligencia puede conectarse a la nube, pero el robot no puede esperar a un servidor lejano cada vez que necesita dar un paso o evitar derribar una lámpara.

La LPDDR puede no recibir la atención que recibe la HBM, pero es crucial si la IA va a ser local, personal, móvil y corpórea.

Cern Basher - inline image

NAND Flash: La biblioteca de la IA

La memoria flash NAND (una combinación de "NO-Y") es la memoria que se usa para el almacenamiento a largo plazo. Está en SSD, teléfonos, portátiles, centros de datos, cámaras, vehículos y muchos sistemas integrados. La NAND conserva los datos incluso cuando la alimentación está apagada.

La NAND es más lenta que la DRAM o la HBM, pero es mucho más barata y densa para el almacenamiento. Es donde viven los datos cuando no se están procesando activamente. En la IA, la NAND almacena datos de entrenamiento, archivos de modelo, puntos de control, registros, videos, imágenes, documentos, incrustaciones, mapas y datos de usuario.

Piensa en la NAND como la biblioteca o el almacén. La HBM es la línea de montaje rápida. La caché SRAM es la herramienta que tienes en la mano. La DRAM es el espacio de trabajo activo.

Para los vehículos autónomos, la NAND puede almacenar mapas, registros de conducción, datos de percepción y actualizaciones de software. Para los robots, puede almacenar el historial de operaciones, modelos locales, registros de mantenimiento y datos ambientales. Para los centros de datos, almacena conjuntos de datos enormes y puntos de control de modelos.

Si el almacenamiento es demasiado lento, los costosos aceleradores de IA pueden terminar esperando.

Eso es como pagarle a un equipo de cirujanos millones de dólares y luego hacerlos esperar porque nadie trajo los instrumentos a la sala.

Incluso la memoria "lenta" importa cuando todo el sistema de IA depende de alimentar datos a través de una tubería enorme.

Cern Basher - inline image

Los centros de datos de IA son máquinas de memoria gigantes

Un centro de datos de IA moderno se describe a menudo como una máquina de cómputo gigante. Eso es cierto, pero incompleto. También es una máquina de memoria gigante.

El centro de datos tiene que mover datos desde el almacenamiento a las CPU, de las CPU a las GPU, de las GPU a la HBM, de una GPU a otra GPU, de un servidor a otro servidor y, a menudo, de un clúster a otro clúster. Cada movimiento cuesta tiempo, energía y dinero.

Esto afecta todo: la arquitectura del servidor, el diseño del rack, la red, la refrigeración, el consumo de energía y el costo total de propiedad. Si el sistema de memoria está mal diseñado, el centro de datos desperdicia GPU costosas. Si las GPU no pueden acceder a suficiente memoria con la suficiente rapidez, rinden por debajo de su capacidad. Si la memoria consume demasiada energía, los costos de refrigeración aumentan. Si la capacidad de memoria es demasiado limitada, el sistema puede necesitar más aceleradores para ejecutar la misma carga de trabajo.

Por eso la infraestructura de IA requiere tanto capital. No solo estás comprando chips. Estás comprando un sistema industrial completo: GPU, HBM, CPU, DRAM, NAND, redes, conmutadores, suministro de energía, refrigeración, empaquetado, software y edificios.

Cern Basher - inline image

Empaquetado: La parte de la que nadie habla hasta que se rompe

La HBM no es útil solo porque existe. Tiene que estar físicamente conectada al acelerador de IA. Ahí es donde entra el empaquetado avanzado.

Los chips de IA modernos no son simplemente piezas individuales de silicio que están solas. Son paquetes complejos que reúnen chips lógicos, pilas de memoria, interpositores, sustratos y conexiones de alta velocidad. Un enfoque de empaquetado importante se llama empaquetado 2.5D. La idea básica es que la GPU o el acelerador y las pilas de HBM se colocan uno al lado del otro sobre una capa base especial que permite una comunicación extremadamente rápida entre ellos.

Así es como la memoria se acerca lo suficiente y se conecta lo suficiente para alimentar el chip. La tecnología de empaquetado CoWoS de TSMC se ha vuelto especialmente importante porque ayuda a conectar procesadores avanzados con HBM. Esta capacidad de empaquetado se ha convertido en un cuello de botella importante en la cadena de suministro de IA.

Eso es un punto extraño pero importante. Puedes diseñar el mejor chip de IA del mundo. Puedes fabricar la lógica. Puedes producir la HBM. Pero si no puedes empaquetarlos juntos a escala, no puedes enviar el producto terminado.

Cern Basher - inline image

La economía de la memoria está cambiando

Durante décadas, la memoria a menudo se consideraba un negocio de materias primas cíclico. Los precios subían, las empresas agregaban suministro, los precios bajaban y el ciclo se repetía. La IA cambió esa historia.

La HBM no es una memoria de materia prima ordinaria. Es especializada, escasa, difícil de fabricar y esencial para los sistemas de IA más valiosos del mundo. Eso les da a los fabricantes de memoria una importancia estratégica mayor y mucho más poder de fijación de precios.

Si NVIDIA, AMD o una empresa de chips de IA personalizada no pueden obtener suficiente HBM, no pueden enviar suficientes aceleradores. Si los proveedores de nube no pueden obtener suficientes aceleradores, no pueden implementar suficiente capacidad de IA. Si la capacidad de IA está limitada, la inferencia sigue siendo más cara y las aplicaciones escalan más lentamente.

La memoria se convierte en un regulador del crecimiento de la IA. Por eso empresas como SK hynix, Samsung y Micron son tan importantes. No solo están aprovechando la ola de la IA. Están ayudando a definir lo grande que puede llegar a ser esa ola.

Cern Basher - inline image

IA Agentica: El multiplicador de memoria

Cern Basher - inline image

La IA agentica podría convertirse en uno de los mayores impulsores de la demanda futura de memoria porque los agentes no se comportan como las sesiones normales de chatbot. Un chatbot responde una pregunta y se detiene. Un agente de IA sigue trabajando. Recuerda el objetivo, rastrea la conversación, llama a herramientas, abre archivos, verifica resultados, se ramifica en subtareas, compara opciones y, a menudo, ejecuta múltiples bucles de razonamiento antes de producir una respuesta.

Eso cambia la ecuación de la memoria.

Cern Basher - inline image

Una consulta de IA simple podría requerir memoria para el modelo, el mensaje del usuario, la ventana de contexto y la salida. Un flujo de trabajo agentico necesita mucho más. Puede necesitar memoria para la instrucción original, los pasos anteriores, los resultados intermedios, las salidas de las herramientas, el contexto de larga duración, los subagentes paralelos y el estado persistente. En términos simples: un chatbot necesita memoria a corto plazo; un agente necesita memoria de trabajo, memoria de proyecto y un escritorio cubierto de archivos abiertos.

Por eso la IA agentica podría crear un cambio radical en la demanda de DRAM. El mapa narrativo de Micron estima que cada agente activo podría requerir de 5 a 10 veces más memoria que una interacción típica de chatbot porque los agentes mantienen un contexto más largo, historiales de herramientas, ramificaciones de subagentes e integración de conocimiento externo.

Cern Basher - inline image

El punto importante es que la IA agentica no solo aumenta el número de consultas. Aumenta la intensidad de memoria por usuario. Un humano que usa un chatbot podría generar un mensaje y una respuesta. Un humano que usa un agente podría desencadenar docenas o cientos de operaciones entre bastidores: busca esto, resume aquello, revisa la hoja de cálculo, ejecuta un escenario, compara el resultado, revisa el plan y luego supervisa a lo largo del tiempo.

Eso significa que la demanda de memoria se multiplica en varias capas:

Más usuarios × más agentes por usuario × más tareas por agente × más memoria por tarea × mayor persistencia.

Esta es una curva de demanda muy diferente a la del software tradicional. En el software antiguo, un usuario abría una aplicación, hacía algo y la cerraba. En la IA agentica, el software puede seguir funcionando después de que el usuario se vaya. Puede monitorear bandejas de entrada, calendarios, bases de código, modelos financieros, documentos legales, tickets de servicio al cliente o sistemas de fábrica. Cada agente persistente se convierte en un pequeño consumidor continuo de cómputo y memoria.

Esto es importante para Micron porque la memoria se convierte en uno de los recursos limitantes de la IA agentica. La era de los agentes de IA requiere no solo GPU, sino también memoria rápida alrededor de esas GPU, DRAM de servidor de alta gama, grupos de memoria más grandes y, eventualmente, tecnologías como CXL para expandir la capacidad de memoria más allá de los límites tradicionales. El informe de Micron subido identifica específicamente a los agentes de IA como un vector de demanda de próxima etapa porque los agentes mantienen un contexto de larga duración y llaman a herramientas externas, multiplicando la demanda de memoria por usuario activo en comparación con las interacciones tradicionales de chatbot.

La analogía más fácil es esta: ChatGPT es como preguntarle algo a un empleado inteligente. La IA agentica es como contratar a ese empleado para que trabaje en un proyecto todo el día. La primera requiere un breve estallido de atención. La segunda requiere memoria, archivos, contexto, herramientas y continuidad.

Cern Basher - inline image

Por eso la IA agentica podría ser tan importante para Micron. Convierte la memoria de un componente secundario en una restricción central de escalado. Si los agentes de IA se convierten en la nueva interfaz para el software empresarial, la atención al cliente, la programación, la investigación, las finanzas, la salud, la logística y la productividad personal, entonces la demanda de memoria podría no crecer linealmente. Podría crecer de forma discontinua.

En ese mundo, la pregunta clave ya no es simplemente: "¿Cuántas GPU se construirán?"

La mejor pregunta se convierte en:

¿Cuántos trabajadores de IA persistentes ejecutará el mundo y cuánta memoria necesitará cada uno para pensar, recordar, razonar y actuar?

Cern Basher - inline image

IA en el Borde y Robótica: La memoria sale del centro de datos

La siguiente etapa de la IA no son solo modelos más grandes en centros de datos más grandes. La IA también se está moviendo al mundo físico: teléfonos, portátiles, coches, robots, drones, dispositivos médicos, máquinas industriales, cámaras de seguridad, gafas inteligentes y dispositivos domésticos.

Todos estos sistemas necesitan memoria, pero necesitan un equilibrio diferente de memoria. Un centro de datos puede usar enormes cantidades de electricidad y refrigeración avanzada. Un robot no puede. Un teléfono no puede. Un drone definitivamente no puede.

La IA en el borde necesita una memoria que sea rápida, eficiente energéticamente, compacta, confiable y asequible. Considera un robot humanoide trabajando en una fábrica. Tiene cámaras, sensores, motores, sistemas de equilibrio, interfaces de lenguaje y software de planificación de tareas. Necesita entender su entorno, recordar lo que está haciendo, responder a los humanos, evitar obstáculos y controlar su cuerpo en tiempo real.

Eso requiere memoria. No solo almacenamiento. No solo una base de datos. Memoria de trabajo real.

O considera un vehículo autónomo. Puede tener ocho cámaras, radar, sensores ultrasónicos, mapas, software de planificación y redes neuronales funcionando constantemente. Tiene que procesar el mundo en tiempo real. No puede decir: "Espera, el bus de memoria está congestionado".

La IA física convierte la memoria en un problema de seguridad. Cuando la IA pasa de los chatbots a los coches y los robots, la latencia importa. La energía importa. El calor importa. La fiabilidad importa. La memoria local importa.

Por eso la memoria es central para Tesla, la robótica, la conducción autónoma, los teléfonos inteligentes, los portátiles, los dispositivos médicos y la automatización industrial. La inteligencia del robot solo es útil si puede acceder a la información correcta en el momento adecuado.

Cern Basher - inline image

Memoria del Futuro: Nuevas tecnologías prometedoras

Existen varias tecnologías de memoria futuras que podrían volverse importantes. La MRAM almacena datos usando estados magnéticos. Es no volátil, duradera y potencialmente útil en sistemas integrados, chips automotrices, dispositivos industriales y IA en el borde. La ReRAM almacena datos usando cambios en la resistencia eléctrica. Puede ser útil para dispositivos de bajo consumo y posiblemente para sistemas de cómputo en memoria.

La memoria de cambio de fase almacena datos cambiando materiales entre diferentes estados físicos. Se ha explorado como un puente entre la DRAM y el almacenamiento. La memoria ferroeléctrica utiliza materiales que retienen la polarización eléctrica. Podría ser importante en futuros sistemas integrados de bajo consumo. La memoria óptica es interesante porque la luz puede mover datos muy rápida y eficientemente en algunos contextos, pero sigue siendo difícil de comercializar ampliamente.

La DRAM 3D podría ayudar a extender la densidad de memoria construyendo hacia arriba, tal como la flash NAND pasó a estructuras 3D hace años. El procesamiento en memoria y el cómputo en memoria son especialmente interesantes porque atacan el problema central directamente. En lugar de mover datos de un lado a otro entre la memoria y el cómputo, intentan realizar algunas operaciones más cerca de donde ya están los datos.

Esto suena obvio. ¿Por qué llevar todas las compras al otro lado de la ciudad si puedes cocinar la cena donde ya están las compras?

Pero la implementación es difícil. La fabricación de memoria y la fabricación de lógica son diferentes.

Si bien las tecnologías de memoria futuras son prometedoras, es probable que el problema de la memoria de la IA se resuelva mediante muchas mejoras en todo el conjunto, no con una sola tecnología milagrosa.

Cern Basher - inline image

IA en el Espacio: La próxima frontera de la memoria

La IA basada en el espacio suena futurista, pero la lógica es sencilla. La IA necesita energía, cómputo, refrigeración, comunicaciones y memoria. El espacio puede eventualmente ofrecer ventajas en varias de esas áreas. La energía solar es abundante e ininterrumpida en órbita. El calor puede irradiarse al espacio. Los satélites pueden conectarse directamente a las redes de comunicaciones globales. Y SpaceX está reduciendo rápidamente el costo de poner satélites en órbita.

La memoria puede volverse aún más importante. Un sistema de IA basado en el espacio no sería simplemente un satélite tonto que retransmite señales. Podría procesar datos localmente, ejecutar inferencias, coordinar comunicaciones, analizar datos de observación de la Tierra, soportar robótica autónoma, gestionar el tráfico orbital y servir como parte de una capa global de cómputo de IA. Eso requiere memoria de alto rendimiento cerca del procesador.

Cern Basher - inline image

Para las empresas de memoria, esto podría crear una nueva capa de demanda. Los sistemas de IA orbital necesitarían memoria endurecida contra la radiación, memoria de bajo consumo, memoria de alto ancho de banda, almacenamiento no volátil y quizás arquitecturas de memoria especializadas diseñadas para entornos hostiles. Las limitaciones son diferentes a las de los centros de datos terrestres. El peso, la potencia, el diseño térmico, la confiabilidad y la resistencia a la radiación son factores importantes.

Una reflexión final... TERAFAB

Elon describió el proyecto como la integración de lógica, memoria, empaquetado, pruebas y procesos semiconductores relacionados bajo un mismo techo.

Terafab podría eventualmente convertirse en una amenaza competitiva a largo plazo para los proveedores externos de memoria si Elon logra internalizar parte de la producción de HBM o de memoria avanzada.

Elon no está construyendo Terafab porque la memoria no sea importante. Está construyendo Terafab porque la memoria puede ser una de las limitaciones críticas para la IA, la robótica, los vehículos autónomos y los centros de datos basados en el espacio.

Cern Basher - inline image
Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
Para creadores

Convierte tu Markdown en un artículo de 𝕏 impecable

Cuando publicas tus propios textos largos, dar formato en 𝕏 a imágenes, tablas y bloques de código es un fastidio. YouMind convierte un borrador completo en Markdown en un artículo de 𝕏 impecable y listo para publicar.

Prueba Markdown a 𝕏

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales