Tienes una máquina en casa que ahora mismo está inactiva. Un portátil con la tapa cerrada. Un Mac mini en una estantería. Un viejo PC gaming debajo del escritorio que arranca para Spotify y se apaga de nuevo. Consume electricidad, ocupa espacio y no aporta nada a tu vida.
Mientras tanto, tu extracto bancario muestra 412 dólares al mes en suscripciones de IA. Claude Max, ChatGPT Pro, Cursor, Perplexity, dos transcriptores de los que olvidaste que te habías dado de alta, un "asistente de escritura" que usaste una vez. 4.944 dólares al año para alquilar potencia de cálculo que cabe en un solo dispositivo de hardware que está en silencio en tu casa.
En 2026, esos dos hechos chocan. Los mismos modelos que están detrás de las suscripciones más caras del mercado ahora funcionan en hardware que cuesta menos de tres meses de la factura que están reemplazando. Y la máquina no solo ejecuta el modelo. Funciona mientras duermes, con un horario que tú estableces, haciendo un trabajo que nunca tendrías tiempo de hacer tú mismo.
Este es el artículo que elige el hardware, elige el cerebro y te muestra lo que la caja realmente hace cuando dejas de ser tú quien aprieta los botones.
Elige la caja
Cuatro opciones que merecen la pena comprar. Dos son ordenadores pequeños y silenciosos. Dos son tarjetas que metes en un sobremesa que ya tienes.
La ruta silenciosa es más fácil. Mac mini M4, 599 $, es donde aterriza la mayoría de la gente. Toda configuración de IA local acaba apuntando aquí por una decisión de diseño. Los PC normales copian datos entre la RAM del sistema y la VRAM de la GPU y estás limitado por lo que tenga la tarjeta. Apple Silicon comparte un único grupo de memoria. El modelo se carga una vez. Ambos procesadores leen desde el mismo sitio. La versión de 599 $ con 16 GB ejecuta modelos de 7-8B más rápido que máquinas Windows que cuestan el doble. Sube a 32 GB para modelos de 14B. Sube al M4 Pro de 1.399 $ con 48 GB y estarás ejecutando modelos Llama de clase 70B en algo del tamaño de un sándwich. Consumo de 8 a 25 W, el ventilador permanece en silencio, electricidad alrededor de 4 $ al mes. Esta es la caja si no quieres volver a pensar en el hardware nunca más.

Mac Studio M3 Ultra, 4.199 $ es la versión sin concesiones de la misma idea. Configuración base de 96 GB de memoria unificada, máximo 192 GB. Por encima de esto estás en territorio de rack de servidores con seis cifras. 192 GB carga los modelos de peso abierto más grandes que existen actualmente, a tamaño completo, sin trucos de compresión. La misma clase de peso que las suscripciones más caras del mercado. Electricidad a tope alrededor de 14 $ al mes, punto de equilibrio frente a una sola suscripción de 200 $/mes en el mes 22. Las máquinas duran de 7 a 10 años. Esta es la caja para alguien que acumula suscripciones de más de 400 $ al mes hoy, o para alguien cuyo trabajo legalmente no puede salir de su dispositivo. Abogados, médicos, periodistas que protegen fuentes, analistas financieros.

Si prefieres usar un sobremesa que ya tienes, dos tarjetas. Tesla M40 24 GB, 130 $ de segunda mano en eBay. Una tarjeta de centro de datos que NVIDIA lanzó en 2015 por 3.500 $. Retirada desde hace tiempo de granjas de servidores, llegando al mercado de segunda mano por menos de 150 $. 24 GB de VRAM, lo mismo que una RTX 5090 nueva. Suficiente para ejecutar un modelo de 27B que se mantiene firme frente a modelos frontera en la mayoría de los benchmarks. Contras: no tiene salida de vídeo, así que mantienes tu GPU principal para el monitor; no tiene ventilador incorporado, así que añade 25 $ para una cubierta impresa en 3D y un Noctua; necesita un adaptador EPS a PCIe por 10 $. Total, alrededor de 165 $. Se amortiza en dos semanas frente a una sola suscripción Pro.

RTX 3090 usada, 700 $. Para IA local, la VRAM importa más que la generación de la GPU, y la 3090 es la ganadora en relación precio-VRAM que existe en 2026. Una RTX 5090 nueva tiene 32 GB por 3.800 $. Una 4090 usada tiene 24 GB por 2.000 $. Una 3090 de cinco años tiene los mismos 24 GB que la 4090 y se vende por 650 a 750 $. Mismo tamaño de modelo utilizable, 70 a 80 % de la velocidad, un tercio del precio. Móntala en un PC gaming existente, total alrededor de 850 $, ejecuta un modelo de 27B a 25 o 30 tokens por segundo. Dos reglas al comprar tarjetas usadas: feedback del vendedor del 98 % o más, y salta cualquier cosa que mencione minería. La operación a alta temperatura mata los chips de memoria. El gaming consume una.
Elige en una frase:
1quieres silencio, cero configuración, funciona para siempre -> Mac mini M4, 599 $2acumulas suscripciones de más de 400 $/mes o privacidad obligada -> Mac Studio M3 Ultra, 4.199 $3tienes un sobremesa, entrada más barata posible -> Tesla M40, 130 $4tienes un PC gaming, mejor velocidad por el dinero -> RTX 3090 usada, 700 $
Sea cual sea tu elección, la instalación son tres comandos y son idénticos en todos los niveles:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen2.5:32b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

Elige el cerebro
El hardware es el cuerpo. El pensamiento aún necesita una mente, y el truco que ahorra más dinero es usar más de una.
Claude Sonnet es el peso pesado. Apúntalo a trabajos que necesitan razonamiento real. Extraer 15 fuentes y sopesar las afirmaciones más sólidas entre sí. Decidir a cuál de las 400 notas de tu bóveda se conecta un nuevo artículo. Alrededor de 3 $ por millón de tokens de entrada. Nada local lo iguala aún en pensamiento complejo de múltiples pasos.
Claude Haiku es la mano barata. Etiquetado. Comprobaciones de cordura. Elegir cuál de tres opciones mostrar en tu resumen matutino. Aproximadamente 12 veces más barato que Sonnet. El tipo de trabajo que cuesta menos de un céntimo por llamada.
Un modelo local, el que quepa en la VRAM de tu caja, es el trabajador que nunca envía datos al exterior. Vive en tu máquina. Maneja transcripciones, resúmenes, cualquier cosa donde prefieras no pagar por token y no enviar contenido sensible a un servidor. Gratis después de la electricidad.
La regla que ahorra más dinero: no uses Sonnet para etiquetar, no uses Haiku para pensar, no envíes contenido privado al exterior cuando lo local lo maneja bien. Tu caja te permite mezclar fogones. No enciendes la freidora para hervir un huevo.
Lo que hace mientras duermes
Una caja que siempre está encendida se desperdicia si todo lo que hace es reemplazar una pestaña de chat. El objetivo es dejarla trabajar sin ti. Cada trabajo tiene la misma forma de cuatro partes:
1DISPARADOR -> algo lo inicia (horario, archivo nuevo, webhook)2HACER -> el trabajo se realiza3VERIFICAR -> resultado comprobado contra una regla estricta4ITERAR -> arreglar lo que falló, o parar si pasa
Tres trabajos que merece la pena configurar el primer fin de semana.
El guardián. Vigila tu bandeja de entrada. Cada nuevo correo se clasifica en tres montones: necesita-respuesta, para-información, basura. Se escribe un borrador de respuesta de dos líneas para el primer montón para que solo tengas que aprobarlo. Te despiertas con cuatro respuestas preescritas, pulsas enviar en tres, editas una. Bandeja de entrada resuelta en siete minutos.
El cartógrafo. Vive en tu carpeta de notas. Cada artículo que guardas, cada enlace de YouTube que dejas caer, cada transcripción de reunión que llega allí se procesa: resumen de 1 línea, tres afirmaciones principales, la cita más fuerte extraída, y la nueva nota se enlaza con notas existentes sobre el mismo tema. Regla de verificación: la nota tiene las cuatro piezas y al menos un enlace wiki a una nota existente. El relleno se etiqueta como "señal baja" y se salta. Después de dos meses, tu pila de "leer después" se convierte en un archivo buscable de argumentos y citas en lugar de un cementerio de pestañas.

El vigilante. No hace nada la mayor parte del tiempo. Ese es el trabajo. Vigila una lista de cosas que le dijiste que vigilara. Una palabra clave en un canal de Telegram. Una oferta de trabajo específica. Un precio en Amazon. El vigilante te notifica al móvil solo cuando algo realmente supera un umbral que estableciste. Funciona con Haiku. Cuesta menos de un céntimo al día.
Las tres reglas que separan los trabajos que sobreviven de los trabajos que silenciosamente queman dinero: la verificación tiene que ser una regla estricta, no una sensación. El trabajo tiene que recordar lo que intentó. El trabajo tiene que saber cuándo rendirse. Salta cualquiera de esas y te despiertas con una factura de tokens en lugar de un resultado.
Las cuentas
1Hardware (una vez) 130 $ a 4.199 $2Electricidad 4 $ a 14 $ / mes3Opcional: mantener UNA suscripción 20 $ / mes
Pila de suscripciones antigua: 412 $/mes, 4.944 $/año.
Nueva pila con la entrada más barata: 130 $ de hardware + 96 $/año de electricidad + 240 $/año por una suscripción mantenida = 466 $ en el primer año, 336 $ cada año siguiente. Eso es un 90 % de descuento en la factura, el primer año, incluida la caja. Incluso el Mac Studio alcanza el punto de equilibrio frente a una sola suscripción de 200 $/mes en el mes 22, y después de eso son ahorros puros durante la década que sigue funcionando.
Prueba uno antes de comprar nada
Puedes sentir un trabajo ahora mismo, en cualquier chat, con nada más que un prompt:
1Trabajarás en un bucle hasta que la tarea cumpla con el estándar.23TAREA: [describe exactamente lo que quieres que se produzca]45CRITERIOS DE ÉXITO (estrictos, sin aprobaciones blandas):6- [criterio 1]7- [criterio 2]8- [criterio 3]910PROTOCOLO DE BUCLE, repite cada turno:111. PLANIFICA - indica el único siguiente paso.122. HAZ - produce o mejora el trabajo.133. VERIFICA - puntúa del 1 al 10 en cada criterio, con total honestidad.144. DECIDE - si cada puntuación es 8+, imprime "FINAL" y para.15 Si no, imprime "ITERANDO" y arregla el punto más débil.1617Nunca lo des por terminado hasta que cada criterio sea 8+.18No me hagas preguntas. Toma una suposición sensata y continúa.
Redacta, se califica a sí mismo, encuentra el punto débil, reescribe, repite. Eso es un trabajo, construido con un párrafo. Lo que falta es la parte que importa: tú sigues siendo el disparador. Cierra la pestaña y desaparece.
Si ejecutas algo como esto manualmente tres veces en una semana, se ha ganado un lugar permanente en la caja. Si no recurres a ello dos veces, ningún hardware lo salva.
El orden para hacer esto
Consigue que una ejecución manual sea fiable en un chat normal. Conviértelo en un script. Envuelve el script en una puerta de verificación real y una condición de parada real. Solo entonces ponlo en un horario. Saltar pasos es exactamente cómo un trabajo se ejecuta toda la noche con una entrada incorrecta y silenciosamente te cuesta dinero mientras duermes.
El punto
El ordenador de tu casa que no hace nada 23 horas al día era la máquina equivocada. Estaba inactivo porque eras lo único que le decía qué hacer. La máquina correcta no espera. Funciona mientras estás cenando, mientras duermes, mientras estás en una reunión que no tiene nada que ver con ella. El trabajo aparece en tu móvil por la mañana y tú decides qué hacer con él.
Deja de alquilar potencia de cálculo que cabe en una GPU de 130 $. Compra la caja. Duerme mientras el trabajo se hace.
Si quieres más análisis como este, publico uno cada dos días.
Telegram — https://t.me/GipArcAI





