Cómo usar Claude Fable 5 sin arruinarse

@milesdeutscher
INGLÉShace 2 días · 02 jul 2026
120K
178
29
18
319

TL;DR

Miles Deutscher presenta el marco de trabajo 10-80-10 para optimizar el uso de Claude Fable 5, utilizándolo para la planificación y revisión mientras se delega la ejecución a modelos más económicos.

Cómo reducir el costo de tokens de Fable 5 en más del 50%

Claude Fable 5 es el mejor modelo de IA que he usado. Punto.

El problema es que es increíblemente caro.

En las primeras horas de probarlo, casi agoté todo mi límite de uso, y ni siquiera estaba haciendo nada descabellado.

Fable cuesta exactamente el doble que Opus 4.8, y como es tan inteligente, tiende a pensar demasiado, ejecutando bucles y quemando tokens como ningún modelo anterior de Claude lo ha hecho.

Aprender a usar este nuevo modelo correctamente es más importante que nunca.

En esta guía, cubriré exactamente el sistema 10-80-10 que he desarrollado para reducir significativamente mis costos de tokens de Fable, y este consejo viene directamente de los propios ingenieros de Anthropic.

Al final del artículo, he creado un documento que puedes cargar directamente en Fable y que resume todo mi marco de trabajo.

Este documento reducirá inmediatamente tu gasto de tokens.

Quédate hasta el final y lo compartiré contigo directamente.

Miles Deutscher - inline image

Mi documento del marco de trabajo

I: Explicación del sistema 10-80-10

El sistema 10-80-10 es un marco de trabajo simple para usar Fable de manera eficiente solo donde realmente se necesita.

Este es exactamente el marco de trabajo que los propios ingenieros de Anthropic utilizan.

Así es como se desglosa:

El primer 10%: Planificación

Antes de abordar cualquier proyecto de IA, debes usar Fable para definir la estructura, el enfoque, los criterios de éxito y las restricciones.

Piensa si fueras a construir una casa. La parte más importante es tener la arquitectura y la planificación correctas. De lo contrario, los constructores ejecutarán un plan pésimo.

Fable 5 es un excelente arquitecto; úsalo como tal.

El 80% intermedio: Ejecución

La mayoría de los tokens se queman en el ir y venir, la iteración, las correcciones menores, el trabajo pesado de completar las tareas.

Para la capa de ejecución de tus proyectos de IA, debes usar un modelo más barato, como Opus 4.8 para trabajo estándar o Haiku para tareas ligeras.

Obtienes el beneficio de la arquitectura de Fable sin pagar precios de Fable por cada token de ejecución (que, de todos modos, es excesivo).

El último 10%: Revisión

Una vez que la ejecución está completa, vuelve a traer a Fable. Haz que revise el resultado contra la arquitectura original.

¿Coincide el resultado con el plan? ¿Hay vacíos? ¿Algo necesita corrección antes de publicarse?

Esta pasada final es donde la inteligencia de Fable detecta lo que los modelos más baratos pasan por alto, y como está revisando un resultado terminado en lugar de generarlo desde cero, usa muchos menos tokens de los que habría usado si hubiera hecho toda la tarea por sí mismo.

Miles Deutscher - inline image

Sistema 10-80-10

Este es el marco de trabajo completo 10-80-10 que te permite obtener todos los beneficios de Fable, sin los inconvenientes del costo de tokens.

Modelos como Opus 4.8 son igualmente capaces de manejar la capa de ejecución, y este sistema evita la tendencia de Fable a querer que todo quede "perfecto" con múltiples bucles, investigación profunda, etc.

II: Explicación de los bucles

Haré un artículo detallado sobre esto, pero quiero cubrir brevemente /loop, ya que es la forma más poderosa de usar Fable 5 en este momento.

Lance Martin (@RLanceMartin), un ingeniero de Anthropic, publicó una guía sobre cómo diseñar bucles para modelos de clase Mythos.

Recomiendo encarecidamente leer este artículo, pero lo resumiré a continuación.

https://x.com/RLanceMartin/status/2064397389189071163

La forma antigua vs. la nueva forma de hacer prompting

La forma antigua de hacer prompting era así:

Tú das el prompt → Claude responde → Tú revisas → Tú das un nuevo prompt → Repetir

En ese modelo, tú eres el bucle.

Tú verificas manualmente cada paso de verificación, cada corrección y cada seguimiento.

Los bucles automatizan todo este proceso y te eliminan como cuello de botella.

Con la ingeniería de bucles, le das un objetivo a Fable desde el principio, y luego este crea subagentes para trabajar hacia ese objetivo.

Diseña el bucle → Fable crea subagentes verificadores → Los agentes se dan prompts a sí mismos para completar el objetivo

Miles Deutscher - inline image

Ingeniería de prompts versus ingeniería de bucles

/goal y /loop explicados

Estos dos comandos son la implementación práctica de la ingeniería de bucles dentro de Claude Code.

/goal es el punto de partida.

ESTRUCTURA DEL PROMPT

/goal [tarea] hasta [estado final medible] sin [restricciones]

/loop lleva esto un paso más allá.

En lugar de una sola ejecución, /loop vuelve a ejecutar el prompt en un intervalo predeterminado.

/loop [tu prompt aquí] --interval 30m --expires 8h

Miles Deutscher - inline image

/goal versus /loop

La combinación es extremadamente poderosa.

Usa /goal para definir la tarea una vez, y usa /loop para que se ejecute automáticamente en el horario que tenga sentido para el trabajo.

Uso práctico de la ingeniería de bucles para un gasto de tokens más barato

Aquí es donde el sistema 10-80-10 hace su magia.

Con el marco de trabajo 10-80-10, Fable maneja el 10% de planificación inicial diseñando el bucle; el modelo más barato maneja el 80% de ejecución; y Fable solo regresa cuando el bucle se cierra o cuando es necesario.

Incluso puedes usar GPT-5.5 en la capa de ejecución, lo que puede reducir el gasto de tokens en un 50% o más.

III: Consejos generales para ahorrar tokens

El sistema 10-80-10 y los bucles manejan la eficiencia a gran escala; estos son los ajustes más pequeños que también pueden marcar la diferencia.

  1. Selección de esfuerzo

Empieza con esfuerzo medio, no al máximo.

Fable en medio supera a Opus en extra alto. Solo sube si realmente estás teniendo problemas de calidad. Usar el máximo por defecto en todo es una de las formas más rápidas de quemar tu límite.

Algunas personas incluso reportan usar Fable con esfuerzo bajo y obtener resultados increíbles.

  1. Elimina habilidades e instrucciones antiguas

Los prompts creados para modelos anteriores a menudo rinden peor en Fable.

Las instrucciones más cortas y limpias funcionan mejor y cuestan menos dentro de Fable (Fable resolverá las cosas por sí mismo de todos modos).

  1. Dale a Fable el "por qué" de todo

Fable acierta a la primera con más frecuencia cuando entiende la intención detrás de la solicitud.

Menos correcciones y rondas de iteración también significan muchos menos tokens quemados.

Ten en cuenta que este modelo está diseñado para trabajo completamente autónomo, y si no le das el "por qué" de las cosas, tiene que pensar más para determinar los siguientes pasos.

  1. /usage

Monitorea tu uso activamente. Ejecuta /usage en Claude Code regularmente. Una vez que Fable pase a pago por token el 7 de julio, esto se volverá esencial.

Escribí una guía completa de prompting para Fable 5 aquí; muchos de los consejos mencionados aquí también reducirán tu gasto de tokens.

https://x.com/aiedge_/status/2065064961999847849

IV: Errores costosos de Fable

Estos son los dos errores que vale la pena mencionar específicamente porque son fáciles de pasar por alto y pueden ser costosos si no los solucionas.

Error 1: Usar Fable accidentalmente cuando no quieres.

Cuando abres Claude Code o la aplicación de Claude, ahora se selecciona Fable por defecto.

Anthropic está incentivando activamente a las personas a probar el modelo en este momento.

Consejo simple: Verifica el selector de modelo antes de cada sesión. Ya me he sorprendido usando Fable accidentalmente en chats normales.

Error 2: Sin límite de gasto

El 7 de julio, Fable dejará de estar en las suscripciones estándar.

Si quieres seguir usándolo más allá del límite de tu plan, necesitarás agregar una tarjeta de crédito y pagar por token.

La trampa es no tener un límite máximo en tu tarjeta de crédito.

Fable quema tokens rápidamente en ejecuciones autónomas y sesiones largas. Sin un límite, puedes acumular una factura significativa antes de darte cuenta de lo que pasó.

Puedes configurar tu gasto mensual en Configuración → Uso → Ajustar límite

Miles Deutscher - inline image

Configurar gasto mensual

Cierre

Bueno, ahí lo tienes.

Mi marco de trabajo completo para reducir significativamente los costos de tokens de Fable.

Espero que hayas encontrado valioso este artículo.

Si fue así, asegúrate de seguirme a mí @milesdeutscher y a @aiedge_ — cada semana publico guías prácticas de IA para mantenerte a la vanguardia en este loco espacio.

Como prometí, creé un documento que puedes enviar directamente a Fable para reducir el gasto de tokens lo antes posible.

Miles Deutscher - inline image

Documento del sistema 10-80-10 avance

Para acceder al documento completo:

  1. Regístrate gratis en el boletín AI Edge
  2. Únete a mi comunidad gratuita de Instagram para que pueda enviártelo

Empieza aquí.👇

https://www.aiedgehq.co/

Miles Deutscher - inline image

https://www.aiedgehq.co/

Gracias por leer si llegaste hasta aquí.💙

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
Para creadores

Convierte tu Markdown en un artículo de 𝕏 impecable

Cuando publicas tus propios textos largos, dar formato en 𝕏 a imágenes, tablas y bloques de código es un fastidio. YouMind convierte un borrador completo en Markdown en un artículo de 𝕏 impecable y listo para publicar.

Prueba Markdown a 𝕏

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales