Ahorra un 50% en costos de Claude Fable 5: El marco 10-80-10

Cómo reducir el costo de tokens de Fable 5 en más del 50%

Claude Fable 5 es el mejor modelo de IA que he usado. Punto.

El problema es que es increíblemente caro.

En las primeras horas de prueba, casi agoto todo mi límite de uso, y ni siquiera estaba haciendo nada fuera de lo común.

Fable cuesta exactamente el doble que Opus 4.8, y como es tan inteligente, tiende a pensar de más, ejecutando bucles y quemando tokens de una manera que ningún modelo anterior de Claude había hecho.

Aprender a usar correctamente este nuevo modelo es más importante que nunca.

En esta guía, cubriré el sistema exacto 10-80-10 que he desarrollado para reducir significativamente mis costos de tokens de Fable, y estos consejos vienen directamente de los ingenieros de Anthropic.

Al final del artículo, he creado un documento que puedes cargar directamente en Fable y que resume todo mi marco de trabajo.

Este documento reducirá inmediatamente tu gasto de tokens.

Quédate hasta el final y te lo compartiré directamente.

Mi documento del marco de trabajo

I: Explicación del sistema 10-80-10

El sistema 10-80-10 es un marco de trabajo simple para usar Fable de manera eficiente solo donde realmente se necesita.

Este es exactamente el marco de trabajo que los propios ingenieros de Anthropic utilizan.

Así es como se desglosa:

El primer 10%: Planificación

Antes de abordar cualquier proyecto de IA, debes usar Fable para definir la estructura, el enfoque, los criterios de éxito y las restricciones.

Piensa en construir una casa. La parte más importante es definir la arquitectura y la planificación. De lo contrario, los constructores ejecutarán un plan deficiente.

Fable 5 es un excelente arquitecto; úsalo como tal.

El 80% intermedio: Ejecución

La mayoría de los tokens se queman en el ir y venir, la iteración, las correcciones menores y el trabajo pesado de completar las tareas.

Para la capa de ejecución de tus proyectos de IA, debes usar un modelo más económico, como Opus 4.8 para trabajos estándar o Haiku para tareas ligeras.

Obtienes el beneficio de la arquitectura de Fable sin pagar los precios de Fable por cada token de ejecución (que, de todos modos, es excesivo).

El último 10%: Revisión

Una vez que la ejecución está completa, vuelve a traer a Fable. Pídele que revise el resultado contra la arquitectura original.

¿El resultado coincide con el plan? ¿Hay vacíos? ¿Necesita algo una corrección antes de publicarse?

Esta revisión final es donde la inteligencia de Fable detecta lo que los modelos más baratos pasan por alto, y como está revisando un resultado terminado en lugar de generarlo desde cero, usa muchos menos tokens de los que habría usado si hubiera hecho toda la tarea por sí mismo.

Sistema 10-80-10

Este es todo el marco de trabajo 10-80-10 que te permite obtener todos los beneficios de Fable, sin las desventajas del costo de tokens.

Modelos como Opus 4.8 son igual de capaces para manejar la capa de ejecución, y este sistema evita la tendencia de Fable a querer que todo quede "perfecto" con múltiples bucles, investigación profunda, etc.

II: Explicación de los bucles

Haré un artículo detallado sobre esto, pero quiero cubrir brevemente /loop, ya que es la forma más poderosa de usar Fable 5 en este momento.

Lance Martin ( @RLanceMartin ), un ingeniero de Anthropic, publicó una guía sobre cómo diseñar bucles para modelos de clase Mythos.

Recomiendo encarecidamente leer este artículo, pero lo resumiré a continuación.

https://x.com/RLanceMartin/status/2064397389189071163

La forma antigua vs. la nueva forma de hacer prompting

La forma antigua de hacer prompting era así:

Tú haces el prompt → Claude responde → Tú revisas → Tú haces otro prompt → Repetir

En ese modelo, tú eres el bucle.

Verificas manualmente cada paso de verificación, cada corrección y cada seguimiento.

Los bucles automatizan todo este proceso y te eliminan como cuello de botella.

Con la ingeniería de bucles, le das un objetivo a Fable desde el principio, y luego este crea subagentes para trabajar hacia ese objetivo.

Diseñas el bucle → Fable crea subagentes verificadores → Los agentes se dan prompts a sí mismos para completar el objetivo

Ingeniería de prompts versus ingeniería de bucles

Explicación de /goal y /loop

Estos dos comandos son la implementación práctica de la ingeniería de bucles dentro de Claude Code.

/goal es el punto de partida.

ESTRUCTURA DEL PROMPT

/goal [tarea] hasta [estado final medible] sin [restricciones]

/loop lleva esto un paso más allá.

En lugar de una sola ejecución, /loop vuelve a ejecutar el prompt en un intervalo predeterminado.

/loop [tu prompt aquí] --interval 30m --expires 8h

/goal versus /loop

La combinación es extremadamente poderosa.

Usa /goal para definir la tarea una vez, y usa /loop para que se ejecute automáticamente en el horario que tenga sentido para el trabajo.

Uso práctico de la ingeniería de bucles para un gasto de tokens más económico

Aquí es donde el sistema 10-80-10 hace su magia.

Con el marco de trabajo 10-80-10, Fable maneja la planificación del 10% inicial diseñando el bucle; el modelo más económico maneja la ejecución del 80%; y Fable solo regresa cuando el bucle se cierra o cuando es necesario.

Incluso puedes usar GPT-5.5 en la capa de ejecución, lo que puede reducir el gasto de tokens en un 50% o más.

III: Consejos generales para ahorrar tokens

El sistema 10-80-10 y los bucles manejan la eficiencia a gran escala; estos son los ajustes más pequeños que también pueden marcar la diferencia.

Selección de esfuerzo

Empieza con esfuerzo medio, no con el máximo.

Fable en medio supera a Opus en extra alto. Solo sube si realmente estás teniendo problemas de calidad. Usar el máximo por defecto en todo es una de las formas más rápidas de quemar tu límite.

Algunas personas incluso reportan haber usado Fable con esfuerzo bajo y obtenido resultados increíbles.

Elimina skills e instrucciones antiguas

Los prompts creados para modelos anteriores a menudo funcionan peor en Fable.

Las instrucciones más cortas y limpias funcionan mejor y cuestan menos dentro de Fable (Fable resolverá las cosas por sí mismo de todos modos).

Dale a Fable el "por qué" de todo

Fable acierta a la primera con más frecuencia cuando entiende la intención detrás de la solicitud.

Menos correcciones y rondas de iteración también significan muchos menos tokens quemados.

Ten en cuenta que este modelo está diseñado para trabajo totalmente autónomo, y si no le das el "por qué" de las cosas, tiene que pensar más para determinar los siguientes pasos.

/usage

Monitorea tu uso activamente. Ejecuta /usage en Claude Code con regularidad. Una vez que Fable pase a pago por token el 7 de julio, esto se volverá esencial.

Escribí una guía completa de prompting para Fable 5 aquí; muchos de los consejos mencionados también reducirán tu gasto de tokens.

https://x.com/aiedge_/status/2065064961999847849

IV: Errores costosos con Fable

Estos son los dos errores que vale la pena mencionar específicamente porque son fáciles de pasar por alto y pueden ser costosos si no los solucionas.

Error 1: Ejecutar Fable accidentalmente cuando no quieres.

Cuando abres Claude Code o la aplicación de Claude, ahora se selecciona Fable por defecto.

Anthropic está incentivando activamente a las personas a probar el modelo en este momento.

Consejo simple: Revisa el selector de modelo antes de cada sesión. Ya me he sorprendido ejecutando Fable accidentalmente en chats normales.

Error 2: Sin límite de gasto

El 7 de julio, Fable dejará de estar en las suscripciones estándar.

Si quieres seguir usándolo más allá del límite de tu plan, tendrás que agregar una tarjeta de crédito y pagar por token.

La trampa es no tener un límite máximo en tu tarjeta de crédito.

Fable quema tokens rápidamente en ejecuciones autónomas y sesiones largas. Sin un límite, puedes acumular una factura significativa antes de darte cuenta de lo que pasó.

Puedes configurar tu gasto mensual en Configuración → Uso → Ajustar límite

Configurar gasto mensual

Cierre

Bueno, ahí lo tienes.

Todo mi marco de trabajo para reducir significativamente los costos de tokens de Fable.

Espero que hayas encontrado valioso este artículo.

Si fue así, asegúrate de seguirme a mí, @milesdeutscher y a @aiedge_ - cada semana publico guías prácticas de IA para mantenerte a la vanguardia en este espacio tan dinámico.

Como prometí, creé un documento que puedes enviar directamente a Fable para reducir el gasto de tokens lo antes posible.

Documento del sistema 10-80-10 vistazo previo

Para acceder al documento completo:

Regístrate en el boletín gratuito de AI Edge
Únete a mi comunidad gratuita de Instagram para que pueda enviártelo

Empieza aquí.👇

https://www.aiedgehq.co/

https://www.aiedgehq.co/

Gracias por leer si llegaste hasta aquí.💙

Cómo usar Claude Fable 5 sin quedar en bancarrota

Cómo reducir el costo de tokens de Fable 5 en más del 50%

I: Explicación del sistema 10-80-10

II: Explicación de los bucles

III: Consejos generales para ahorrar tokens

IV: Errores costosos con Fable

Cierre

Turn one viral article into a full content workflow

Artículos virales recientes

Guía de campo para Fable: Cómo encontrar tus incógnitas

Cómo construir un segundo cerebro con Fable 5

El capital privado subestima a la IA

Gracias por todo: Mi partida de Rakuten

Investigación de Harvard: La relación entre los ingresos y la asignación del tiempo: 5 preguntas para mejorar los resultados

Verdaderamente despreciable: Un ex informante expone el lado oscuro de la industria de seguros

Cómo usar Claude Fable 5 sin quedar en bancarrota

Cómo reducir el costo de tokens de Fable 5 en más del 50%

I: Explicación del sistema 10-80-10

II: Explicación de los bucles

III: Consejos generales para ahorrar tokens

IV: Errores costosos con Fable

Cierre

Turn one viral article into a full content workflow

Convierte tu Markdown en un artículo de 𝕏 impecable

Artículos virales recientes

Guía de campo para Fable: Cómo encontrar tus incógnitas

Cómo construir un segundo cerebro con Fable 5

El capital privado subestima a la IA

Gracias por todo: Mi partida de Rakuten

Investigación de Harvard: La relación entre los ingresos y la asignación del tiempo: 5 preguntas para mejorar los resultados

Verdaderamente despreciable: Un ex informante expone el lado oscuro de la industria de seguros