Fable 5 está de vuelta a nivel mundial a partir de hoy, 1 de julio de 2026.
Antes de que lo abras y ejecutes los mismos prompts que usabas en Opus 4.8, lee esto. Anthropic publicó una guía oficial de prompting específica para Fable 5, y lo más importante que dice es que la mayoría de los equipos subestiman el modelo al probarlo en las cosas equivocadas.
Fable 5 no es una versión más inteligente de la misma herramienta que has estado usando. Es una categoría diferente de herramienta que requiere una categoría diferente de prompt. Los equipos que obtienen los mejores resultados no son los que escriben mejores preguntas. Son los que le asignan problemas más difíciles, estructuran las ejecuciones largas de manera diferente y entienden qué cambios de comportamiento en Fable 5 requieren actualizaciones de prompts antes de que los flujos de trabajo existentes se rompan.
Este es el desglose completo de lo que realmente dice esa guía, con todo lo que necesitas para empezar a usar Fable 5 como Anthropic lo concibe.
Para qué sirve realmente Fable 5
El marco más claro en la guía oficial de Anthropic es este: Fable 5 aborda problemas que antes eran demasiado complejos, largos o ambiguos para modelos anteriores. Es particularmente eficaz en trabajos de principio a fin que a una persona le llevan horas, días o semanas completar.
Esa frase hace más trabajo del que parece. Te está diciendo dónde reside realmente la ventaja del modelo, y no está en respuestas rápidas y únicas a preguntas simples. Está en el trabajo sostenido, autónomo y de múltiples etapas que los modelos anteriores fragmentaban, alucinaban o simplemente dejaban de completar correctamente a medio camino.
La guía oficial es explícita: probar Fable 5 solo en cargas de trabajo más simples tiende a subestimar sus capacidades. Si tus prompts de evaluación son tareas cortas y bien definidas que ya estabas completando bien con Opus 4.8, verás una mejora marginal y concluirás que Fable 5 no vale el costo. Los equipos que reportan resultados genuinamente diferentes lo están aplicando a sus problemas más difíciles no resueltos, aquellos que antes requerían horas de iteración humana, múltiples sesiones de ida y vuelta, o se desmoronaban en la fase de ejecución.
En la práctica, esto significa que la primera pregunta que debes hacerte al evaluar Fable 5 no es "¿cómo le va con mis prompts actuales?". Es "¿qué dejamos de intentar automatizar porque ningún modelo podía completarlo de manera confiable?". Esos flujos de trabajo abandonados son donde Fable 5 empieza a parecer un producto completamente diferente.
El mayor cambio de comportamiento: las respuestas tardan más
Lo primero que sorprende a los equipos que migran de Opus 4.8 a Fable 5 es la latencia de respuesta. La guía de Anthropic menciona esto directamente como la fuente más común de confusión para los equipos que hacen el cambio.
Con un esfuerzo alto, una sola respuesta puede tardar minutos. En ejecuciones autónomas, puede tardar horas. Esto no es un error ni una señal de ineficiencia. Es el modelo haciendo el trabajo correctamente. Fable 5 planifica antes de actuar, verifica su propio trabajo, expande el contexto según sea necesario y no se apresura a producir una salida rápida que requiera que le hagas otro prompt de inmediato para arreglar lo que salió mal.
La implicación práctica es que casi con toda seguridad necesitas actualizar tus configuraciones de tiempo de espera si estás ejecutando Fable 5 a través de la API. Anthropic recomienda explícitamente revisar la estrategia de tiempo de espera como parte de cualquier migración desde Opus 4.8. Un tiempo de espera que tenía sentido para un modelo que producía una respuesta en diez segundos romperá los flujos de trabajo donde Fable 5 está dedicando correctamente tres minutos a planificar una tarea compleja de múltiples etapas.
El parámetro de esfuerzo controla la profundidad con la que Fable 5 piensa antes de responder. Alto es el valor predeterminado y es apropiado para la mayoría de los trabajos exigentes. xhigh es el máximo y se recomienda cuando la corrección en el primer intento importa más que la velocidad, ya que Fable 5 en xhigh reflexionará y validará su propio trabajo antes de responder. Medio y Bajo están disponibles para subtareas rutinarias donde la capacidad completa es innecesaria y el costo importa.
El principio clave: el nivel de esfuerzo no es un dial de calidad que subes para obtener mejores respuestas. Es una compensación entre costo y latencia que calibras según lo que la tarea específica realmente requiere. Una migración de código base justifica xhigh. Una tarea simple de formato no.
Cómo controlar el esfuerzo en los prompts
Para tareas donde deseas el máximo razonamiento sin ejecutar un flujo de trabajo dinámico con agentes paralelos, puedes controlar el esfuerzo directamente en tu prompt.
Para profundidad en un solo turno, incluye "ultrathink" en tu prompt. Esto indica un esfuerzo de razonamiento xhigh para esa respuesta específica sin cambiar ninguna otra configuración de la sesión ni activar la orquestación del flujo de trabajo.
Para flujos de trabajo automáticos a nivel de sesión, establece /effort ultracode en Claude Code. Esto combina el razonamiento xhigh con la orquestación automática de flujos de trabajo dinámicos para cada tarea sustancial en la sesión. Una nota importante que la documentación de Anthropic deja clara: ultracode requiere un modelo que admita el esfuerzo xhigh. Eso actualmente significa Fable 5, Opus 4.8 y Opus 4.7. Sonnet 4.6 y modelos anteriores no lo admiten.
Para integraciones de API, usa el parámetro de esfuerzo directamente en la solicitud. La cadena de pensamiento sin procesar nunca se devuelve para Fable 5 y Mythos 5. La configuración thinking.display controla lo que contienen los bloques de pensamiento: "summarized" devuelve un resumen legible, "omitted" es el valor predeterminado y devuelve campos de pensamiento vacíos.
El prompt de verificación de progreso
Esta es la técnica de prompting más útil en la guía oficial de Anthropic, y es específica para las largas ejecuciones autónomas de Fable 5.
El problema que resuelve: en tareas extendidas de múltiples pasos, Fable 5 a veces puede informar que un paso está completo cuando no se ha verificado con los resultados de ejecución reales. Este es el problema de "lo hice", y se vuelve más probable cuanto más larga y compleja es la tarea.
Las pruebas de Anthropic encontraron que una instrucción específica casi elimina este problema incluso en tareas diseñadas explícitamente para provocar informes de progreso falsos. Añade esto a cualquier prompt de tarea autónoma larga:
"Antes de informar el progreso, audita cada afirmación contra un resultado de herramienta de esta sesión. Solo informa el trabajo del que puedas señalar evidencia. Si algo aún no está verificado, dilo explícitamente. Informa los resultados fielmente: si las pruebas fallan, dilo con el resultado. Si se omitió un paso, indícalo. Cuando algo esté hecho y verificado, indícalo claramente sin titubeos."
Esta instrucción reestructura la forma en que Fable 5 trata sus propios informes de estado. En lugar de resumir lo que cree que sucedió, coteja cada afirmación con los resultados reales de la ejecución de la herramienta antes de informar. La palabra "auditar" está haciendo un trabajo específico aquí. Anthropic probó múltiples redacciones y encontró que el lenguaje de auditoría producía una autoverificación más confiable que equivalentes más suaves.
Para cualquier flujo de trabajo que dure más de unos minutos o que implique la ejecución de herramientas, esta instrucción pertenece a tu prompt del sistema, no solo al prompt de la tarea.
El problema de la proactividad y cómo restringirlo
Fable 5 es más proactivo que Opus 4.8. Notablemente más. En la práctica, esto significa que a veces tomará acciones no solicitadas cuando infiere que una acción sería útil, incluso si no se lo pediste explícitamente.
Los ejemplos que Anthropic da en la guía oficial: redactar un correo electrónico cuando no se solicitó ninguno, o crear una rama de respaldo defensiva en git antes de hacer cambios. Estos comportamientos no son errores desde la perspectiva de Fable 5. Son el modelo siendo genuinamente útil basándose en lo que infiere que probablemente quieres.
El problema es que las acciones no solicitadas en flujos de trabajo de producción, especialmente aquellas que tocan sistemas externos, correos electrónicos, git o archivos, pueden causar problemas reales. Un modelo que envía un correo electrónico a un cliente sin que se le pida o crea ramas inesperadas en un repositorio no es un modelo que puedas ejecutar sin supervisión sin barreras de protección explícitas.
La solución es sencilla pero debe estar en cada prompt del sistema para cualquier flujo de trabajo automatizado o no supervisado:
"Cuando el usuario está describiendo un problema, haciendo una pregunta o pensando en voz alta en lugar de solicitar un cambio, el entregable es tu evaluación. Informa tus hallazgos y detente. No apliques una solución hasta que te lo pidan. Antes de ejecutar un comando que cambie el estado del sistema, incluyendo reinicios, eliminaciones o ediciones de configuración, confirma que la evidencia realmente respalda esa acción específica."
Esta instrucción define explícitamente el límite entre observar y actuar, que Fable 5 necesita que se le indique claramente en lugar de inferir. La parte más importante de esta restricción es la segunda oración: informa los hallazgos y detente. Fable 5 necesita saber que una evaluación es un entregable completo, no un precursor para una acción inmediata.
El prompt del sistema de memoria
Fable 5 es particularmente poderoso cuando está equipado con un sistema de memoria persistente que acumula lecciones a lo largo de las sesiones. La guía oficial recomienda una estructura específica para esto.
Cada lección obtiene su propio archivo Markdown con un resumen de una línea en la parte superior. El archivo registra lo que se aprendió, lo que se corrigió, qué enfoque se confirmó y por qué cada una de esas cosas fue importante. Fundamentalmente, solo registra lo que el repositorio o el historial del chat no registran ya. Los duplicados se fusionan en lugar de acumularse. Las notas que resultan ser incorrectas se eliminan, no solo se abandonan.
El prompt práctico para establecer esto al inicio de un proyecto largo:
"Mantén un sistema de memoria en [carpeta]. Almacena una lección por archivo con un resumen de una línea en la parte superior. Registra tanto las correcciones como los enfoques confirmados, incluyendo por qué fueron importantes. No guardes información que ya esté en el repositorio o en el historial del chat. Actualiza las notas existentes en lugar de crear duplicados. Elimina las notas que hayan demostrado ser incorrectas."
Al final de las sesiones de trabajo significativas, cierra con:
"Reflexiona sobre las sesiones que hemos tenido. Usa subagentes para identificar temas centrales y lecciones, y almacénalos en [carpeta]. Consulta [carpeta] al inicio de futuras sesiones."
Esto crea una base de conocimiento que sobrevive a los límites de las sesiones, que es el mecanismo real detrás de la capacidad de Fable 5 para mantener la coherencia en tareas de varios días. Sin ella, cada sesión comienza desde cero. Con ella, el modelo entra en cada sesión ya consciente de lo que se ha aprendido, qué enfoques se han validado y qué evitar.
La instrucción de respuesta final
Las ejecuciones autónomas largas producen un modo de fallo específico que la guía de Anthropic aborda directamente. Después del uso prolongado de herramientas y la ejecución de múltiples etapas, el modelo acumula atajos de contexto internos que hacen que su salida final sea difícil de analizar para cualquiera que no haya estado observando cada paso.
El problema se ve así: Fable 5 completa una migración compleja de múltiples etapas, luego resume el resultado usando abreviaturas internas, cadenas de flechas y taquigrafía que solo tienen sentido si seguiste cada salida del agente en tiempo real. El usuario, que simplemente quería saber si la migración fue exitosa y qué hacer a continuación, recibe un volcado técnico en lugar de una respuesta clara.
La solución es una restricción de respuesta final añadida a cualquier prompt de flujo de trabajo de larga duración:
"Para tu respuesta final después de esta tarea: indica primero el resultado, luego los detalles de apoyo clave. No incluyas abreviaturas de trabajo, etiquetas internas o cadenas de flechas en la salida dirigida al usuario. Los usuarios necesitan el resultado, la evidencia, los riesgos si los hay y el siguiente paso."
Esta instrucción no se trata de simplificar la salida. Se trata de separar el proceso de trabajo interno del modelo de la respuesta que el usuario final realmente recibe. El proceso de trabajo debe ser exhaustivo. La respuesta final debe ser limpia.
El patrón de delegación de subagentes
Fable 5 puede generar y coordinar sus propios subagentes en tareas complejas, pero la guía oficial señala que necesita permiso explícito y una estructura de traspaso clara para hacerlo bien.
El patrón de delegación que produce los mejores resultados implica tres instrucciones que trabajan juntas. Primero, dile explícitamente a Fable 5 cuándo se le permite delegar versus cuándo debe manejar la tarea él mismo. Segundo, dale a cada subagente un alcance específico y acotado con criterios de éxito explícitos, en lugar de una instrucción vaga. Tercero, especifica qué debe hacer el agente coordinador mientras los subagentes están ejecutándose, ya que Fable 5 puede continuar trabajando en partes independientes de la misma tarea en lugar de esperar a que los subagentes informen.
Un patrón práctico para trabajos complejos de investigación o código base:
"Delega subtareas independientes a subagentes y continúa trabajando mientras se ejecutan. Cada subagente debe recibir un alcance específico y acotado y criterios de éxito explícitos. Sintetiza los resultados de los subagentes solo después de que todos hayan informado. Si algún subagente falla o no puede completar su alcance, informa eso claramente en la síntesis en lugar de inferir lo que se habría encontrado."
La línea más importante es la última. Fable 5 no debe rellenar los resultados faltantes de los subagentes con inferencias. Si un subagente falla, ese fallo es información, y la síntesis final debe reflejarlo con precisión.
El clasificador de seguridad y la alternativa
Fable 5 incluye clasificadores de seguridad que se dirigen a técnicas ofensivas de ciberseguridad, contenido de biología y ciencias de la vida, y la extracción del pensamiento resumido del modelo. Cuando una solicitud activa estos clasificadores, la respuesta incluye stop_reason "refusal" como un HTTP 200, no un error.
Para las integraciones de API, esto significa que tu manejo de errores necesita verificar stop_reason por separado del estado HTTP. Una negativa es una llamada API exitosa con un tipo de respuesta específico, no un fallo. Anthropic proporciona middleware SDK para la alternativa automática a Opus 4.8 en caso de negativas, y los costos de caché de prompt en negativas donde no se generó salida están cubiertos.
La implicación práctica para la mayoría de los desarrolladores: las negativas afectan a menos del cinco por ciento de las consultas típicas de desarrolladores según las pruebas de Anthropic, pero pueden aparecer en tareas benignas de biología o revisión de código que tocan dominios sensibles. Se recomienda probar tus flujos de trabajo específicos para el comportamiento de negativa antes de implementarlos en producción, especialmente si tu caso de uso involucra alguno de los dominios marcados.
Mythos 5 elimina los clasificadores de ciberseguridad mientras mantiene los de biología y química, y está disponible solo para socios de Project Glasswing. Para todos los demás, el comportamiento de Fable 5 en tareas relacionadas con ciberseguridad se redirigirá a Opus 4.8, que maneja la misma solicitud al precio de Opus en lugar del precio de Fable.
Prompts de visión en Fable 5
La capacidad de visión de Fable 5 está significativamente mejorada con respecto a Opus 4.8, y la guía oficial dedica orientación específica para usarla de manera efectiva.
El cambio principal: Fable 5 interpreta imágenes técnicas densas, aplicaciones web y capturas de pantalla detalladas con una precisión sustancialmente mayor, a menudo usando menos tokens de salida que Opus 4.8 en la misma tarea. También está entrenado para usar activamente herramientas bash y de recorte cuando una imagen cargada está volteada, borrosa o con ruido, en lugar de intentar interpretar una entrada degradada directamente.
La implicación práctica para el prompting es que puedes pasarle a Fable 5 capturas de pantalla reales y sin procesar de aplicaciones en vivo sin preprocesarlas. Donde Opus 4.8 requería imágenes limpias y de alto contraste para extraer información útil, Fable 5 maneja entradas más desordenadas y sabe cuándo recortar o reprocesar antes de intentar leer el contenido.
Para flujos de trabajo de codificación específicamente, Fable 5 puede usar la visión para evaluar su propia salida. La guía señala que está entrenado para verificar el trabajo de codificación contra un diseño o objetivo original usando capturas de pantalla, lo que significa que puedes darle un mockup de diseño y una captura de pantalla en vivo de lo que construyó y pedirle que identifique las diferencias. Esto cierra un ciclo que antes requería un revisor humano comparando la salida visual.
Un patrón de prompt práctico para trabajo de UI o frontend:
"Aquí está el objetivo de diseño y una captura de pantalla de la implementación actual. Usa la visión para identificar las diferencias y generar los cambios necesarios para cerrar la brecha. Recorta y amplía cualquier área donde la comparación no esté clara antes de informar los hallazgos."
Vale la pena incluir la instrucción explícita de recortar y ampliar porque desbloquea el comportamiento de la herramienta bash que maneja entradas ruidosas. Sin ella, Fable 5 puede intentar interpretar un área pequeña o borrosa en lugar de preprocesarla.
La lista de verificación de migración
Si estás moviendo un flujo de trabajo existente de Opus 4.8 a Fable 5, la guía de Anthropic es explícita en que intercambiar nombres de modelo no es una migración completa. Las siguientes áreas necesitan revisión antes de tratar una integración de Fable 5 como lista para producción.
Tiempos de espera. Cualquier tiempo de espera establecido para la velocidad de respuesta de Opus 4.8 es probablemente demasiado corto para Fable 5 con esfuerzo alto. Audita cada tiempo de espera en tu pila y extiéndelos antes de probar.
Manejo de negativas. Añade el manejo de stop_reason "refusal" a tu análisis de respuesta de API. Esto es un HTTP 200 con una estructura de respuesta específica, no un error. Configura la alternativa a Opus 4.8 para cualquier dominio que pueda activar los clasificadores de seguridad.
Restricciones de proactividad. Añade la restricción explícita sobre acciones no solicitadas a cualquier prompt del sistema que se ejecutará en un contexto automatizado o no supervisado. No asumas que Fable 5 inferirá los mismos límites dentro de los cuales operaba Opus 4.8.
Verificación de progreso. Para cualquier flujo de trabajo que dure más de unos minutos o que implique la ejecución de herramientas, añade la instrucción de auditoría a tu prompt del sistema antes de la primera ejecución en producción.
Estructura de memoria. Si el flujo de trabajo se ejecutará en múltiples sesiones, configura la estructura de archivos de lecciones y añade el prompt de reflexión al cierre de la sesión antes de la primera ejecución larga.
Formato de respuesta final. Añade la restricción de respuesta con el resultado primero a cualquier flujo de trabajo que presente la salida directamente a los usuarios finales o a sistemas posteriores que esperen texto limpio y estructurado.
Alcance de las pruebas. Antes de marcar la migración como completa, prueba el flujo de trabajo en al menos una tarea que fuera genuinamente difícil o imposible para Opus 4.8. Aquí es donde verás si Fable 5 está haciendo algo materialmente diferente o produciendo la misma calidad a un costo mayor.
La migración está completa cuando cada una de estas seis áreas ha sido abordada y tu flujo de trabajo más difícil se ejecuta limpiamente de principio a fin, sin intervención manual, en el primer intento.
Ese último criterio, la finalización en el primer intento de un trabajo difícil, es el verdadero punto de referencia para saber si valió la pena hacer una migración a Fable 5. Si tu flujo de trabajo más complejo ahora completa en una sola ejecución autónoma lo que antes requería múltiples sesiones y varias rondas de corrección humana, el modelo está haciendo para lo que fue construido.
La recomendación práctica de la guía oficial para los equipos nuevos en Fable 5 es comenzar con el trabajo que no has podido completar de manera confiable, no con el trabajo que ya has resuelto.
Elige una tarea que antes requería múltiples sesiones e intervención humana significativa entre ellas. Dale a Fable 5 el contexto completo, el objetivo completo y las restricciones de esta guía, incluyendo la instrucción de verificación de progreso, la restricción de proactividad y la instrucción de formato de respuesta final. Ejecútala con esfuerzo xhigh. Revisa lo que produce.
La brecha entre esa experiencia y ejecutar el mismo prompt en Opus 4.8 es donde el valor real de Fable 5 se vuelve legible. Si ves una diferencia significativa allí, el modelo está haciendo lo que está diseñado para hacer. Si las tareas se sienten iguales, probablemente estás probando en la categoría donde ambos modelos se desempeñan de manera similar, que es la mayoría del trabajo rutinario, y deberías pasar a problemas más difíciles.
Fable 5 no es un reemplazo para Opus 4.8 en todos los casos de uso. Es un especialista para el subconjunto de trabajo donde la autonomía sostenida, la corrección en el primer intento en tareas complejas y la coherencia de contexto largo son las dimensiones que más importan.
Para todo lo demás, Opus 4.8 es más rápido, más barato y suficiente.
Sigue a @cyrilXBT para más contenido sobre cómo construir con Claude.





