Cómo usar prompts en Fable 5 de forma efectiva, directamente del equipo que lo creó

@cyrilXBT
INGLÉShace 2 días · 02 jul 2026
400K
397
48
12
1.3K

TL;DR

Esta guía desglosa las estrategias oficiales de Anthropic para Fable 5, centrándose en el manejo de tareas autónomas de alta latencia, la gestión de la proactividad del modelo y la implementación de sistemas de memoria persistente.

Fable 5 ya está disponible a nivel mundial a partir de hoy, 1 de julio de 2026.

Antes de que lo abras y ejecutes los mismos prompts que usabas en Opus 4.8, lee esto. Anthropic publicó una guía oficial de prompting específica para Fable 5, y lo más importante que dice es que la mayoría de los equipos subestiman el modelo al probarlo en las cosas equivocadas.

Fable 5 no es una versión más inteligente de la misma herramienta que has estado usando. Es una categoría diferente de herramienta que requiere una categoría diferente de prompt. Los equipos que obtienen los mejores resultados no son los que escriben mejores preguntas. Son los que le asignan problemas más difíciles, estructuran las ejecuciones largas de manera diferente y entienden qué cambios de comportamiento en Fable 5 requieren actualizaciones de prompts antes de que los flujos de trabajo existentes se rompan.

Este es el desglose completo de lo que realmente dice esa guía, con todo lo que necesitas para empezar a usar Fable 5 tal como Anthropic lo concibe.

Para qué sirve realmente Fable 5

El marco más claro en la guía oficial de Anthropic es este: Fable 5 aborda problemas que antes eran demasiado complejos, de larga duración o ambiguos para modelos anteriores. Es particularmente efectivo en trabajos de principio a fin que a una persona le llevan horas, días o semanas completar.

Esa frase hace más trabajo de lo que parece. Te está indicando dónde reside realmente la ventaja del modelo, y no está en respuestas rápidas de un solo turno a preguntas simples. Está en el trabajo sostenido, autónomo y de múltiples etapas que los modelos anteriores fragmentaban, alucinaban o simplemente dejaban de completar correctamente a mitad de camino.

La guía oficial es explícita: probar Fable 5 solo en cargas de trabajo más simples tiende a subestimar sus capacidades. Si tus prompts de evaluación son tareas cortas y bien definidas que ya completabas bien con Opus 4.8, verás una mejora marginal y concluirás que Fable 5 no vale el costo. Los equipos que reportan resultados genuinamente diferentes lo están aplicando a sus problemas no resueltos más difíciles, aquellos que antes requerían horas de iteración humana, múltiples sesiones de ida y vuelta, o se desmoronaban en la fase de ejecución.

En la práctica, esto significa que la primera pregunta que debes hacerte al evaluar Fable 5 no es "¿cómo funciona con mis prompts actuales?". Es "¿qué dejamos de intentar automatizar porque ningún modelo podía completarlo de manera confiable?". Esos flujos de trabajo abandonados son donde Fable 5 empieza a parecer un producto completamente diferente.

El mayor cambio de comportamiento: las respuestas tardan más

Lo primero que sorprende a los equipos que migran de Opus 4.8 a Fable 5 es la latencia de las respuestas. La guía de Anthropic menciona esto directamente como la fuente más común de confusión para los equipos que hacen el cambio.

Con un esfuerzo alto, una sola respuesta puede tardar minutos. En ejecuciones autónomas, puede llevar horas. Esto no es un error ni una señal de ineficiencia. Es el modelo haciendo el trabajo correctamente. Fable 5 planifica antes de actuar, verifica su propio trabajo, expande el contexto según sea necesario y no se apresura a producir una salida rápida que requiera que le hagas otro prompt inmediatamente para arreglar lo que salió mal.

La implicación práctica es que casi con toda seguridad necesitas actualizar tus ajustes de timeout si estás ejecutando Fable 5 a través de la API. Anthropic recomienda explícitamente revisar la estrategia de timeout como parte de cualquier migración desde Opus 4.8. Un timeout que tenía sentido para un modelo que producía una respuesta en diez segundos romperá los flujos de trabajo donde Fable 5 está correctamente dedicando tres minutos a planificar una tarea compleja de múltiples etapas.

El parámetro de esfuerzo controla cuán profundamente piensa Fable 5 antes de responder. Alto es el valor predeterminado y apropiado para la mayoría del trabajo exigente. xhigh es el máximo y se recomienda cuando la corrección en el primer intento importa más que la velocidad, ya que Fable 5 en xhigh reflexionará y validará su propio trabajo antes de responder. Medio y bajo están disponibles para subtareas rutinarias donde la capacidad completa es innecesaria y el costo importa.

El principio clave: el nivel de esfuerzo no es un dial de calidad que subes para obtener mejores respuestas. Es una compensación entre costo y latencia que calibras según lo que la tarea específica realmente requiere. Una migración de código base justifica xhigh. Una tarea simple de formato no.

Cómo controlar el esfuerzo en los prompts

Para tareas donde deseas un razonamiento máximo sin ejecutar un flujo de trabajo dinámico con agentes paralelos, puedes controlar el esfuerzo directamente en tu prompt.

Para profundidad de un solo turno, incluye "ultrathink" en tu prompt. Esto indica un esfuerzo de razonamiento xhigh para esa respuesta específica sin cambiar ninguna otra configuración de la sesión ni activar la orquestación del flujo de trabajo.

Para flujos de trabajo automáticos a nivel de sesión, establece /effort ultracode en Claude Code. Esto combina el razonamiento xhigh con la orquestación automática de flujo de trabajo dinámico para cada tarea sustancial en la sesión. Una nota importante que la documentación de Anthropic deja clara: ultracode requiere un modelo que admita esfuerzo xhigh. Eso actualmente significa Fable 5, Opus 4.8 y Opus 4.7. Sonnet 4.6 y modelos anteriores no lo admiten.

Para integraciones de API, usa el parámetro de esfuerzo directamente en la solicitud. La cadena de pensamiento en bruto nunca se devuelve para Fable 5 y Mythos 5. La configuración thinking.display controla lo que contienen los bloques de pensamiento: "summarized" devuelve un resumen legible, "omitted" es el valor predeterminado y devuelve campos de pensamiento vacíos.

El prompt de verificación de progreso

Esta es la técnica de prompt más útil en la guía oficial de Anthropic, y es específica para las largas ejecuciones autónomas de Fable 5.

El problema que resuelve: en tareas extendidas de múltiples pasos, Fable 5 a veces puede informar que un paso está completo cuando no se ha verificado contra los resultados reales de la ejecución. Este es el problema de "lo hice", y se vuelve más probable cuanto más larga y compleja es la tarea.

Las pruebas de Anthropic encontraron que una instrucción específica elimina casi por completo este problema, incluso en tareas diseñadas explícitamente para provocar informes de progreso fabricados. Añade esto a cualquier prompt de tarea autónoma larga:

"Antes de informar el progreso, audita cada afirmación contra un resultado de herramienta de esta sesión. Solo informa trabajo del que puedas señalar evidencia. Si algo aún no está verificado, dilo explícitamente. Informa los resultados fielmente: si las pruebas fallan, dilo con el resultado. Si se omitió un paso, indícalo. Cuando algo esté hecho y verificado, indícalo claramente sin rodeos."

Esta instrucción reestructura cómo Fable 5 trata sus propios informes de estado. En lugar de resumir lo que cree que sucedió, coteja cada afirmación con los resultados reales de la ejecución de la herramienta antes de informar. La palabra "auditar" está haciendo un trabajo específico aquí. Anthropic probó múltiples redacciones y encontró que el lenguaje de auditoría producía una autoverificación más confiable que equivalentes más suaves.

Para cualquier flujo de trabajo que dure más de unos minutos o que implique la ejecución de herramientas, esta instrucción pertenece a tu prompt del sistema, no solo a tu prompt de tarea.

El problema de la proactividad y cómo restringirla

Fable 5 es más proactivo que Opus 4.8. Notablemente más. En la práctica, esto significa que a veces tomará acciones no solicitadas cuando infiere que una acción sería útil, incluso si no se lo pediste explícitamente.

Los ejemplos que Anthropic da en la guía oficial: redactar un correo electrónico cuando no se solicitó ninguno, o crear una copia de seguridad de una rama de git defensiva antes de hacer cambios. Estos comportamientos no son errores desde la perspectiva de Fable 5. Son el modelo siendo genuinamente útil basándose en lo que infiere que probablemente quieres.

El problema es que las acciones no solicitadas en flujos de trabajo de producción, especialmente aquellas que tocan sistemas externos, correos electrónicos, git o archivos, pueden causar problemas reales. Un modelo que envía un correo electrónico a un cliente sin que se le pida o crea ramas inesperadas en un repositorio no es un modelo que puedas ejecutar sin supervisión sin barreras de protección explícitas.

La solución es sencilla, pero debe estar en cada prompt del sistema para cualquier flujo de trabajo automatizado o no supervisado:

"Cuando el usuario está describiendo un problema, haciendo una pregunta o pensando en voz alta en lugar de solicitar un cambio, el entregable es tu evaluación. Informa tus hallazgos y detente. No apliques una solución hasta que te lo pidan. Antes de ejecutar un comando que cambie el estado del sistema, incluidos reinicios, eliminaciones o ediciones de configuración, confirma que la evidencia realmente respalda esa acción específica."

Esta instrucción define explícitamente el límite entre observar y actuar, que Fable 5 necesita que se le indique claramente en lugar de inferir. La parte más importante de esta restricción es la segunda oración: informa los hallazgos y detente. Fable 5 necesita saber que una evaluación es un entregable completo, no un precursor de una acción inmediata.

El prompt del sistema de memoria

Fable 5 es particularmente poderoso cuando está equipado con un sistema de memoria persistente que acumula lecciones a través de las sesiones. La guía oficial recomienda una estructura específica para esto.

Cada lección obtiene su propio archivo Markdown con un resumen de una línea en la parte superior. El archivo registra lo que se aprendió, lo que se corrigió, qué enfoque se confirmó y por qué cada una de esas cosas fue importante. Fundamentalmente, solo registra lo que el repositorio o el historial del chat aún no registran. Los duplicados se fusionan en lugar de acumularse. Las notas que resultan ser incorrectas se eliminan, no solo se abandonan.

El prompt práctico para establecer esto al comienzo de un proyecto largo:

"Mantén un sistema de memoria en [carpeta]. Almacena una lección por archivo con un resumen de una línea en la parte superior. Registra tanto las correcciones como los enfoques confirmados, incluyendo por qué fueron importantes. No guardes información que ya esté en el repositorio o el historial del chat. Actualiza las notas existentes en lugar de crear duplicados. Elimina las notas que hayan demostrado ser incorrectas."

Al final de las sesiones de trabajo significativas, cierra con:

"Reflexiona sobre las sesiones que hemos tenido. Usa subagentes para identificar temas y lecciones centrales, y almacénalos en [carpeta]. Consulta [carpeta] al inicio de futuras sesiones."

Esto crea una base de conocimiento que sobrevive a los límites de las sesiones, que es el mecanismo real detrás de la capacidad de Fable 5 para mantener la coherencia en tareas de varios días. Sin él, cada sesión comienza desde cero. Con él, el modelo entra en cada sesión ya consciente de lo que se ha aprendido, qué enfoques se han validado y qué evitar.

La instrucción de respuesta final

Las ejecuciones autónomas largas producen un modo de fallo específico que la guía de Anthropic aborda directamente. Después del uso prolongado de herramientas y la ejecución de múltiples etapas, el modelo acumula atajos de contexto internos que hacen que su salida final sea difícil de analizar para cualquiera que no haya estado observando cada paso.

El problema se ve así: Fable 5 completa una migración compleja de múltiples etapas, luego resume el resultado utilizando abreviaturas internas, cadenas de flechas y taquigrafía que solo tienen sentido si seguiste cada salida del agente en tiempo real. El usuario, que simplemente quería saber si la migración fue exitosa y qué hacer a continuación, recibe un volcado técnico en lugar de una respuesta clara.

La solución es una restricción de respuesta final añadida a cualquier prompt de flujo de trabajo de larga duración:

"Para tu respuesta final después de esta tarea: indica el resultado primero, luego los detalles de apoyo clave. No incluyas abreviaturas de trabajo, etiquetas internas o cadenas de flechas en la salida dirigida al usuario. Los usuarios necesitan el resultado, la evidencia, los riesgos si los hay y el siguiente paso."

Esta instrucción no se trata de simplificar la salida. Se trata de separar el proceso de trabajo interno del modelo de la respuesta que el usuario final realmente recibe. El proceso de trabajo debe ser minucioso. La respuesta final debe ser clara.

El patrón de delegación de subagentes

Fable 5 puede generar y coordinar sus propios subagentes en tareas complejas, pero la guía oficial señala que necesita permiso explícito y una estructura de traspaso clara para hacerlo bien.

El patrón de delegación que produce los mejores resultados implica tres instrucciones que trabajan juntas. Primero, dile explícitamente a Fable 5 cuándo se le permite delegar versus cuándo debe manejar la tarea él mismo. Segundo, dale a cada subagente un alcance específico y acotado con criterios de éxito explícitos, en lugar de una instrucción vaga. Tercero, especifica qué debe hacer el agente coordinador mientras los subagentes están ejecutándose, ya que Fable 5 puede continuar trabajando en partes independientes de la misma tarea en lugar de esperar a que los subagentes informen.

Un patrón práctico para trabajos complejos de investigación o código base:

"Delega subtareas independientes a subagentes y continúa trabajando mientras se ejecutan. Cada subagente debe recibir un alcance específico y acotado y criterios de éxito explícitos. Sintetiza los resultados de los subagentes solo después de que todos hayan informado. Si algún subagente falla o no puede completar su alcance, informa eso claramente en la síntesis en lugar de inferir lo que se habría encontrado."

La línea más importante es la última. Fable 5 no debe llenar los resultados faltantes de los subagentes con inferencias. Si un subagente falla, ese fallo es información, y la síntesis final debe reflejarlo con precisión.

El clasificador de seguridad y la alternativa

Fable 5 incluye clasificadores de seguridad que se dirigen a técnicas ofensivas de ciberseguridad, contenido de biología y ciencias de la vida, y la extracción del pensamiento resumido del modelo. Cuando una solicitud activa estos clasificadores, la respuesta incluye stop_reason "refusal" como un HTTP 200, no un error.

Para las integraciones de API, esto significa que tu manejo de errores necesita verificar stop_reason por separado del estado HTTP. Una negativa es una llamada API exitosa con un tipo de respuesta específico, no un fallo. Anthropic proporciona middleware SDK para la alternativa automática a Opus 4.8 en caso de negativas, y los costos de caché de prompt en negativas donde no se generó salida están cubiertos.

La implicación práctica para la mayoría de los desarrolladores: según las pruebas de Anthropic, las negativas afectan a menos del cinco por ciento de las consultas típicas de desarrolladores, pero pueden aparecer en tareas benignas de biología o revisión de código que tocan dominios sensibles. Se recomienda probar tus flujos de trabajo específicos para el comportamiento de negativa antes de implementarlos en producción, especialmente si tu caso de uso involucra alguno de los dominios marcados.

Mythos 5 elimina los clasificadores de ciberseguridad mientras mantiene los de biología y química, y está disponible solo para los socios de Project Glasswing. Para todos los demás, el comportamiento de Fable 5 en tareas adyacentes a la ciberseguridad se redirigirá a Opus 4.8, que maneja la misma solicitud al precio de Opus en lugar del precio de Fable.

Prompting de visión en Fable 5

La capacidad de visión de Fable 5 está significativamente mejorada con respecto a Opus 4.8, y la guía oficial dedica orientación específica para usarla de manera efectiva.

El cambio principal: Fable 5 interpreta imágenes técnicas densas, aplicaciones web y capturas de pantalla detalladas con una precisión sustancialmente mayor, a menudo usando menos tokens de salida que Opus 4.8 en la misma tarea. También está entrenado para usar activamente herramientas bash y de recorte cuando una imagen cargada está volteada, borrosa o ruidosa, en lugar de intentar interpretar una entrada degradada directamente.

La implicación práctica para el prompting es que puedes pasarle a Fable 5 capturas de pantalla reales y sin procesar de aplicaciones en vivo sin preprocesarlas. Donde Opus 4.8 requería imágenes limpias y de alto contraste para extraer información útil, Fable 5 maneja entradas más desordenadas y sabe cuándo recortar o reprocesar antes de intentar leer el contenido.

Para flujos de trabajo de codificación específicamente, Fable 5 puede usar la visión para evaluar su propia salida. La guía señala que está entrenado para verificar el trabajo de codificación contra un diseño o objetivo original usando capturas de pantalla, lo que significa que puedes darle un mockup de diseño y una captura de pantalla en vivo de lo que construyó y pedirle que identifique las diferencias. Esto cierra un bucle que antes requería un revisor humano comparando la salida visual.

Un patrón de prompt práctico para trabajo de UI o frontend:

"Aquí está el objetivo de diseño y una captura de pantalla de la implementación actual. Usa la visión para identificar las diferencias y generar los cambios necesarios para cerrar la brecha. Recorta y amplía cualquier área donde la comparación no esté clara antes de informar los hallazgos."

Vale la pena incluir la instrucción explícita de recortar y ampliar porque desbloquea el comportamiento de la herramienta bash que maneja las entradas ruidosas. Sin ella, Fable 5 puede intentar interpretar un área pequeña o borrosa en lugar de preprocesarla.

La lista de verificación de migración

Si estás moviendo un flujo de trabajo existente de Opus 4.8 a Fable 5, la guía de Anthropic es explícita en que intercambiar nombres de modelos no es una migración completa. Las siguientes áreas necesitan revisión antes de tratar una integración de Fable 5 como lista para producción.

Timeouts. Cualquier timeout establecido para la velocidad de respuesta de Opus 4.8 es probablemente demasiado corto para Fable 5 con esfuerzo alto. Audita cada timeout en tu stack y extiéndelos antes de probar.

Manejo de negativas. Añade el manejo de stop_reason "refusal" a tu análisis de respuestas de la API. Esto es un HTTP 200 con una estructura de respuesta específica, no un error. Configura la alternativa a Opus 4.8 para cualquier dominio que pueda activar los clasificadores de seguridad.

Restricciones de proactividad. Añade la restricción explícita sobre acciones no solicitadas a cualquier prompt del sistema que se ejecutará en un contexto automatizado o no supervisado. No asumas que Fable 5 inferirá los mismos límites dentro de los que operaba Opus 4.8.

Verificación de progreso. Para cualquier flujo de trabajo que dure más de unos minutos o que implique la ejecución de herramientas, añade la instrucción de auditoría a tu prompt del sistema antes de la primera ejecución en producción.

Estructura de memoria. Si el flujo de trabajo se ejecutará en múltiples sesiones, configura la estructura de archivos de lecciones y añade el prompt de reflexión al final de la sesión antes de la primera ejecución larga.

Formato de respuesta final. Añade la restricción de respuesta que prioriza el resultado a cualquier flujo de trabajo que muestre la salida directamente a los usuarios finales o a sistemas posteriores que esperen texto limpio y estructurado.

Alcance de las pruebas. Antes de marcar la migración como completa, prueba el flujo de trabajo en al menos una tarea que fuera genuinamente difícil o imposible para Opus 4.8. Aquí es donde verás si Fable 5 está haciendo algo materialmente diferente o produciendo la misma calidad a un costo mayor.

La migración está completa cuando cada una de estas seis áreas ha sido abordada y tu flujo de trabajo más difícil se ejecuta limpiamente de principio a fin, sin intervención manual, en el primer intento.

Ese último criterio, la finalización en el primer intento de un trabajo difícil, es el verdadero punto de referencia para saber si valió la pena hacer una migración a Fable 5. Si tu flujo de trabajo más complejo ahora se completa en una sola ejecución autónoma lo que antes requería múltiples sesiones y varias rondas de corrección humana, el modelo está haciendo lo que fue construido para hacer.

La recomendación práctica de la guía oficial para los equipos nuevos en Fable 5 es comenzar con el trabajo que no has podido completar de manera confiable, no con el trabajo que ya has resuelto.

Elige una tarea que antes requería múltiples sesiones e intervención humana significativa entre ellas. Dale a Fable 5 el contexto completo, el objetivo completo y las restricciones de esta guía, incluyendo la instrucción de verificación de progreso, la restricción de proactividad y la instrucción de formato de respuesta final. Ejecútalo con esfuerzo xhigh. Revisa lo que produce.

La brecha entre esa experiencia y ejecutar el mismo prompt en Opus 4.8 es donde el valor real de Fable 5 se vuelve legible. Si ves una diferencia significativa allí, el modelo está haciendo lo que está diseñado para hacer. Si las tareas se sienten iguales, probablemente estás probando en la categoría donde ambos modelos se desempeñan de manera similar, que es la mayoría del trabajo rutinario, y deberías pasar a problemas más difíciles.

Fable 5 no es un reemplazo para Opus 4.8 en todos los casos de uso. Es un especialista para el subconjunto de trabajo donde la autonomía sostenida, la corrección en el primer intento en tareas complejas y la coherencia de contexto largo son las dimensiones que más importan.

Para todo lo demás, Opus 4.8 es más rápido, más barato y suficiente.

Sigue a @cyrilXBT para más información sobre cómo construir con Claude.

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
Para creadores

Convierte tu Markdown en un artículo de 𝕏 impecable

Cuando publicas tus propios textos largos, dar formato en 𝕏 a imágenes, tablas y bloques de código es un fastidio. YouMind convierte un borrador completo en Markdown en un artículo de 𝕏 impecable y listo para publicar.

Prueba Markdown a 𝕏

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales