비용 부담 없이 Claude Fable 5 활용하는 방법

@milesdeutscher
영어2일 전 · 2026년 7월 02일
120K
178
29
18
319

TL;DR

Miles Deutscher가 Claude Fable 5 사용을 최적화하기 위한 10-80-10 프레임워크를 소개합니다. 이 방법은 계획 및 검토 단계에서 Claude Fable 5를 사용하고, 실행 단계는 더 저렴한 모델에 위임하는 전략입니다.

Fable 5 토큰 비용을 50% 이상 절감하는 방법

Claude Fable 5는 제가 사용해 본 AI 모델 중 최고입니다. 단언컨대요.

문제는 엄청나게 비싸다는 겁니다.

테스트를 시작한 지 처음 몇 시간 만에 사용 한도를 거의 다 써버렸는데, 특별히 과하게 사용한 것도 아니었습니다.

Fable은 Opus 4.8보다 정확히 두 배 비싼 가격이며, 너무 똑똑한 나머지 오히려 과도하게 생각하고 루프를 돌며 이전 Claude 모델과는 다른 방식으로 토큰을 소모합니다.

이 새로운 모델을 제대로 사용하는 방법을 배우는 것이 그 어느 때보다 중요해졌습니다.

이 가이드에서는 제가 Fable 토큰 비용을 크게 줄이기 위해 개발한 정확한 10-80-10 시스템을 다루겠습니다. 이 조언은 Anthropic 엔지니어들에게서 직접 얻은 것입니다.

이 글의 맨 마지막에는 제 프레임워크 전체를 요약한 문서를 만들어 Fable에 바로 넣을 수 있도록 준비했습니다.

이 문서는 즉시 토큰 소비를 줄여줄 것입니다.

끝까지 읽어주시면, 이 문서를 직접 공유해 드리겠습니다.

Miles Deutscher - inline image

제 프레임워크 \문서\

I: 10-80-10 시스템 설명

10-80-10 시스템은 Fable이 실제로 필요한 곳에만 효율적으로 사용하기 위한 간단한 프레임워크입니다.

이것은 Anthropic 엔지니어들이 직접 사용하는 정확한 프레임워크입니다.

구성은 다음과 같습니다:

첫 번째 10%: 계획

AI 프로젝트를 시작하기 전에 Fable을 사용하여 구조, 접근 방식, 성공 기준 및 제약 조건을 정의해야 합니다.

집을 짓는다고 생각해보세요. 가장 중요한 부분은 건축 설계와 계획을 제대로 세우는 것입니다. 그렇지 않으면 건축업자들이 형편없는 계획을 그대로 실행할 테니까요.

Fable 5는 훌륭한 건축가입니다. 그렇게 사용하세요.

중간 80%: 실행

대부분의 토큰은 작업을 실제로 완료하는 과정에서 발생하는 반복, 수정, 잡일, 그리고 왔다 갔다 하는 과정에서 소모됩니다.

AI 프로젝트의 실행 계층에는 Opus 4.8(표준 작업)이나 Haiku(가벼운 작업) 같은 더 저렴한 모델을 사용해야 합니다.

Fable의 설계 이점은 얻으면서 모든 실행 토큰에 Fable 가격을 지불할 필요가 없습니다(어차피 과잉입니다).

마지막 10%: 검토

실행이 완료되면 Fable을 다시 투입하세요. 원래 설계와 비교하여 결과물을 검토하게 하세요.

결과가 계획과 일치하나요? 누락된 부분은 없나요? 출시 전에 수정해야 할 사항이 있나요?

이 마지막 검토 단계에서 Fable의 지능이 저렴한 모델이 놓치는 부분을 잡아내며, 처음부터 생성하는 것이 아니라 완성된 결과물을 검토하기 때문에 전체 작업을 직접 수행했을 때보다 훨씬 적은 토큰을 사용합니다.

Miles Deutscher - inline image

10-80-10 시스템

이것이 Fable의 모든 이점을 토큰 비용 부담 없이 누릴 수 있게 해주는 10-80-10 프레임워크의 전부입니다.

Opus 4.8과 같은 모델은 실행 계층을 처리하는 데 충분히 능숙하며, 이 시스템은 Fable이 여러 루프, 심층 연구 등을 통해 모든 것을 "완벽"하게 만들려는 욕구를 방지합니다.

II: 루프 설명

이에 대한 심층 기사를 따로 작성할 예정이지만, 현재 Fable 5를 사용하는 가장 강력한 방법인 /loop에 대해 간략히 다루고자 합니다.

Anthropic 엔지니어인 Lance Martin( @RLanceMartin ) 님이 Mythos급 모델용 루프 설계에 대한 가이드를 게시했습니다.

이 글을 꼭 읽어보시길 강력히 추천하지만, 아래에 요약해 드리겠습니다.

https://x.com/RLanceMartin/status/2064397389189071163

프롬프팅의 기존 방식 vs 새로운 방식

기존 프롬프팅 방식은 다음과 같았습니다:

프롬프트 입력 → Claude 응답 → 사용자 검토 → 재프롬프트 → 반복

이 모델에서는 사용자가 바로 루프였습니다.

모든 검증 단계, 모든 수정, 모든 후속 작업을 수동으로 확인해야 했습니다.

루프는 이 전체 프로세스를 자동화하고 사용자를 병목 현상에서 제거합니다.

루프 엔지니어링을 사용하면 Fable에 목표를 미리 제시하고, Fable이 해당 목표를 위해 하위 에이전트를 실행합니다.

루프 설계 → Fable이 검증 하위 에이전트 실행 → 에이전트가 스스로 프롬프트하여 목표 완료

Miles Deutscher - inline image

프롬프트 엔지니어링 대 루프 엔지니어링

/goal 및 /loop 설명

이 두 명령어는 Claude Code 내에서 루프 엔지니어링을 실제로 구현한 것입니다.

/goal은 시작점입니다.

프롬프트 구조

/goal [작업] until [측정 가능한 최종 상태] without [제약 조건]

/loop는 여기서 한 단계 더 나아갑니다.

단일 실행 대신, /loop는 미리 정해진 간격으로 프롬프트를 재실행합니다.

/loop [프롬프트 입력] --interval 30m --expires 8h

Miles Deutscher - inline image

/goal 대 /loop

이 조합은 매우 강력합니다.

/goal을 사용하여 작업을 한 번 정의하고, /loop를 사용하여 작업에 적합한 일정에 따라 자동으로 실행되도록 하세요.

토큰 비용 절감을 위한 루프 엔지니어링 실용적 활용

이것이 바로 10-80-10 시스템의 진가가 발휘되는 부분입니다.

10-80-10 프레임워크를 사용하면 Fable이 처음 10% 계획 단계에서 루프를 설계하고, 저렴한 모델이 80% 실행을 처리하며, Fable은 루프가 종료되거나 필요할 때만 다시 투입됩니다.

실행 계층에 GPT-5.5를 사용할 수도 있으며, 이 경우 토큰 비용을 50% 이상 절감할 수 있습니다.

III: 일반적인 토큰 절약 팁

10-80-10 시스템과 루프가 큰 그림의 효율성을 담당한다면, 다음은 차이를 만들 수 있는 작은 조정 사항들입니다.

  1. 노력 수준 선택

최대가 아닌 중간 노력부터 시작하세요.

중간 노력의 Fable은 초고 노력의 Opus보다 뛰어납니다. 품질 문제가 실제로 발생할 때만 수준을 올리세요. 모든 작업에 기본적으로 최대를 선택하는 것은 한도를 소진하는 가장 빠른 방법 중 하나입니다.

일부 사용자는 낮은 노력의 Fable을 사용해도 놀라운 결과물을 얻었다고 보고하기도 합니다.

  1. 오래된 스킬 및 지침 삭제

이전 모델용으로 만들어진 프롬프트는 Fable에서 성능이 떨어지는 경우가 많습니다.

Fable에서는 더 짧고 깔끔한 지침이 더 잘 작동하고 비용도 적게 듭니다(Fable은 어차피 스스로 해결합니다).

  1. Fable에 모든 것의 '이유'를 알려주세요

Fable은 요청背后的 의도를 이해하면 처음부터 올바르게 처리하는 경우가 훨씬 많아집니다.

수정 및 반복 횟수가 줄어들면 소모되는 토큰도 훨씬 적어집니다.

이 모델은 완전 자율 작업을 위해 설계되었으며, 작업의 '이유'를 알려주지 않으면 다음 단계를 생각하기 위해 더 열심히 고민해야 한다는 점을 명심하세요.

  1. /usage

사용량을 적극적으로 모니터링하세요. Claude Code에서 정기적으로 /usage를 실행하세요. 7월 7일 Fable이 토큰당 과금으로 전환되면 이는 필수가 될 것입니다.

여기에서 Fable 5 프롬프팅에 대한 전체 가이드를 작성했습니다 - 여기 언급된 많은 팁이 토큰 소비를 줄이는 데도 도움이 될 것입니다

https://x.com/aiedge_/status/2065064961999847849

IV: 비용이 많이 드는 Fable 실수

다음은 놓치기 쉽고 해결하지 않으면 비용이 많이 들 수 있기 때문에 특별히 언급할 가치가 있는 두 가지 실수입니다.

실수 1: 의도치 않게 Fable을 실행하는 경우

Claude Code 또는 Claude 앱을 열면 이제 기본적으로 Fable로 설정됩니다.

Anthropic은 현재 사람들이 이 모델을 테스트하도록 적극적으로 유도하고 있습니다.

간단한 조언: 세션을 시작하기 전에 항상 모델 선택기를 확인하세요. 저도 이미 일반 채팅에서 실수로 Fable을 실행한 적이 있습니다.

실수 2: 지출 상한선 없음

7월 7일부터 Fable은 표준 구독에서 제외됩니다.

요금제 한도를 초과하여 계속 사용하려면 신용카드를 등록하고 토큰당 비용을 지불해야 합니다.

문제는 신용카드에 확실한 상한선이 없다는 것입니다.

Fable은 자율 실행 및 긴 세션에서 토큰을 빠르게 소모합니다. 한도가 없으면 상황을 인지하기도 전에 상당한 청구서가 쌓일 수 있습니다.

설정 → 사용량 → 한도 조정에서 월별 지출을 설정할 수 있습니다.

Miles Deutscher - inline image

월별 지출 설정

마무리

자, 여기까지입니다.

Fable 토큰 비용을 크게 줄이기 위한 제 전체 프레임워크였습니다.

이 글이 유용하셨기를 바랍니다.

도움이 되셨다면, 저 @milesdeutscher@aiedge_ 를 팔로우해 주세요 - 저는 매주 이 빠르게 변화하는 분야에서 앞서 나갈 수 있도록 실용적인 AI 가이드를 게시하고 있습니다.

약속드린 대로, 토큰 소비를 즉시 줄이기 위해 Fable에 직접 보낼 수 있는 문서를 만들었습니다.

Miles Deutscher - inline image

10-80-10 시스템 문서 \스니크 피크\

전체 문서에 접근하려면:

  1. 무료 AI Edge 뉴스레터에 가입하세요
  2. 제 무료 Instagram 커뮤니티에 가입하시면 보내드리겠습니다

여기에서 시작하세요.👇

https://www.aiedgehq.co/

Miles Deutscher - inline image

https://www.aiedgehq.co/

여기까지 읽어주셔서 감사합니다.💙

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
크리에이터를 위해

당신의 Markdown을 깔끔한 𝕏 글로

직접 쓴 장문을 올릴 때 이미지, 표, 코드 블록을 𝕏에 맞게 정리하는 일은 번거롭습니다. YouMind는 전체 Markdown 초안을 깔끔하고 바로 게시할 수 있는 𝕏 글로 바꿔 줍니다.

Markdown → 𝕏 사용해 보기

분석할 패턴 더 보기

최근 바이럴 아티클

더 많은 바이럴 아티클 보기