Çok Modelli Konseyler ile Frontier Agent OS Nasıl İnşa Edilir

Size, Claude Code, Codex, OpenCode veya kullandığınız herhangi bir aracı kullanarak en iyi çıktıları tutarlı bir şekilde nasıl alacağınızı adım adım göstereceğim...

çünkü bir araç, yalnızca ajan talimatlarınızı yazdığınız uygulama, oturduğunuz kokpittir.

içgüdüsel olarak daha iyi bir modelin peşine düşersiniz (FABLE 5 KULLANARAK LOL)

asıl elde edebileceğiniz avantaj başka bir yerde, tek bir modelde durmuş olmanız gerçeğinde yatıyor.

ve zamanlama bu hatayı eskisinden daha pahalı hale getiriyor... çünkü en iyi tek model, güvenemeyeceğiniz hareketli bir hedef haline geldi:

Fable 5 yaklaşık bir haftalığına geri dönüyor ve sonra karşılanamayacak kadar pahalı hale gelecek
Mythos 5, hükümet tarafından onaylanmış kısa bir şirket listesine kilitlenmiş durumda
GPT-5.6 Sol, yaklaşık 20 onaylı firmaya gitti ve başka hiç kimseye gitmedi

bu yüzden tüm operasyonunuzu o ay "en iyi" olan modele yatırmak, model kısıtlandığı anda kaybetmeye devam ediyor.

bu yüzden hamle, sınır modellerinin bir birleşimi, işi tek bir model yerine bir avuç modelin birlikte yürütmesidir.

ortalama çıktıları en iyilerden ayıran şey budur ve şimdi her projede kurduğum ilk şeydir.

bu araçlardan en iyi şekilde nasıl yararlanacağınızı ve onlarla gerçek para kazanmayı öğrenmek istiyorsanız, gerçek zamanlı AI operasyonları topluluğu tam da bunun için kuruldu: weeklyaiops.com

yavaş, sefil gidiş-geliş

normal bir projenin nasıl ilerlediğini izleyin, darboğaz tam ortasında duruyor:

bir aracı açarsın ve görevi ona verirsin

sonra planını alır, ikinci bir modele yapıştırır ve "bu doğru mu" diye sorarsın

ikincisi boşlukları bulur, bu notları birinciye geri taşırsın

öğleden sonrayı bir haberci olarak, birbiriyle konuşamayan iki model arasında bağlam taşıyarak geçirirsin

dürüst olalım, bu gidiş-geliş tam bir eziyet...

bu döngüyü çok iyi biliyorum, Claude'un Codex'in planını kontrol etmesini sağlarsın, sonra boşlukları diğer tarafa taşırsın ve gün, iki model arasında notlar taşıyarak kaybolur.

neden bir AI birleşimi favori modelinizi yener

ikinci modelin ilkinin kaçırdığı şeyleri yakalamaya devam etmesinin bir nedeni var...

çalışmayı inceleyen model, onu yapan modelin kör noktalarını paylaşır, çünkü aynı yerlerde başarısız olurlar.

bu yüzden bir modelden kendini kontrol etmesini istemek, tam olarak yazacağı hatayla ilgili "bana iyi görünüyor" cevabını almanı sağlar.

bir konsey bunu yapısal olarak düzeltir, daha iyi bir komutla değil - çünkü farklı modeller birbirlerinin zayıf noktalarını kapatır.

ve bunun kanıtı gerçek makalelerle destekleniyor:

Sakana'daki bir araştırma ekibi, bir dizüstü bilgisayarda çalışacak kadar küçük, sorunuzu asla yanıtlamayan bir koordinatör modeli oluşturdu.

soruyu okur

her bir parçayı hangi büyük modelin ele alması gerektiğine karar verir

ve işi dağıtır

onu GPT-5, Gemini ve Claude'a yönelttiler ve tek başına üçünü de yendi...

sonra koordinasyonu yapması için en üst düzey bir modeli koymayı denediler ve daha kötü yaptı lol.

yani orkestra şefi sahip olduğunuz en güçlü model olmak zorunda değil, ancak sorunu okuyup, o kısım için en iyi olana yönlendirebilmelidir.

üç rol ve atlanan rol

koordinatör her modele aynı anda tek bir iş verir:

düşünür: görevi parçalara ayır, planı oluştur, içindeki boşlukları bul

işçi: işi yap, taslağı, kodu, sayıları, teslim edilecek olan her neyse onu hazırla

doğrulayıcı: sonucu değerlendir ve "yayınla" veya "bunu düzelt" de

doğrulayıcı atlanır ve en önemlisi de odur.

bir model bir şey ürettiğinde iş bitmez... bir doğrulayıcı onu onayladığında biter.

bu tek kural, net bir "bitti" koşulu, sonlanan bir döngü ile sonsuza kadar dönen bir döngü arasındaki tüm farktır.

gidiş-gelişi bir konseye devredin

şimdi bir koordinatör eklemek, yönetilmesi gereken bir katman daha gibi gelebilir.

ama aslında tam tersi, çıkardığınız katman sizdiniz.

yani hamle basit, koordinasyonu devredersiniz: haberci olmayı bırakır ve bir koordinatörün sizin için düşünür, işçi ve doğrulayıcı döngüsünü yönetmesine izin verirsiniz.

Bunun için artık Fugu kullanıyorum (sakana.ai/fugu) ve açık olmak gerekirse, bu sponsorlu değil, sadece çok seviyorum.

Bu araştırmanın ürünleştirilmiş hali, aracınızı diğer herhangi bir modele yönelttiğiniz gibi ona yönlendiriyorsunuz ve tek bir isteğin arkasındaki konseyi çalıştırıyor.

Ne olduğu konusunda dürüst olacağım çünkü bu önemli.

Henüz günlük, zaman alıyor çünkü sahte bir tane değil, gerçek bir konsey çalıştırıyor ve en güçlü olduğu yer doğrulayıcı olarak, yani yayınlamadan önce işi eleştiren olarak.

20$'a giriyorsunuz, Temmuz sonundan önce başlarsanız ücretsiz ikinci ayınız var.

Körü körüne güvenmiyorum, konsey modeline güveniyorum ve bu modeli gözetim olmadan çalıştırmanın bulduğum en kolay yolu.

Şimdi, HERHANGİ bir ajan aracıyla tutarlı bir şekilde en iyi çıktıları almak için adım adım iş akışına geçelim:

konseyi başlangıçta ve bitişte çalıştırın

Konseyi her projede iki anda devreye sokuyorum: en başında ve teslimat anında.

Gerçek bir iş düşünün, bir bülten başlatmak, bir potansiyel müşteri listesi oluşturmak, bir açılış sayfası yayınlamak.

1. önce mülakat yapın - herhangi bir iş yapılmadan önce, ajanınızın sizi derinlemesine sorgulamasını sağlayın (matt'ten "grill-me" becerisi, ajanın sizinle ilgili her şeyi sorgulamasını sağlayan bir beceridir), bu mülakatın derinliği sonraki her şeyin tavanını belirler

2. konseyi toplayın - planı oluşturmak için, koordinatör çok modelli kısmı halleder, böylece artık araçlar arasında kopyala yapıştır yapmazsınız

3. döngüleri tanımlayın - hedefi ve durma koşulunu önceden belirleyin, böylece her adımı izlemeden çalışabilir

4. role göre devredin - doğru görevi doğru yere gönderin ve alt ajanlardan yararlanın (alt ajan, ana ajanın iş devrettiği yardımcı bir ajandır)

5. teslimatta eleştirin - iş bittiğinde, yayınlanmadan önce parçalaması için konseye geri gönderin

Aynı döngü, iki uç, başlangıçta planlama ve bitişte eleştiri - tüm motor budur ve güvendiğim bir şeyi ne kadar hızlı teslim edebileceğimi derinden değiştirdi.

konsey motordur, kurulum onu keskin tutar

Bir motor ancak etrafındaki makine kadar iyidir...

işte konseydeki her ajanın en iyisini üretmesini sağlayan altı hamle, hiçbiri karmaşık değil.

1. kendi becerilerinizi oluşturun, bir kütüphane indirmeyin

Bir beceri, ajanınızın yeniden kullanabileceği kaydedilmiş bir talimat setidir, takip ettiği bir tarif gibidir (örnekler içeren bir markdown dosyasından başka bir şey değil...)

Cazibe, başkasının yayınladığı büyük bir beceri kütüphanesini alıp çalıştırmaktır.

Bunu geçerdim, kamuya açık becerilerin kabaca üçte biri bir güvenlik açığı taşır... daha kötüsü de olabilir lol.

Ve temiz olanları bile başka birinin bağlamıdır, sizin değil, bir beceri ancak kişisel olarak çözdüğü duvara tosladığınızda işe yarar.

Ondan önce, ajanın hafızasını dolduran gürültüden ibarettir.

Bu yüzden benim çağrım şu: gerçekten ihtiyacınız olan birkaçını, kendi başarısız denemelerinizden yola çıkarak oluşturun, asıl avantaj burada yatıyor.

2. varsayılan olarak MCP sunucuları değil, küçük CLI'lar kullanın

Önce iki kısa kelime, MCP, ajanınıza ekstra araçlar bağlamanın bir yoludur ve CLI, metin penceresinde çalıştırdığınız küçük bir komuttur.

Refleks, her şey için bir MCP bağlamaktır ve her biri, daha ilk sorunuzu sormadan önce tam talimat sayfasını ajanınızın hafızasına yükler.

Bu araç açıklamaları, önceden 100.000 kelimeden fazla hafıza tüketebilir ve gerçek işi engelleyebilir.

Bu yüzden günlük görevler için bunun yerine küçük bir CLI kullanın, daha hafiftir, ajan zaten bir komutun nasıl çalıştırılacağını bilir ve çıktısı hafızayı tıkamak yerine bir dosyaya düşer.

Printing-press adlı bir araç (printingpress.dev), tek bir komuttan herhangi bir hizmet için bunlardan birini yazacaktır... onu kullanın.

MCP'leri gerçekten ihtiyaç duyan işler için saklayın, paylaşılan girişler, çok sayıda kullanıcı, açık kalması gereken canlı bir bağlantı.

Kural CLI-önceliklidir, yalnızca CLI değil.

3. talimat dosyasını hafif tutun

Ajanınız her görevden önce bir talimat dosyası okur, genellikle AGENTS.md veya CLAUDE.md.

İçgüdü, aklınıza gelebilecek her şeyle doldurmaktır ve ajan daha azını takip eder, daha fazlasını değil.

Bir model, güvenilir bir şekilde yaklaşık 150 ila 200 talimatı takip eder, sonra onları yere düşürmeye başlar.

100 satırın altında tutun - bu şekilde çok daha iyi çalışır.

4. bağlamı temizleyin, hafızayı dosyalarda tutun

Bağlam penceresi, ajanınızın kısa süreli hafızasıdır ve doldukça aptallaşır.

Claude Opus 4.8 harika bir örnek... bu olağanüstü bir modeldir, ancak 300-400k token'a ulaştığınızda, bağlamı %100 temizlemelisiniz - SIKIŞTIRMA KULLANMAYIN.

Bu yüzden sık sık temizleyin ve önemli olan hafızayı dosyalarda tutun.

Ajanın oturum başında okuduğu ve sonunda güncellediği bir learnings.md, her seferinde, hiçbir şey değişmemiş gibi görünse bile.

Her commit'ten sonra bu notları güncellemesini sağlayın, commit, işin kaydedilmiş bir kontrol noktasıdır.

Kalıcı kurallar talimat dosyasında yaşar, yol boyunca öğrendiği şeyler learnings'te yaşar ve her çalıştırmadan sonra kural dosyanızı düzenliyorsanız, içine yanlış şeyleri koymuşsunuzdur.

Kendime /before-clear adlı bir beceri oluşturdum, projede bir kontrol noktası, ajanın önce okuduğu geçici bir dosya oluşturur... çok basit bir yapılacaklar listesi, önceki oturumda ne olduğuna dair kısa bir özet ve sıradaki en acil görev vardır.

Bir oturumdan diğerine nadiren önemli bir bağlam kaybederim.

5. az sayıda kural yazın, her biri net

Kısa bir net kural listesi, uzun bir zekice kural yığınından ÇOK daha iyidir.

Bir kural dosyası uzadığında, kurallar birbiriyle rekabet etmeye başlar ve ajan hangisinin kazandığını tahmin etmek zorunda kalır.

Her kuralı yeni bir işe alıma söyleyeceğiniz gibi yazın, tek satır, tek anlam, yoruma yer yok.

Kural net olduğunda ajan onu takip eder, belirsiz olduğunda ajan doğaçlama yapar ve doğaçlama, çıktılarınızın tam olarak yoldan çıktığı yerdir.

6. ağır işi alt ajanlara devredin

Dağınık, pahalı işi alt ajanlara, özellikle tarayıcıya dokunan her şeye itin.

Ana ajandan tarayıcıyı yönlendirmek, yalnızca ekran görüntüleriyle ÇOK fazla bağlam tüketebilir.

Aynı işi bir alt ajana verin ve "bitti, işte özet" ile bir veya iki satırda geri dönsün.

Ana ajan orkestra şefi olarak kalır, yardımcılar uzanmayı yapar ve ana hafızanız temiz kalır.

Bu yine konsey fikridir, bir seviye aşağıda, her şeyi kendiniz yapmak yerine işi koordine edersiniz.

tek blokta tüm işletim sistemi

en iyi model kısıtlanmaya devam ediyor, bu yüzden tek bir model temeliniz olamaz

koordinasyonu bir konseye devredin: düşünür planlar, işçi inşa eder, doğrulayıcı onaylar

doğrulayıcı durma koşuludur, iş o söylediğinde biter, daha önce değil

konseyi iki kez çalıştırın, başlangıçta planlamak ve teslimatta eleştirmek için

çalıştırmak için Fugu kullanıyorum, denemek için 20$, sponsorlu değil, erken aşamada olduğu konusunda dürüst

Sonra her ajanı keskin tutun:

kendi becerilerinizi oluşturun, bir kütüphane indirmeyin

CLI-öncelikli, MCP'leri yalnızca gerçekten ihtiyacınız olduğunda kullanın

talimat dosyası 100 satırın altında

bağlamı sık sık temizleyin, hafızayı dosyalarda tutun

az kural, her biri net

ağır işi alt ajanlara devredin

Bunun üzerindeki her şey, bir yazılım mühendisi değilseniz muhtemelen fark etmeyeceğiniz saf optimizasyondur.

Fable 5 olsun veya olmasın, performans gösteren bir işletim sistemini kendinize nasıl inşa edeceğiniz budur...

neyse, dünyanın en iyi AI topluluğunu kuruyorum, bana katılmaya ne dersiniz?

weeklyaiops.com

Frontier Agent OS Nasıl İnşa Edilir: Çok Modelli Konsey Stratejisi

yavaş, sefil gidiş-geliş

neden bir AI birleşimi favori modelinizi yener

üç rol ve atlanan rol

gidiş-gelişi bir konseye devredin

konseyi başlangıçta ve bitişte çalıştırın

konsey motordur, kurulum onu keskin tutar

1. kendi becerilerinizi oluşturun, bir kütüphane indirmeyin

2. varsayılan olarak MCP sunucuları değil, küçük CLI'lar kullanın

3. talimat dosyasını hafif tutun

4. bağlamı temizleyin, hafızayı dosyalarda tutun

5. az sayıda kural yazın, her biri net

6. ağır işi alt ajanlara devredin

tek blokta tüm işletim sistemi

Turn one viral article into a full content workflow

Son viral makaleler

Yapay Zeka, Tokenlaştırılmış Hisseler, Halka Arz Öncesi Vadeli İşlemler: Haziran @Coinbase

PorTAL: LLM'ler için Taşınabilir Görev Adaptörleri

Tesla Uygulaması 4.58.5 De-Compile

OpenWiki ile Tanışın: Repo dokümantasyonu için açık kaynaklı bir ajan

AAOI: Yapay Zeka Optik Alıcı-Vericilerinde Dikey Entegrasyon Hamlesi

Ethereum Institutional: Ethereum için kurumsal benimsemeyi hızlandırıyor.