आपके घर में एक मशीन है जो अभी बेकार पड़ी है। एक लैपटॉप जिसका ढक्कन बंद है। शेल्फ पर एक Mac mini। डेस्क के नीचे एक पुराना गेमिंग PC जो Spotify के लिए चालू होता है और फिर बंद हो जाता है। यह बिजली खींचता है, जगह लेता है, और आपके जीवन में कुछ भी योगदान नहीं देता।
इस बीच आपका क्रेडिट कार्ड स्टेटमेंट AI सब्सक्रिप्शन पर $412 प्रति माह दिखाता है। Claude Max, ChatGPT Pro, Cursor, Perplexity, दो ट्रांसक्राइबर जिनके लिए आप भूल गए कि साइन अप किया था, एक "राइटिंग असिस्टेंट" जिसका आपने एक बार इस्तेमाल किया। $4,944 प्रति वर्ष उस कंप्यूट को किराए पर लेने के लिए जो आपके घर में चुपचाप पड़ी एक हार्डवेयर पर फिट बैठता है।
2026 में ये दो तथ्य टकराते हैं। बाजार की सबसे महंगी सब्सक्रिप्शन के पीछे के वही मॉडल अब उस हार्डवेयर पर चलते हैं जिसकी कीमत उस बिल के तीन महीने से भी कम है जिसे वे बदल रहे हैं। और मशीन सिर्फ मॉडल नहीं चलाती। यह आपके सोते समय चलती है, आपके द्वारा निर्धारित शेड्यूल पर, वह काम करती है जो आप खुद करने का कभी समय नहीं पाते।
यह वह लेख है जो हार्डवेयर चुनता है, मस्तिष्क चुनता है, और दिखाता है कि जब आप बटन दबाने वाले नहीं रहते तो बॉक्स वास्तव में क्या करता है।
बॉक्स चुनें
चार विकल्प जो खरीदने लायक हैं। दो छोटे खामोश कंप्यूटर हैं। दो कार्ड हैं जिन्हें आप अपने मौजूदा डेस्कटॉप में डाल सकते हैं।
खामोश रास्ता आसान है। Mac mini M4, $599, जहाँ अधिकांश लोग पहुँचते हैं। हर स्थानीय AI सेटअप अंततः यहाँ इशारा करता है एक डिज़ाइन विकल्प के कारण। सामान्य PC सिस्टम RAM और GPU VRAM के बीच डेटा कॉपी करते हैं और आप कार्ड में जो कुछ है उसी तक सीमित रहते हैं। Apple Silicon एक मेमोरी पूल साझा करता है। मॉडल एक बार लोड होता है। दोनों प्रोसेसर एक ही जगह से पढ़ते हैं। 16GB वाला $599 वर्जन 7-8B मॉडल को दोगुनी कीमत वाली Windows मशीनों से तेज चलाता है। 14B मॉडल के लिए 32GB पर जाएँ। 48GB के साथ $1,399 के M4 Pro पर जाएँ और आप सैंडविच के आकार की चीज़ पर Llama-क्लास 70B मॉडल चला रहे हैं। बिजली की खपत 8 से 25W, पंखा खामोश रहता है, बिजली का खर्च लगभग $4 प्रति माह। यह बॉक्स है अगर आप फिर कभी हार्डवेयर के बारे में नहीं सोचना चाहते।

Mac Studio M3 Ultra, $4,199 उसी विचार का बिना समझौता वाला संस्करण है। बेस कॉन्फिग 96GB यूनिफाइड मेमोरी, मैक्स आउट 192GB। इसके ऊपर आप सर्वर-रैक क्षेत्र में हैं जिसके छह आंकड़े जुड़े हैं। 192GB वर्तमान में मौजूद सबसे बड़े ओपन-वेट मॉडल को लोड करता है, पूरे आकार में, बिना किसी संपीड़न चाल के। बाजार की सबसे महंगी सब्सक्रिप्शन के समान वजन वर्ग। बिजली की अधिकतम खपत लगभग $14 प्रति माह, एक $200/माह सब्सक्रिप्शन के मुकाबले महीने 22 पर बराबर हो जाता है। मशीनें 7 से 10 साल चलती हैं। यह बॉक्स उस व्यक्ति के लिए है जो आज $400+ प्रति माह सब्सक्रिप्शन पर खर्च कर रहा है, या जिसका काम कानूनी रूप से उनके डिवाइस से बाहर नहीं जा सकता। वकील, डॉक्टर, स्रोतों की रक्षा करने वाले पत्रकार, वित्तीय विश्लेषक।

अगर आप अपने मौजूदा डेस्कटॉप का उपयोग करना पसंद करते हैं, तो दो कार्ड। Tesla M40 24GB, eBay पर $130 इस्तेमाल किया हुआ। NVIDIA द्वारा 2015 में $3,500 में जारी किया गया डेटासेंटर कार्ड। लंबे समय से सर्वर फार्म से सेवानिवृत्त, $150 से कम में सेकेंडरी मार्केट में आ रहा है। 24GB VRAM, बिल्कुल नए RTX 5090 के समान। 27B मॉडल चलाने के लिए पर्याप्त जो अधिकांश बेंचमार्क पर फ्रंटियर मॉडल के खिलाफ अपनी पकड़ बनाए रखता है। कमियाँ: कोई डिस्प्ले आउटपुट नहीं, इसलिए आप मॉनिटर के लिए अपना मुख्य GPU रखते हैं, कोई बिल्ट-इन पंखा नहीं, इसलिए 3D-प्रिंटेड श्राउड और Noctua के लिए $25 जोड़ें, $10 के लिए EPS से PCIe एडाप्टर चाहिए। कुल मिलाकर लगभग $165। एक Pro सब्सक्रिप्शन के मुकाबले दो हफ्तों में अपनी लागत वसूल कर लेता है।

इस्तेमाल किया हुआ RTX 3090, $700। स्थानीय AI के लिए, VRAM GPU पीढ़ी से अधिक मायने रखता है, और 3090 2026 में मौजूद प्रति VRAM मूल्य विजेता है। एक नए RTX 5090 में $3,800 पर 32GB है। इस्तेमाल किए गए 4090 में $2,000 पर 24GB है। पाँच साल पुराने 3090 में 4090 के समान 24GB है और $650 से $750 में बिकता है। समान उपयोग योग्य मॉडल आकार, 70 से 80% गति, एक तिहाई कीमत। इसे मौजूदा गेमिंग PC में डालें, कुल लगभग $850, 25 से 30 टोकन प्रति सेकंड पर 27B मॉडल चलाता है। इस्तेमाल किए गए कार्ड खरीदने के दो नियम: 98%+ विक्रेता प्रतिक्रिया, और माइनिंग का उल्लेख करने वाली किसी भी चीज़ को छोड़ें। उच्च ताप संचालन मेमोरी चिप्स को मारता है। गेमिंग कम खींचता है।
एक साँस में चुनें:
1खामोश, बिना सेटअप, हमेशा काम करे चाहिए -> Mac mini M4, $5992$400+/माह सब्सक्रिप्शन या गोपनीयता-लॉक -> Mac Studio M3 Ultra, $4,1993डेस्कटॉप है, सबसे सस्ता विकल्प -> Tesla M40, $1304गेमिंग PC है, पैसे के लिए सबसे अच्छी गति -> इस्तेमाल किया हुआ RTX 3090, $700
आप जो भी चुनें, इंस्टॉल तीन कमांड है और वे हर स्तर पर समान हैं:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen2.5:32b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

मस्तिष्क चुनें
हार्डवेयर शरीर है। सोचने के लिए अभी भी एक दिमाग चाहिए, और सबसे अधिक पैसे बचाने वाली तरकीब एक से अधिक का उपयोग करना है।
Claude Sonnet हैवीवेट है। इसे उन कामों पर लगाएँ जिनमें वास्तविक तर्क-वितर्क की आवश्यकता है। 15 स्रोत खींचना और सबसे मजबूत दावों को एक-दूसरे के खिलाफ तौलना। यह तय करना कि आपके वॉल्ट में 400 नोट्स में से एक नया लेख किससे जुड़ता है। लगभग $3 प्रति मिलियन इनपुट टोकन। जटिल मल्टी-स्टेप सोच में अभी तक कोई स्थानीय चीज़ इसके पास नहीं आती।
Claude Haiku सस्ता हाथ है। टैगिंग। सत्यापन जाँच। यह तय करना कि आपकी सुबह की ब्रीफ में तीन विकल्पों में से कौन सा दिखाना है। लगभग Sonnet से 12x सस्ता। वह काम जिसकी लागत प्रति कॉल एक सेंट से भी कम है।
एक स्थानीय मॉडल, जो भी आपके बॉक्स के VRAM में फिट बैठता है, वह कार्यकर्ता है जो कभी डेटा बाहर नहीं भेजता। आपकी मशीन पर रहता है। ट्रांसक्रिप्शन, सारांश, कुछ भी जहाँ आप प्रति टोकन भुगतान नहीं करना चाहते और संवेदनशील सामग्री सर्वर को नहीं भेजना चाहते। बिजली के बाद मुफ्त।
वह नियम जो सबसे अधिक पैसे बचाता है: टैगिंग के लिए Sonnet न चलाएँ, सोचने के लिए Haiku न चलाएँ, निजी सामग्री बाहर न भेजें जब स्थानीय ठीक से संभाल ले। आपका बॉक्स आपको बर्नर मिलाने देता है। अंडा उबालने के लिए आप डीप फ्रायर नहीं चलाते।
यह आपके सोते समय क्या करता है
एक बॉक्स जो हमेशा चालू है, बर्बाद है अगर वह केवल एक चैट टैब को बदलता है। बात इसे आपके बिना काम करने देने की है। हर काम का एक ही चार-भाग का आकार होता है:
1ट्रिगर -> कुछ इसे शुरू करता है (शेड्यूल, नई फ़ाइल, वेबहुक)2करो -> काम होता है3सत्यापित करो -> परिणाम एक कठिन नियम के विरुद्ध जाँचा जाता है4दोहराओ -> जो विफल हुआ उसे ठीक करो, या पास होने पर रुक जाओ
पहले सप्ताहांत में स्थापित करने लायक तीन काम।
द्वारपाल। आपके इनबॉक्स पर नज़र रखता है। हर नए ईमेल को तीन ढेरों में बाँटा जाता है: उत्तर-आवश्यक, जानकारी के लिए, कचरा। पहले ढेर के लिए दो-पंक्ति का मसौदा उत्तर लिखा जाता है ताकि आपको केवल अनुमोदन करना पड़े। आप चार पूर्व-लिखित उत्तरों के साथ जागते हैं, तीन पर भेजें दबाते हैं, एक को संपादित करते हैं। सात मिनट में इनबॉक्स समाप्त।
मानचित्रकार। आपके नोट्स फ़ोल्डर में रहता है। आपके द्वारा सहेजा गया हर लेख, आपके द्वारा डाला गया हर YouTube लिंक, वहाँ पहुँचने वाला हर मीटिंग ट्रांसक्रिप्ट संसाधित होता है: 1-पंक्ति सारांश, तीन मुख्य दावे, सबसे मजबूत उद्धरण निकाला जाता है, और नया नोट उसी विषय पर मौजूदा नोट्स से जोड़ा जाता है। सत्यापन नियम: नोट में सभी चार भाग हैं और कम से कम एक विकी-लिंक मौजूदा नोट से है। फालतू सामग्री को "low signal" टैग किया जाता है और छोड़ दिया जाता है। दो महीने बाद आपका बाद-में-पढ़ूँ ढेर तर्कों और उद्धरणों के खोजने योग्य संग्रह में बदल जाता है, न कि टैब के कब्रिस्तान में।

प्रहरी। अधिकांश समय कुछ नहीं करता। यही काम है। आपके द्वारा बताई गई चीज़ों की एक सूची पर नज़र रखता है। Telegram चैनल में एक कीवर्ड। एक विशिष्ट नौकरी पोस्टिंग। Amazon पर एक कीमत। प्रहरी आपके फ़ोन पर तभी सूचना भेजता है जब कोई चीज़ वास्तव में आपके द्वारा निर्धारित सीमा से आगे बढ़ती है। Haiku पर चलता है। प्रति दिन एक सेंट से भी कम खर्च होता है।
तीन नियम जो उन कामों को अलग करते हैं जो टिकते हैं उन कामों से जो चुपचाप पैसे जलाते हैं: सत्यापन एक कठिन नियम होना चाहिए, न कि एक भावना। काम को याद रखना चाहिए कि उसने क्या प्रयास किया। काम को पता होना चाहिए कि कब हार माननी है। इनमें से किसी को भी छोड़ें और आप एक परिणाम के बजाय टोकन बिल के साथ जागते हैं।
गणित
1हार्डवेयर (एक बार) $130 से $4,1992बिजली $4 से $14 / माह3वैकल्पिक: एक सब्सक्रिप्शन रखें $20 / माह
पुराना सब्सक्रिप्शन स्टैक: $412/माह, $4,944/वर्ष।
सबसे सस्ते प्रवेश के साथ नया स्टैक: $130 हार्डवेयर + $96/वर्ष बिजली + $240/वर्ष एक रखी गई सब्सक्रिप्शन के लिए = पहले वर्ष में $466, उसके बाद हर वर्ष $336। यह पहले वर्ष में बिल पर 90% की छूट है, जिसमें बॉक्स भी शामिल है। Mac Studio भी एक $200/माह सब्सक्रिप्शन के मुकाबले महीने 22 पर बराबर हो जाता है, और उसके बाद यह पूरी बचत है जब तक यह चलता रहता है।
कुछ भी खरीदने से पहले एक बार आज़माएँ
आप अभी, किसी भी चैट में, केवल एक प्रॉम्प्ट के साथ, एक काम को महसूस कर सकते हैं:
1आप एक लूप में तब तक काम करेंगे जब तक कार्य मानक को पूरा न कर ले।23कार्य: [वर्णन करें कि आप वास्तव में क्या उत्पादित चाहते हैं]45सफलता मानदंड (सख्त, कोई नरम पास नहीं):6- [मानदंड 1]7- [मानदंड 2]8- [मानदंड 3]910लूप प्रोटोकॉल, हर बार दोहराएँ:111. योजना - अगला एक कदम बताएँ।122. करें - कार्य उत्पादित करें या सुधारें।133. सत्यापित करें - प्रत्येक मानदंड पर 1-10 स्कोर करें, बेहद ईमानदारी से।144. निर्णय लें - यदि हर स्कोर 8+ है, तो "FINAL" प्रिंट करें और रुक जाएँ।15 अन्यथा "ITERATING" प्रिंट करें और सबसे कमजोर बिंदु ठीक करें।1617इसे तब तक समाप्त न कहें जब तक हर मानदंड 8+ न हो।18मुझसे सवाल न पूछें। एक समझदार धारणा बनाएँ और जारी रखें।
यह ड्राफ्ट करता है, खुद को ग्रेड करता है, कमजोर बिंदु ढूंढता है, फिर से लिखता है, दोहराता है। यह एक काम है, एक पैराग्राफ के साथ बनाया गया। जो गायब है वह वह हिस्सा है जो मायने रखता है: आप अभी भी ट्रिगर हैं। टैब बंद करें और यह चला गया।
यदि आप एक सप्ताह में इस तरह की चीज़ तीन बार हाथ से चलाते हैं, तो इसने बॉक्स पर एक स्थायी स्थान अर्जित कर लिया है। यदि आप दो बार इस तक नहीं पहुँचते, तो कोई भी हार्डवेयर इसे नहीं बचा सकता।
इसे करने का क्रम
एक नियमित चैट में एक मैनुअल रन विश्वसनीय बनाएँ। इसे एक स्क्रिप्ट में बदलें। स्क्रिप्ट को एक वास्तविक सत्यापन गेट और एक वास्तविक रुकने की शर्त में लपेटें। तभी इसे एक शेड्यूल पर रखें। आगे बढ़ना ठीक वैसा है जैसे एक काम पूरी रात खराब इनपुट पर चलता है और आपके सोते समय चुपचाप आपको पैसे खर्च करता है।
मुद्दा
आपके घर का कंप्यूटर जो दिन में 23 घंटे कुछ नहीं करता, वह गलत मशीन था। यह बेकार था क्योंकि आप ही एकमात्र चीज़ थे जो इसे बताते थे कि क्या करना है। सही मशीन इंतज़ार नहीं करती। यह चलती है जब आप रात के खाने पर हों, जब आप सो रहे हों, जब आप एक मीटिंग में हों जिसका इससे कोई लेना-देना नहीं है। काम सुबह आपके फ़ोन पर दिखता है और आप तय करते हैं कि इसके साथ क्या करना है।
$130 GPU पर फिट होने वाले कंप्यूट को किराए पर लेना बंद करें। बॉक्स खरीदें। काम के दौरान सोएँ।
अगर आपको इस तरह के और विश्लेषण चाहिए, तो मैं हर कुछ दिनों में एक पोस्ट करता हूँ।
Telegram — https://t.me/GipArcAI





