DER GÜNSTIGSTE KOSTET 249 € UND LÄUFT 7B-MODELLE DEN GANZEN TAG
Folge
@antisadh bevor du weiterliest. Es kommen diesen Monat noch 4 weitere Drops dieser Art. Verpasse das Folgen, verpasse das Geld.
Tomás ist 28, lebt in Porto und arbeitete als QA-Ingenieur bei einem Fintech-Unternehmen, bis er im März sein Bankkonto öffnete und sah, dass seine Karte bei -187 € stand. Er hatte 459 $ pro Monat für ChatGPT Pro, Claude Code Max, Cursor, GitHub Copilot und Gemini Advanced ausgegeben und die Gesamtsumme nicht bemerkt, bis seine Miete nicht abgebucht wurde.
Er kaufte noch am selben Abend eine gebrauchte RTX 3090 auf OLX für 680 €, kündigte alles bis auf ein ChatGPT Plus für 20 $, und vier Monate später hatte sich die Karte doppelt bezahlt gemacht. Jetzt vermietet sich dieselbe GPU auf Vast.ai, während er schläft, und spült zusätzlich 520 $ pro Monat auf sein Konto.
Er betreibt größere Modelle lokal, als Claude Code Max ihm jemals zur Verfügung stellte.
Das ist kein Nischen-Flex. Apple Stores hatten im ersten Quartal buchstäblich keine Mac Minis mehr auf Lager, weil Entwickler sie in Heim-KI-Server verwandelten. NVIDIA brachte ein Entwickler-Kit für 249 $ auf den Markt, das 7B-Modelle lokal ausführt. AMD's CEO persönlich signierte einen 1.700 $-Mini-PC, der größere Modelle ausführt als Claude Pro dir bietet. Der gesamte Abo-Stack, der 2024 noch sinnvoll war, ist Mitte 2026 zerbrochen, und fast niemand spricht klar darüber.
TEIL 1
DIE 5.508 $ PRO JAHR, DIE DIE MEISTEN ENTWICKLER NICHT BEMERKEN
Die meisten Leute addieren ihre KI-Ausgaben nicht. Die Abos sehen einzeln klein aus und verstecken sich in den monatlichen Kreditkartenabrechnungen.
Der Stack, den ein ernsthafter KI-Nutzer 2026 betreibt:
1Claude Code Max (20x) 200 $/Monat 2.400 $/Jahr2ChatGPT Pro 200 $/Monat 2.400 $/Jahr3Gemini Advanced 20 $/Monat 240 $/Jahr4GitHub Copilot 19 $/Monat 228 $/Jahr5Cursor Pro 20 $/Monat 240 $/Jahr67Gesamt für Vielnutzer 459 $/Monat 5.508 $/Jahr
5.508 $ pro Jahr. Für Software, die auf dem Computer eines anderen läuft, deine Daten an deren Server sendet und dich genau dann ausbremst, wenn du sie am meisten brauchst (Montagmorgen, Freitagabend, am Launchtag).
Jedes Gerät auf der Karte unten verwandelt diese wiederkehrende Rechnung in einen einmaligen Hardwarekauf plus 2 bis 9 $ pro Monat für Strom. Die Rechnung ist immer gleich, egal welche Stufe du wählst:
1Jahr 1: 5.508 $ gespart 249 bis 1.700 $ ausgegeben + 50 bis 200 $ Strom2Jahr 2: 11.016 $ gespart 100 $ Strom3Jahr 3: 16.524 $ gespart 100 $ Strom
Bis Jahr 3 hat sich selbst das teuerste Gerät auf der Karte 6- bis 10-mal amortisiert. Und das bevor du den Mieteinkommenspfad aus Teil 6 bedenkst.
TEIL 2
STUFE 1: JETSON ORIN NANO SUPER, 249 $, DER EINSTIEGSPUNKT
Jensen Huang kündigte dies zu einem Preis an, der keinen Sinn ergab: 249 $ für einen Computer mit einer dedizierten NVIDIA GPU, kleiner als ein Kartenspiel. Er wird von Amazon geliefert und kostet weniger als ein schönes Abendessen.
Was er ausführt: Llama 3.2 (3B), Mistral 7B, Gemma 2 (9B), DeepSeek R1 (1.5B), Qwen 2.5 (7B). Alle kostenlos, alle lokal, alle für immer. 7B-Modelle bewältigen etwa 80 % dessen, wofür Leute täglich ChatGPT Plus nutzen. Entwürfe, Zusammenfassungen, Code-Skripte, schnelle Fragen und Antworten.
Was er nicht bewältigt: komplexe mehrstufige Überlegungen, große Kontextfenster über 8K Token, alles, was die Intelligenz von Frontier-Modellen erfordert.
Technische Daten auf einen Blick: 8 GB einheitlicher Speicher, 67 TOPS KI-Leistung, 7 bis 25 W Stromverbrauch, etwa 2 $ pro Monat Stromkosten bei 24/7-Betrieb. Die Amortisation gegenüber einem einzigen 20 $-ChatGPT-Plus-Abo beträgt 13 Monate. Gegenüber Claude Code Max sind es 6 Wochen.
Dies ist das Gerät für jemanden, der 20 $/Monat für ChatGPT Plus bezahlt und einfach aufhören möchte.
TEIL 3
STUFE 2: MAC MINI M4, 599 $, DIE STANDARDWAHL
Apple Stores hatten Anfang 2026 keine Mac Minis mehr auf Lager, und das lag nicht an einem Produkt-Launch. Entwickler hatten herausgefunden, dass die einheitliche Speicherarchitektur im M4-Chip ihn zu einer der effizientesten KI-Inferenzmaschinen macht, die man zu jedem Preis kaufen kann.
Zwei Stufen sind wichtig:
1Mac Mini M4 599 $ 16 GB Speicher, läuft 8B-Modelle bequem2Mac Mini M4 Pro 1.399 $ 48 GB Speicher, läuft 70B-Modelle lokal
Das Basismodell für 599 $ läuft 8B-Parameter-Modelle bequem. Der M4 Pro für 1.399 $ mit 48 GB läuft Llama 3.3 70B, das dem GPT-4 auf Consumer-Hardware am nächsten kommt.
Der Grund, warum es so gut funktioniert: Auf einem normalen PC werden Daten ständig zwischen System-RAM und GPU-VRAM kopiert, was die Inferenzgeschwindigkeit beeinträchtigt. Auf Apple Silicon teilen sich CPU und GPU einen Speicherpool, sodass das Modell einmal geladen wird und beide Prozessoren von derselben Stelle lesen. Deshalb übertrifft ein 599 $-Mac Mini 1.500 $-Windows-KI-Maschinen in denselben Benchmarks.
Ein Entwickler dokumentierte den Wechsel auf XDA im April 2026, ersetzte Claude Pro durch ein Mac Mini M4-Setup und berichtete: „Die Produktivität ist kein bisschen gesunken." Die Amortisation gegenüber 200 $/Monat für Claude Code Max beträgt 3 Monate beim Basismodell, 7 Monate beim Pro.

TEIL 4
STUFE 3: GEBRAUCHTE RTX 3090, 700 $, DAS BESTE PREIS-LEISTUNGS-VERHÄLTNIS
Jede GPU, die in den letzten zwei Jahren veröffentlicht wurde, hat denselben Fehler für KI: nicht genug Speicher. Die RTX 5090 hat 32 GB und kostet 3.800 $. Die RTX 4090 hat 24 GB und kostet 2.000 $+. Die fünf Jahre alte RTX 3090, ebenfalls mit 24 GB, kostet gebraucht auf eBay 700 $.
Für lokale KI ist VRAM wichtiger als die Chip-Generation. Eine Karte von 2020 mit 24 GB schlägt eine Karte von 2024 mit 12 GB jedes Mal. Die RTX 3090 ist nicht nur billig, sie ist für diese spezielle Aufgabe sogar besser als ihre neueren, kleineren Geschwister.
Das Modell, das dies lohnenswert macht: Qwen 3.6 27B. Alibaba veröffentlichte es Anfang 2026 leise und die Benchmarks ließen das Internet durchdrehen.
1Benchmark Qwen 3.6 27B (kostenlos, lokal) Claude 4.5 Opus (200 $/Monat)2RealWorldQA (Vision) 84,1 77,03IFBench (Anweisungen) 76,5 58,04AIME 2026 (Mathe) 91,3 93,35MMLU (Wissen) 83,2% ~82%
Ein kostenloses, lokal ausführbares 27B-Modell, das Anthropics Flaggschiff bei Vision um 7 Punkte und bei Anweisungen um 18 Punkte schlägt. Dies ist das Gerät für jemanden, der bereits einen PC hat und nur eine Karte einbauen muss. Kaufe bei eBay-Verkäufern mit 98 %+ positiven Bewertungen, frage nach GPU-Z-Screenshots, um Speicherfehler zu prüfen, und vermeide Karten, die als „aus Mining-Rigs stammend" beschrieben werden.
Amortisation gegenüber Claude Code Max: 3,5 Monate. Danach ist die Karte reine Ersparnis, bis sie physisch stirbt, was bei einer 3090 normalerweise 5 bis 8 Jahre sind.
TEIL 5
STUFE 4: GMKtec EVO-X2, 1.700 $, FRONTIER-NIVEAU LOKAL
Auf der CES 2026 stand AMD-CEO Lisa Su auf der Bühne mit einer kleinen schwarzen Box hinter sich. Ein paar Monate später, auf dem AMD AI Developer Day in Shanghai, ging sie zu genau diesem Gerät und signierte es persönlich. Das Gerät ist der GMKtec EVO-X2.
Es ist der erste x86-Chip, der jemals gebaut wurde und ein Modell mit 200 Milliarden Parametern auf einem einzigen Siliziumstück ausführen kann. Bis zu 110 GB nutzbarer VRAM unter Linux, genug, um Qwen3-235B vollständig und flüssig auszuführen, plus DeepSeek-V3 und Llama 3.3 70B ohne Quantisierungstricks.
1Modell VRAM benötigt Ergebnis auf EVO-X22Qwen3-235B ~110 GB Läuft vollständig, flüssig3DeepSeek-V3 ~100 GB Läuft bequem4Llama 3.3 70B ~42 GB Schnell, viel Spielraum5Qwen 3.6 27B ~16 GB Sehr schnell, täglicher Begleiter
AMDs eigene Behauptung auf der CES: Der Chip übertraf eine NVIDIA RTX 5080 um mehr als das 3-fache bei DeepSeek R1-Inferenz. Ein Mini-PC in der Größe einer Brotdose, der eine 1.000 $+ diskrete Grafikkarte bei echten KI-Workloads schlägt.
Dies ist das Gerät für jemanden, dessen KI-Nutzung wirklich 70B- bis 235B-Modelle lokal benötigt, also die Leute, die 200 $/Monat für ChatGPT Pro und Claude Code Max zusammen bezahlen und die Rate-Limits bis Mittwoch aufbrauchen. Die Amortisation liegt bei etwa 9 bis 10 Monaten. Über drei Jahre spart das Gerät etwa 13.000 $ im Vergleich zu Abos.
TEIL 6
STUFE 5: DIE HARDWARE UMKEHREN, STATT ZU SPAREN, VERDIENEN
Dieselbe Hardware, die KI lokal ausführt, kann sich an andere Leute vermieten, die KI betreiben. Crypto-Miner haben das zuerst herausgefunden. Nachdem Ethereums Merge das GPU-Bitcoin-Mining beendet hatte, richteten sie ihre Rigs auf KI-Inferenz-Vermietungsplattformen aus und begannen, 1,5- bis 4-mal mehr pro Stunde zu verdienen als jemals beim Mining von Krypto.
1GPU Mining ($/Monat) KI-Vermietung ($/Monat) Unterschied2RTX 3090 40 bis 90 200 bis 400 4-5x3RTX 4090 80 bis 150 500 bis 1.000 5-7x4RTX 5090 120 bis 200 700 bis 1.400 5-7x5A100 80GB n/a 1.200 bis 2.500 n/a6H100 n/a 2.500 bis 5.000 n/a
Die Plattformen, die dies tun: Vast.ai, Clore.ai, io.net, RunPod, Akash, Salad. Sie nehmen 15 bis 25 % und zahlen den Rest in Dollar oder Stablecoins. Eine einzelne RTX 4090 auf einem Schreibtisch generiert 500 bis 1.000 $ pro Monat durch Vermietung. Eine kleine Farm von 8 Stück spült 4.000 bis 8.000 $ pro Monat aufs Konto, mit einem stabilen Cashflow, den Krypto nie geliefert hat.
Die Mining-Farmen, die früher auf TikTok allgegenwärtig waren, minen kein Bitcoin mehr, sie farmen KI-Token für ChatGPT, Claude und Gemini über Vermietungsplattformen. OpenAI und Anthropic kaufen diese Rechenleistung günstig von den Farmen und verkaufen sie dir für 200 $/Monat weiter.
Wenn du bereits eine 4090 besitzt oder das Budget hast, eine einzurichten, dreht dies die Rechnung komplett um. Statt 200 $/Monat zu sparen, verdienst du 400 bis 800 $/Monat pro Karte.

TEIL 7
EIN SOFTWARE-STACK, DER AUF JEDEM GERÄT OBEN LÄUFT
Unabhängig davon, für welches Gerät du dich entscheidest, der Software-Stack ist identisch. Dies ist eines der stärksten Zeichen dafür, dass lokale KI jetzt ausgereift ist. Nicht fünf konkurrierende Tools, sondern ein sauberer Stack, der überall funktioniert.
1Laufzeit: Ollama (kostenlos, Open Source)2Oberfläche: Open WebUI (privates ChatGPT in deinem Browser)3Code-Agent: Claude Code, gerichtet auf lokales Ollama4Modelle: Qwen 3.6 27B, DeepSeek R1, Llama 3.3 70B,5 Mistral 7B, Gemma 2 9B
Die Einrichtung ist auf jedem Gerät identisch. Installiere Ollama mit einem Befehl, ziehe das größte Modell, das dein RAM erlaubt, richte Claude Code auf localhost aus. Dieselben drei Bash-Zeilen funktionieren auf einem 249 $-Jetson und einem 1.700 $-EVO-X2:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen3.6:27b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude
Das war's. Claude Code spricht jetzt mit deinem lokalen Modell statt mit Anthropics Servern, verwendet dieselben Befehle, denselben Workflow, null API-Kosten, null Rate-Limits, null Daten, die dein Netzwerk verlassen.
TEIL 8
WER WAS KAUFEN SOLLTE: DER ENTSCHEIDUNGSBAUM
Das falsche Gerät ist das, das du kaufst, ohne zu wissen, warum. Ordne das Gerät deiner tatsächlichen KI-Nutzung zu:
1Wenn du 20 $/Monat für ChatGPT Plus zahlst → Jetson Orin Nano 249 $2Wenn du 200 $/Monat für KI-APIs ausgibst → Mac Mini M4 599 $3Wenn du ein intensiver Claude Code-Nutzer bist → Mac Mini M4 Pro 1.399 $4 oder RTX 3090 700 $5Wenn du 200B+-Modelle benötigst (Frontier-Arbeit) → GMKtec EVO-X2 1.700 $6Wenn du bereits einen Gaming-PC mit 4090 hast → Überspringe Mac, füge Karte hinzu7Wenn du VERDIENEN statt sparen willst → GPU-Vermietungsfarm-Setup8Wenn du maximales Preis-Leistungs-Verhältnis willst → Gebrauchte RTX 3090 in vorhandenem PC9Wenn du Null Einrichtung, einfach funktionieren willst → Mac Mini M410Wenn du juristische/medizinische Arbeit machst (Datenschutz) → Jedes Gerät funktioniert, alles lokal
Der hybride Pfad ist das, was die meisten Leute am Ende tatsächlich tun. Lokale Hardware erledigt 80 % der täglichen Aufgaben kostenlos. Ein einziges 20 $/Monat ChatGPT Plus oder Claude Pro Abo bleibt für die restlichen 20 %, die wirklich schwierigen Frontier-Level-Überlegungen, bei denen jeder Benchmark-Punkt zählt. Gesamtkosten pro Monat: 23 $ statt 459 $.
TEIL 9
ERGEBNISSE VON TOMÁS' ERSTEN 6 MONATEN
1Monat 1: -459 $ letzter Monat des vollen Abo-Stacks2Monat 2: -680 $ kaufte gebrauchte RTX 3090 auf OLX3Monat 3: +41 $ behielt nur ChatGPT Plus 20 $, sparte 439 $4Monat 4: +620 $ listete GPU auf Vast.ai, erste 580 $ Mieteinnahmen5Monat 5: +687 $ konstantes Vast-Einkommen6Monat 6: +720 $ gleiches Setup, ohne Zutun
Der Zinseszinseffekt: Im 6. Monat hat sich die GPU vollständig amortisiert, 459 $/Monat an Abos ersetzt und generiert zusätzlich 500 bis 700 $/Monat an Mieteinnahmen. Der Gesamtswing von Monat 1 zu Monat 6 beträgt 1.179 $/Monat zu seinen Gunsten, während dieselbe Hardware die ganze Arbeit erledigt.
Über 12 Monate beträgt der Unterschied 14.148 $ im Cashflow im Vergleich zum Verbleib im Abo-Stack. Über 3 Jahre sind es 42.000 $. Von einer einzigen gebrauchten Karte für 680 €.

TEIL 10
DAS ZEITFENSTER
Vor sechs Monaten wäre dieser Artikel nicht möglich gewesen. Modelle waren nicht klein genug. Hardware war nicht billig genug. Abos waren nicht teuer genug. Open Source war nicht glaubwürdig genug. Alle vier Dinge kippten gleichzeitig zwischen Ende 2025 und Mitte 2026.
Die Unternehmen, die KI in den letzten drei Jahren aufgebaut haben, gingen davon aus, dass sie immer ihre Rechenzentren brauchen würde. Diese Annahme ist zerbrochen. Eine 249 $-Box läuft 7B-Modelle. Ein 599 $-Mac Mini läuft 14B-Modelle. Eine gebrauchte 700 $-GPU läuft Modelle, die Claude bei Vision-Benchmarks schlagen. Ein 1.700 $-Mini-PC läuft 235 Milliarden Parameter lokal. Das Rechenzentrum ist ins Wohnzimmer eingezogen.
Du musst nicht die teuerste Option wählen. Du musst kein Entwickler sein, um eines davon zu nutzen. Die Einrichtung besteht aus drei Befehlen. Die Software ist kostenlos. Der Strom kostet weniger als ein Kaffee pro Monat.
Die Abos ergaben Sinn, als lokale Hardware nicht mithalten konnte. Die Hardware hat aufgeholt. Wähle deine Stufe und hör auf, für die Rechenleistung eines anderen zu bezahlen.
Dies war Teil 6 einer fortlaufenden Serie über KI-Einkommensströme und Kostensenkungen, über die niemand richtig spricht. Teil 7 erscheint nächste Woche und analysiert das GPU-Vermietungsfarm-Setup: 8 Karten, eine Wohnung, 4.000-8.000 $ pro Monat an passiver KI-Compute-Vermietung.
/Folge @antisadh , damit es am Tag der Veröffentlichung in deinem Feed landet/





