IL PIÙ ECONOMICO COSTA €249 E FA FUNZIONARE MODELLI 7B TUTTO IL GIORNO
segui
@antisadh prima di leggere. Altri 4 contenuti come questo in arrivo questo mese. Se non segui, perdi i soldi.
Tomás ha 28 anni, vive a Porto e lavorava come ingegnere QA in una fintech finché non ha aperto la sua app bancaria a marzo e ha visto la sua carta a -187€. Pagava 459€ al mese tra ChatGPT Pro, Claude Code Max, Cursor, GitHub Copilot e Gemini Advanced, e non si era accorto del totale finché l'affitto non è andato in rosso.
La stessa sera ha comprato una RTX 3090 usata su OLX per 680€, ha cancellato tutto tranne un ChatGPT Plus a 20€, e 4 mesi dopo la carta si era già ripagata due volte. Ora la stessa GPU si affitta su Vast.ai mentre dorme e genera altri 520€ netti al mese.
Esegue modelli più grandi in locale di quelli che Claude Code Max gli forniva.
Non è un flex di nicchia. Gli Apple Store hanno fisicamente esaurito i Mac Mini nel primo trimestre perché gli sviluppatori li stavano convertendo in server AI domestici. NVIDIA ha prezzato un kit per sviluppatori a €249 che esegue modelli 7B in locale. L'amministratore delegato di AMD ha firmato personalmente un mini PC da €1.700 che esegue modelli più grandi di quelli che ti dà Claude Pro. L'intero stack di abbonamenti che aveva senso nel 2024 è crollato a metà del 2026, e quasi nessuno ne parla chiaramente.
PARTE 1
I €5.508 ALL'ANNO CHE LA MAGGIOR PARTE DEGLI SVILUPPATORI NON SA DI PAGARE
La maggior parte delle persone non somma la propria spesa per l'AI. Gli abbonamenti sembrano piccoli singolarmente e si nascondono negli estratti conto mensili della carta.
Lo stack che un utente AI serio utilizza nel 2026:
1Claude Code Max (20x) €200/mese €2.400/anno2ChatGPT Pro €200/mese €2.400/anno3Gemini Advanced €20/mese €240/anno4GitHub Copilot €19/mese €228/anno5Cursor Pro €20/mese €240/anno67Totale per utenti pesanti €459/mese €5.508/anno
€5.508 all'anno. Per software che gira sul computer di qualcun altro, invia i tuoi dati ai loro server e ti limita la velocità proprio quando ne hai più bisogno (lunedì mattina, venerdì sera, il giorno del lancio).
Ogni dispositivo sulla mappa qui sotto trasforma quella bolletta ricorrente in un acquisto hardware una tantum più da €2 a €9 al mese di elettricità. Il calcolo è lo stesso indipendentemente dal livello che scegli:
1Anno 1: €5.508 risparmiati €249 a €1.700 spesi + €50 a €200 elettricità2Anno 2: €11.016 risparmiati €100 elettricità3Anno 3: €16.524 risparmiati €100 elettricità
Entro il terzo anno, anche il dispositivo più costoso sulla mappa si è ripagato da 6 a 10 volte. E questo prima di considerare il percorso del reddito da noleggio nella Parte 6.
PARTE 2
LIVELLO 1: JETSON ORIN NANO SUPER, €249, IL PUNTO DI INGRESSO
Jensen Huang lo ha annunciato a un prezzo che non aveva senso: €249 per un computer con una GPU NVIDIA dedicata più piccola di un mazzo di carte. Viene spedito da Amazon per meno di una bella cena.
Cosa esegue: Llama 3.2 (3B), Mistral 7B, Gemma 2 (9B), DeepSeek R1 (1.5B), Qwen 2.5 (7B). Tutti gratuiti, tutti locali, tutti per sempre. I modelli 7B gestiscono circa l'80% di ciò per cui le persone usano ChatGPT Plus quotidianamente. Bozze, riassunti, script di codifica, domande e risposte rapide.
Cosa non gestisce: ragionamenti complessi a più fasi, finestre di contesto grandi oltre 8K token, qualsiasi cosa richieda intelligenza di livello frontier.
Specifiche a colpo d'occhio: 8 GB di memoria unificata, 67 TOPS di prestazioni AI, consumo da 7 a 25 W, circa €2 al mese di elettricità in funzione 24/7. Il pareggio rispetto a un singolo abbonamento ChatGPT Plus da €20 è di 13 mesi. Il pareggio rispetto a Claude Code Max è di 6 settimane.
Questo è il dispositivo per chi paga €20/mese per ChatGPT Plus e vuole semplicemente smettere.
PARTE 3
LIVELLO 2: MAC MINI M4, €599, LA SCELTA PREDEFINITA
Gli Apple Store hanno esaurito i Mac Mini all'inizio del 2026, e non è stato a causa del lancio di un prodotto. Gli sviluppatori hanno capito che l'architettura di memoria unificata all'interno del chip M4 lo rende una delle macchine di inferenza AI più efficienti che si possano acquistare a qualsiasi prezzo.
Due livelli contano:
1Mac Mini M4 €599 16 GB di memoria, esegue modelli 8B comodamente2Mac Mini M4 Pro €1.399 48 GB di memoria, esegue modelli 70B in locale
Il modello base da €599 esegue modelli a 8 miliardi di parametri comodamente. L'M4 Pro da €1.399 con 48 GB esegue Llama 3.3 70B, che è la cosa più vicina a GPT-4 che si possa eseguire su hardware consumer oggi.
Il motivo per cui funziona così bene: su un PC normale, i dati vengono costantemente copiati tra la RAM di sistema e la VRAM della GPU, il che uccide la velocità di inferenza. Su Apple Silicon, CPU e GPU condividono un unico pool di memoria, quindi il modello viene caricato una volta ed entrambi i processori leggono dallo stesso posto. Ecco perché un Mac Mini da €599 supera macchine AI Windows da €1.500 negli stessi benchmark.
Uno sviluppatore ha documentato il passaggio su XDA nell'aprile 2026, sostituendo Claude Pro con una configurazione Mac Mini M4 e riferendo che "la produttività non è calata di un niente." Il pareggio rispetto a €200/mese di Claude Code Max è di 3 mesi per il modello base, 7 mesi per il Pro.

PARTE 4
LIVELLO 3: RTX 3090 USATA, €700, IL MIGLIOR RAPPORTO QUALITÀ-PREZZO
Ogni GPU rilasciata negli ultimi due anni ha lo stesso difetto per l'AI: memoria insufficiente. La RTX 5090 ha 32 GB e costa €3.800. La RTX 4090 ha 24 GB e costa €2.000+. La RTX 3090, vecchia di cinque anni, anch'essa con 24 GB, costa €700 usata su eBay.
Per l'AI locale, la VRAM conta più della generazione del chip. Una scheda del 2020 con 24 GB batte una scheda del 2024 con 12 GB ogni singola volta. La RTX 3090 non è solo economica, è attivamente migliore delle sue sorelle più piccole e recenti per questo specifico lavoro.
Il modello che rende tutto ciò utile: Qwen 3.6 27B. Alibaba lo ha rilasciato in silenzio all'inizio del 2026 e i benchmark hanno fatto il giro del mondo.
1Benchmark Qwen 3.6 27B (gratuito, locale) Claude 4.5 Opus (€200/mese)2RealWorldQA (visione) 84.1 77.03IFBench (istruzioni) 76.5 58.04AIME 2026 (matematica) 91.3 93.35MMLU (conoscenza) 83.2% ~82%
Un modello 27B gratuito eseguibile localmente che batte il modello di punta di Anthropic sulla visione di 7 punti e sulle istruzioni di 18. Questo è il dispositivo per chi ha già un PC e ha solo bisogno di inserire una scheda. Acquistate da venditori eBay con feedback al 98%+, chiedete screenshot di GPU-Z per verificare la presenza di errori di memoria ed evitate schede descritte come "provenienti da mining rig."
Il pareggio rispetto a Claude Code Max è di 3,5 mesi. Dopodiché la scheda è puro risparmio finché non muore fisicamente, cosa che per una 3090 è di solito da 5 a 8 anni.
PARTE 5
LIVELLO 4: GMKtec EVO-X2, €1.700, LIVELLO FRONTIER IN LOCALE
Al CES 2026, l'amministratore delegato di AMD, Lisa Su, era in piedi sul palco con una piccola scatola nera dietro di sé. Qualche mese dopo, all'AI Developer Day di AMD a Shanghai, si è avvicinata a quello stesso dispositivo e lo ha firmato personalmente. Il dispositivo è il GMKtec EVO-X2.
È il primo chip x86 mai costruito in grado di eseguire un modello da 200 miliardi di parametri su un singolo pezzo di silicio. Fino a 110 GB di VRAM utilizzabile su Linux, abbastanza per eseguire Qwen3-235B completamente e senza intoppi, oltre a DeepSeek-V3 e Llama 3.3 70B senza alcun trucco di quantizzazione.
1Modello VRAM necessaria Risultato su EVO-X22Qwen3-235B ~110 GB Funziona completamente, senza intoppi3DeepSeek-V3 ~100 GB Funziona comodamente4Llama 3.3 70B ~42 GB Veloce, ampio margine5Qwen 3.6 27B ~16 GB Molto veloce, uso quotidiano
L'affermazione di AMD al CES: il chip ha superato una NVIDIA RTX 5080 di oltre 3 volte nell'inferenza di DeepSeek R1. Un mini PC delle dimensioni di un portapranzo che batte una scheda grafica discreta da oltre €1.000 su carichi di lavoro AI reali.
Questo è il dispositivo per chi il cui utilizzo dell'AI necessita genuinamente di modelli da 70B a 235B eseguiti in locale, ovvero le persone che pagano €200/mese per ChatGPT Pro e Claude Code Max combinati e bruciano i limiti di velocità entro mercoledì. Il pareggio si raggiunge intorno ai 9-10 mesi. In tre anni, il dispositivo fa risparmiare circa €13.000 rispetto al rimanere sugli abbonamenti.
PARTE 6
LIVELLO 5: RIBALTA L'HARDWARE, GUADAGNA INVECE DI RISPARMIARE
Lo stesso hardware che esegue l'AI in locale può affittarsi ad altre persone che eseguono l'AI. I miner di criptovalute lo hanno capito per primi. Dopo che il merge di Ethereum ha ucciso il mining di Bitcoin su GPU, hanno puntato le loro piattaforme verso piattaforme di noleggio di inferenza AI e hanno iniziato a guadagnare da 1,5 a 4 volte in più all'ora di quanto abbiano mai fatto minando criptovalute.
1GPU Mining (€/mese) Noleggio AI (€/mese) Differenza2RTX 3090 €40 a 90 €200 a 400 4-5x3RTX 4090 €80 a 150 €500 a 1.000 5-7x4RTX 5090 €120 a 200 €700 a 1.400 5-7x5A100 80GB n/d €1.200 a 2.500 n/d6H100 n/d €2.500 a 5.000 n/d
Le piattaforme che fanno questo: Vast.ai, Clore.ai, io.net, RunPod, Akash, Salad. Trattengono dal 15 al 25% e pagano il resto in dollari o stablecoin. Una singola RTX 4090 su una scrivania genera da €500 a €1.000 al mese affittandosi. Una piccola fattoria di 8 di queste genera da €4.000 a €8.000 al mese con un flusso di cassa stabile che le criptovalute non hanno mai fornito.
Le fattorie di mining che un tempo erano ovunque su TikTok non minano più Bitcoin, stanno coltivando token AI per ChatGPT, Claude e Gemini attraverso piattaforme di noleggio. OpenAI e Anthropic acquistano silenziosamente quella potenza di calcolo a buon mercato dalle fattorie e te la rivendono a €200/mese.
Se possiedi già una 4090 o hai il budget per impostarne una, questo ribalta completamente il calcolo. Invece di risparmiare €200/mese, guadagni da €400 a €800/mese per scheda.

PARTE 7
UN UNICO STACK SOFTWARE CHE FUNZIONA SU OGNI DISPOSITIVO SOPRA
Indipendentemente dal dispositivo che scegli, lo stack software è identico. Questo è uno dei segnali più forti che l'AI locale è ora matura. Non cinque strumenti concorrenti, ma un unico stack pulito che funziona ovunque.
1Runtime: Ollama (gratuito, open source)2Interfaccia: Open WebUI (ChatGPT privato nel tuo browser)3Agente di codifica: Claude Code puntato su Ollama locale4Modelli: Qwen 3.6 27B, DeepSeek R1, Llama 3.3 70B,5 Mistral 7B, Gemma 2 9B
La configurazione è identica su ogni dispositivo. Installa Ollama con un comando, scarica il modello più grande che la tua RAM consente, punta Claude Code su localhost. Le stesse tre righe di bash funzionano su un Jetson da €249 e su un EVO-X2 da €1.700:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen3.6:27b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude
Questo è tutto. Claude Code ora parla con il tuo modello locale invece che con i server di Anthropic, usa gli stessi comandi, lo stesso flusso di lavoro, zero costi API, zero limiti di velocità, zero dati che lasciano la tua rete.
PARTE 8
CHI DOVREBBE COMPRARE COSA: L'ALBERO DECISIONALE
Il dispositivo sbagliato è quello che compri senza sapere perché. Abbina il dispositivo a come usi effettivamente l'AI:
1Se paghi €20/mese per ChatGPT Plus → Jetson Orin Nano €2492Se paghi €200/mese per API AI → Mac Mini M4 €5993Se sei un utente pesante di Claude Code → Mac Mini M4 Pro €1.3994 o RTX 3090 €7005Se hai bisogno di modelli 200B+ (lavoro frontier) → GMKtec EVO-X2 €1.7006Se hai già un PC gaming con 4090 → Salta Mac, aggiungi scheda7Se vuoi GUADAGNARE invece di risparmiare → Configurazione fattoria di noleggio GPU8Se vuoi il massimo valore per dollaro → RTX 3090 usata in PC esistente9Se vuoi zero configurazione, funziona e basta → Mac Mini M410Se fai lavoro legale/medico (privacy) → Qualsiasi dispositivo va bene, tutto locale
Il percorso ibrido è ciò che la maggior parte delle persone finisce effettivamente per fare. L'hardware locale gestisce l'80% delle attività quotidiane gratuitamente. Un singolo abbonamento ChatGPT Plus o Claude Pro da €20/mese rimane per il restante 20%, il ragionamento genuinamente difficile di livello frontier dove ogni punto di benchmark conta. Costo mensile totale: €23 invece di €459.
PARTE 9
RISULTATI DAI PRIMI 6 MESI DI TOMÁS
1Mese 1: -€459 ultimo mese dell'intero stack di abbonamenti2Mese 2: -€680 acquistata RTX 3090 usata su OLX3Mese 3: +€41 tenuto solo ChatGPT Plus €20, risparmiati €4394Mese 4: +€620 inserita GPU su Vast.ai, primo noleggio €5805Mese 5: +€687 reddito Vast costante6Mese 6: +€720 stessa configurazione, senza interventi
L'effetto composto: al sesto mese la GPU si è completamente ripagata, ha sostituito €459/mese in abbonamenti e genera ulteriori €500-700/mese in reddito da noleggio. Il saldo totale dal mese 1 al mese 6 è di €1.179/mese a suo favore con lo stesso hardware che fa tutto il lavoro.
In 12 mesi la differenza è di €14.148 nel flusso di cassa rispetto al rimanere sullo stack di abbonamenti. In 3 anni sono €42.000. Da una singola scheda usata da €680.

PARTE 10
LA FINESTRA
Sei mesi fa questo articolo non sarebbe stato possibile. I modelli non erano abbastanza piccoli. L'hardware non era abbastanza economico. Gli abbonamenti non erano abbastanza costosi. L'open source non era abbastanza credibile. Tutte e quattro le cose sono cambiate contemporaneamente tra la fine del 2025 e la metà del 2026.
Le aziende che hanno costruito l'AI negli ultimi tre anni presumevano che avrebbe sempre avuto bisogno dei loro data center. Quella presunzione è crollata. Una scatola da €249 esegue modelli 7B. Un Mac Mini da €599 esegue modelli 14B. Una GPU usata da €700 esegue modelli che battono Claude nei benchmark di visione. Un mini PC da €1.700 esegue 235 miliardi di parametri in locale. Il data center si è trasferito in soggiorno.
Non devi scegliere l'opzione più costosa. Non devi essere uno sviluppatore per usarne nessuno. La configurazione è di tre comandi. Il software è gratuito. L'elettricità costa meno di un caffè al mese.
Gli abbonamenti avevano senso quando l'hardware locale non riusciva a tenere il passo. L'hardware ha tenuto il passo. Scegli il tuo livello e smetti di pagare per la potenza di calcolo di qualcun altro.
Questa era la parte 6 di una serie in corso sui flussi di reddito AI e tagli ai costi di cui nessuno parla adeguatamente. La parte 7 uscirà la prossima settimana e analizzerà la configurazione della fattoria di noleggio GPU: 8 schede, un appartamento, €4.000-8.000 al mese in noleggio passivo di potenza di calcolo AI.
/Segui @antisadh così ti appare nel feed il giorno in cui esce/





