I 5 migliori dispositivi hardware AI locali per sostituire gli abbonamenti

IL PIÙ ECONOMICO COSTA €249 E FA FUNZIONARE MODELLI 7B TUTTO IL GIORNO

segui
@antisadh prima di leggere. Altri 4 contenuti come questo in arrivo questo mese. Se non segui, perdi i soldi.

Tomás ha 28 anni, vive a Porto e lavorava come ingegnere QA in una fintech finché non ha aperto la sua app bancaria a marzo e ha visto la sua carta a -187€. Pagava 459€ al mese tra ChatGPT Pro, Claude Code Max, Cursor, GitHub Copilot e Gemini Advanced, e non si era accorto del totale finché l'affitto non è andato in rosso.

La stessa sera ha comprato una RTX 3090 usata su OLX per 680€, ha cancellato tutto tranne un ChatGPT Plus a 20€, e 4 mesi dopo la carta si era già ripagata due volte. Ora la stessa GPU si affitta su Vast.ai mentre dorme e genera altri 520€ netti al mese.

Esegue modelli più grandi in locale di quelli che Claude Code Max gli forniva.

Non è un flex di nicchia. Gli Apple Store hanno fisicamente esaurito i Mac Mini nel primo trimestre perché gli sviluppatori li stavano convertendo in server AI domestici. NVIDIA ha prezzato un kit per sviluppatori a €249 che esegue modelli 7B in locale. L'amministratore delegato di AMD ha firmato personalmente un mini PC da €1.700 che esegue modelli più grandi di quelli che ti dà Claude Pro. L'intero stack di abbonamenti che aveva senso nel 2024 è crollato a metà del 2026, e quasi nessuno ne parla chiaramente.

PARTE 1

I €5.508 ALL'ANNO CHE LA MAGGIOR PARTE DEGLI SVILUPPATORI NON SA DI PAGARE

La maggior parte delle persone non somma la propria spesa per l'AI. Gli abbonamenti sembrano piccoli singolarmente e si nascondono negli estratti conto mensili della carta.

Lo stack che un utente AI serio utilizza nel 2026:

text

1Claude Code Max (20x)   €200/mese   €2.400/anno
2ChatGPT Pro             €200/mese   €2.400/anno
3Gemini Advanced         €20/mese    €240/anno
4GitHub Copilot          €19/mese    €228/anno
5Cursor Pro              €20/mese    €240/anno
6
7Totale per utenti pesanti €459/mese   €5.508/anno

€5.508 all'anno. Per software che gira sul computer di qualcun altro, invia i tuoi dati ai loro server e ti limita la velocità proprio quando ne hai più bisogno (lunedì mattina, venerdì sera, il giorno del lancio).

Ogni dispositivo sulla mappa qui sotto trasforma quella bolletta ricorrente in un acquisto hardware una tantum più da €2 a €9 al mese di elettricità. Il calcolo è lo stesso indipendentemente dal livello che scegli:

text

1Anno 1:  €5.508 risparmiati   €249 a €1.700 spesi + €50 a €200 elettricità
2Anno 2:  €11.016 risparmiati  €100 elettricità
3Anno 3:  €16.524 risparmiati  €100 elettricità

Entro il terzo anno, anche il dispositivo più costoso sulla mappa si è ripagato da 6 a 10 volte. E questo prima di considerare il percorso del reddito da noleggio nella Parte 6.

PARTE 2

LIVELLO 1: JETSON ORIN NANO SUPER, €249, IL PUNTO DI INGRESSO

Jensen Huang lo ha annunciato a un prezzo che non aveva senso: €249 per un computer con una GPU NVIDIA dedicata più piccola di un mazzo di carte. Viene spedito da Amazon per meno di una bella cena.

Cosa esegue: Llama 3.2 (3B), Mistral 7B, Gemma 2 (9B), DeepSeek R1 (1.5B), Qwen 2.5 (7B). Tutti gratuiti, tutti locali, tutti per sempre. I modelli 7B gestiscono circa l'80% di ciò per cui le persone usano ChatGPT Plus quotidianamente. Bozze, riassunti, script di codifica, domande e risposte rapide.

Cosa non gestisce: ragionamenti complessi a più fasi, finestre di contesto grandi oltre 8K token, qualsiasi cosa richieda intelligenza di livello frontier.

Specifiche a colpo d'occhio: 8 GB di memoria unificata, 67 TOPS di prestazioni AI, consumo da 7 a 25 W, circa €2 al mese di elettricità in funzione 24/7. Il pareggio rispetto a un singolo abbonamento ChatGPT Plus da €20 è di 13 mesi. Il pareggio rispetto a Claude Code Max è di 6 settimane.

Questo è il dispositivo per chi paga €20/mese per ChatGPT Plus e vuole semplicemente smettere.

PARTE 3

LIVELLO 2: MAC MINI M4, €599, LA SCELTA PREDEFINITA

Gli Apple Store hanno esaurito i Mac Mini all'inizio del 2026, e non è stato a causa del lancio di un prodotto. Gli sviluppatori hanno capito che l'architettura di memoria unificata all'interno del chip M4 lo rende una delle macchine di inferenza AI più efficienti che si possano acquistare a qualsiasi prezzo.

Due livelli contano:

text

1Mac Mini M4        €599      16 GB di memoria, esegue modelli 8B comodamente
2Mac Mini M4 Pro    €1.399    48 GB di memoria, esegue modelli 70B in locale

Il modello base da €599 esegue modelli a 8 miliardi di parametri comodamente. L'M4 Pro da €1.399 con 48 GB esegue Llama 3.3 70B, che è la cosa più vicina a GPT-4 che si possa eseguire su hardware consumer oggi.

Il motivo per cui funziona così bene: su un PC normale, i dati vengono costantemente copiati tra la RAM di sistema e la VRAM della GPU, il che uccide la velocità di inferenza. Su Apple Silicon, CPU e GPU condividono un unico pool di memoria, quindi il modello viene caricato una volta ed entrambi i processori leggono dallo stesso posto. Ecco perché un Mac Mini da €599 supera macchine AI Windows da €1.500 negli stessi benchmark.

Uno sviluppatore ha documentato il passaggio su XDA nell'aprile 2026, sostituendo Claude Pro con una configurazione Mac Mini M4 e riferendo che "la produttività non è calata di un niente." Il pareggio rispetto a €200/mese di Claude Code Max è di 3 mesi per il modello base, 7 mesi per il Pro.

PARTE 4

LIVELLO 3: RTX 3090 USATA, €700, IL MIGLIOR RAPPORTO QUALITÀ-PREZZO

Ogni GPU rilasciata negli ultimi due anni ha lo stesso difetto per l'AI: memoria insufficiente. La RTX 5090 ha 32 GB e costa €3.800. La RTX 4090 ha 24 GB e costa €2.000+. La RTX 3090, vecchia di cinque anni, anch'essa con 24 GB, costa €700 usata su eBay.

Per l'AI locale, la VRAM conta più della generazione del chip. Una scheda del 2020 con 24 GB batte una scheda del 2024 con 12 GB ogni singola volta. La RTX 3090 non è solo economica, è attivamente migliore delle sue sorelle più piccole e recenti per questo specifico lavoro.

Il modello che rende tutto ciò utile: Qwen 3.6 27B. Alibaba lo ha rilasciato in silenzio all'inizio del 2026 e i benchmark hanno fatto il giro del mondo.

text

1Benchmark                Qwen 3.6 27B (gratuito, locale)   Claude 4.5 Opus (€200/mese)
2RealWorldQA (visione)    84.1                               77.0
3IFBench (istruzioni)     76.5                               58.0
4AIME 2026 (matematica)   91.3                               93.3
5MMLU (conoscenza)        83.2%                              ~82%

Un modello 27B gratuito eseguibile localmente che batte il modello di punta di Anthropic sulla visione di 7 punti e sulle istruzioni di 18. Questo è il dispositivo per chi ha già un PC e ha solo bisogno di inserire una scheda. Acquistate da venditori eBay con feedback al 98%+, chiedete screenshot di GPU-Z per verificare la presenza di errori di memoria ed evitate schede descritte come "provenienti da mining rig."

Il pareggio rispetto a Claude Code Max è di 3,5 mesi. Dopodiché la scheda è puro risparmio finché non muore fisicamente, cosa che per una 3090 è di solito da 5 a 8 anni.

PARTE 5

LIVELLO 4: GMKtec EVO-X2, €1.700, LIVELLO FRONTIER IN LOCALE

Al CES 2026, l'amministratore delegato di AMD, Lisa Su, era in piedi sul palco con una piccola scatola nera dietro di sé. Qualche mese dopo, all'AI Developer Day di AMD a Shanghai, si è avvicinata a quello stesso dispositivo e lo ha firmato personalmente. Il dispositivo è il GMKtec EVO-X2.

È il primo chip x86 mai costruito in grado di eseguire un modello da 200 miliardi di parametri su un singolo pezzo di silicio. Fino a 110 GB di VRAM utilizzabile su Linux, abbastanza per eseguire Qwen3-235B completamente e senza intoppi, oltre a DeepSeek-V3 e Llama 3.3 70B senza alcun trucco di quantizzazione.

text

1Modello            VRAM necessaria    Risultato su EVO-X2
2Qwen3-235B         ~110 GB            Funziona completamente, senza intoppi
3DeepSeek-V3        ~100 GB            Funziona comodamente
4Llama 3.3 70B      ~42 GB             Veloce, ampio margine
5Qwen 3.6 27B       ~16 GB             Molto veloce, uso quotidiano

L'affermazione di AMD al CES: il chip ha superato una NVIDIA RTX 5080 di oltre 3 volte nell'inferenza di DeepSeek R1. Un mini PC delle dimensioni di un portapranzo che batte una scheda grafica discreta da oltre €1.000 su carichi di lavoro AI reali.

Questo è il dispositivo per chi il cui utilizzo dell'AI necessita genuinamente di modelli da 70B a 235B eseguiti in locale, ovvero le persone che pagano €200/mese per ChatGPT Pro e Claude Code Max combinati e bruciano i limiti di velocità entro mercoledì. Il pareggio si raggiunge intorno ai 9-10 mesi. In tre anni, il dispositivo fa risparmiare circa €13.000 rispetto al rimanere sugli abbonamenti.

PARTE 6

LIVELLO 5: RIBALTA L'HARDWARE, GUADAGNA INVECE DI RISPARMIARE

Lo stesso hardware che esegue l'AI in locale può affittarsi ad altre persone che eseguono l'AI. I miner di criptovalute lo hanno capito per primi. Dopo che il merge di Ethereum ha ucciso il mining di Bitcoin su GPU, hanno puntato le loro piattaforme verso piattaforme di noleggio di inferenza AI e hanno iniziato a guadagnare da 1,5 a 4 volte in più all'ora di quanto abbiano mai fatto minando criptovalute.

text

1GPU             Mining (€/mese)    Noleggio AI (€/mese)    Differenza
2RTX 3090        €40 a 90           €200 a 400              4-5x
3RTX 4090        €80 a 150          €500 a 1.000            5-7x
4RTX 5090        €120 a 200         €700 a 1.400            5-7x
5A100 80GB       n/d                €1.200 a 2.500          n/d
6H100            n/d                €2.500 a 5.000          n/d

Le piattaforme che fanno questo: Vast.ai, Clore.ai, io.net, RunPod, Akash, Salad. Trattengono dal 15 al 25% e pagano il resto in dollari o stablecoin. Una singola RTX 4090 su una scrivania genera da €500 a €1.000 al mese affittandosi. Una piccola fattoria di 8 di queste genera da €4.000 a €8.000 al mese con un flusso di cassa stabile che le criptovalute non hanno mai fornito.

Le fattorie di mining che un tempo erano ovunque su TikTok non minano più Bitcoin, stanno coltivando token AI per ChatGPT, Claude e Gemini attraverso piattaforme di noleggio. OpenAI e Anthropic acquistano silenziosamente quella potenza di calcolo a buon mercato dalle fattorie e te la rivendono a €200/mese.

Se possiedi già una 4090 o hai il budget per impostarne una, questo ribalta completamente il calcolo. Invece di risparmiare €200/mese, guadagni da €400 a €800/mese per scheda.

PARTE 7

UN UNICO STACK SOFTWARE CHE FUNZIONA SU OGNI DISPOSITIVO SOPRA

Indipendentemente dal dispositivo che scegli, lo stack software è identico. Questo è uno dei segnali più forti che l'AI locale è ora matura. Non cinque strumenti concorrenti, ma un unico stack pulito che funziona ovunque.

text

1Runtime:        Ollama (gratuito, open source)
2Interfaccia:    Open WebUI (ChatGPT privato nel tuo browser)
3Agente di codifica: Claude Code puntato su Ollama locale
4Modelli:        Qwen 3.6 27B, DeepSeek R1, Llama 3.3 70B,
5                Mistral 7B, Gemma 2 9B

La configurazione è identica su ogni dispositivo. Installa Ollama con un comando, scarica il modello più grande che la tua RAM consente, punta Claude Code su localhost. Le stesse tre righe di bash funzionano su un Jetson da €249 e su un EVO-X2 da €1.700:

bash

1curl -fsSL https://ollama.com/install.sh | sh
2ollama pull qwen3.6:27b
3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

Questo è tutto. Claude Code ora parla con il tuo modello locale invece che con i server di Anthropic, usa gli stessi comandi, lo stesso flusso di lavoro, zero costi API, zero limiti di velocità, zero dati che lasciano la tua rete.

PARTE 8

CHI DOVREBBE COMPRARE COSA: L'ALBERO DECISIONALE

Il dispositivo sbagliato è quello che compri senza sapere perché. Abbina il dispositivo a come usi effettivamente l'AI:

text

1Se paghi €20/mese per ChatGPT Plus         → Jetson Orin Nano  €249
2Se paghi €200/mese per API AI              → Mac Mini M4       €599
3Se sei un utente pesante di Claude Code    → Mac Mini M4 Pro   €1.399
4                                             o RTX 3090        €700
5Se hai bisogno di modelli 200B+ (lavoro frontier) → GMKtec EVO-X2 €1.700
6Se hai già un PC gaming con 4090           → Salta Mac, aggiungi scheda
7Se vuoi GUADAGNARE invece di risparmiare   → Configurazione fattoria di noleggio GPU
8Se vuoi il massimo valore per dollaro      → RTX 3090 usata in PC esistente
9Se vuoi zero configurazione, funziona e basta → Mac Mini M4
10Se fai lavoro legale/medico (privacy)      → Qualsiasi dispositivo va bene, tutto locale

Il percorso ibrido è ciò che la maggior parte delle persone finisce effettivamente per fare. L'hardware locale gestisce l'80% delle attività quotidiane gratuitamente. Un singolo abbonamento ChatGPT Plus o Claude Pro da €20/mese rimane per il restante 20%, il ragionamento genuinamente difficile di livello frontier dove ogni punto di benchmark conta. Costo mensile totale: €23 invece di €459.

PARTE 9

RISULTATI DAI PRIMI 6 MESI DI TOMÁS

text

1Mese 1:  -€459    ultimo mese dell'intero stack di abbonamenti
2Mese 2:  -€680    acquistata RTX 3090 usata su OLX
3Mese 3:  +€41     tenuto solo ChatGPT Plus €20, risparmiati €439
4Mese 4:  +€620    inserita GPU su Vast.ai, primo noleggio €580
5Mese 5:  +€687    reddito Vast costante
6Mese 6:  +€720    stessa configurazione, senza interventi

L'effetto composto: al sesto mese la GPU si è completamente ripagata, ha sostituito €459/mese in abbonamenti e genera ulteriori €500-700/mese in reddito da noleggio. Il saldo totale dal mese 1 al mese 6 è di €1.179/mese a suo favore con lo stesso hardware che fa tutto il lavoro.

In 12 mesi la differenza è di €14.148 nel flusso di cassa rispetto al rimanere sullo stack di abbonamenti. In 3 anni sono €42.000. Da una singola scheda usata da €680.

PARTE 10

LA FINESTRA

Sei mesi fa questo articolo non sarebbe stato possibile. I modelli non erano abbastanza piccoli. L'hardware non era abbastanza economico. Gli abbonamenti non erano abbastanza costosi. L'open source non era abbastanza credibile. Tutte e quattro le cose sono cambiate contemporaneamente tra la fine del 2025 e la metà del 2026.

Le aziende che hanno costruito l'AI negli ultimi tre anni presumevano che avrebbe sempre avuto bisogno dei loro data center. Quella presunzione è crollata. Una scatola da €249 esegue modelli 7B. Un Mac Mini da €599 esegue modelli 14B. Una GPU usata da €700 esegue modelli che battono Claude nei benchmark di visione. Un mini PC da €1.700 esegue 235 miliardi di parametri in locale. Il data center si è trasferito in soggiorno.

Non devi scegliere l'opzione più costosa. Non devi essere uno sviluppatore per usarne nessuno. La configurazione è di tre comandi. Il software è gratuito. L'elettricità costa meno di un caffè al mese.

Gli abbonamenti avevano senso quando l'hardware locale non riusciva a tenere il passo. L'hardware ha tenuto il passo. Scegli il tuo livello e smetti di pagare per la potenza di calcolo di qualcun altro.

Questa era la parte 6 di una serie in corso sui flussi di reddito AI e tagli ai costi di cui nessuno parla adeguatamente. La parte 7 uscirà la prossima settimana e analizzerà la configurazione della fattoria di noleggio GPU: 8 schede, un appartamento, €4.000-8.000 al mese in noleggio passivo di potenza di calcolo AI.

/Segui @antisadh così ti appare nel feed il giorno in cui esce/

5 dispositivi che sostituiscono ogni abbonamento AI da 200$/mese

I €5.508 ALL'ANNO CHE LA MAGGIOR PARTE DEGLI SVILUPPATORI NON SA DI PAGARE

LIVELLO 1: JETSON ORIN NANO SUPER, €249, IL PUNTO DI INGRESSO

LIVELLO 2: MAC MINI M4, €599, LA SCELTA PREDEFINITA

LIVELLO 3: RTX 3090 USATA, €700, IL MIGLIOR RAPPORTO QUALITÀ-PREZZO

LIVELLO 4: GMKtec EVO-X2, €1.700, LIVELLO FRONTIER IN LOCALE

LIVELLO 5: RIBALTA L'HARDWARE, GUADAGNA INVECE DI RISPARMIARE

UN UNICO STACK SOFTWARE CHE FUNZIONA SU OGNI DISPOSITIVO SOPRA

CHI DOVREBBE COMPRARE COSA: L'ALBERO DECISIONALE

RISULTATI DAI PRIMI 6 MESI DI TOMÁS

LA FINESTRA

Turn one viral article into a full content workflow

Articoli virali recenti

Il fenomenale agente AI del 2024: una guida completa a WorkBuddy da 0 a 1

La piattaforma X apre la prevendita del token $X e introduce X Wallet

Cowork engineering: la roadmap in 14 passaggi per trasformare una chat in un collega autonomo.

Loop Engineering per Trading Agent: 12 passaggi per costruire un Quant Desk autonomo

Consigli di carriera nell'era dell'IA

Ti presentiamo Rialto

5 dispositivi che sostituiscono ogni abbonamento AI da 200$/mese

I €5.508 ALL'ANNO CHE LA MAGGIOR PARTE DEGLI SVILUPPATORI NON SA DI PAGARE

LIVELLO 1: JETSON ORIN NANO SUPER, €249, IL PUNTO DI INGRESSO

LIVELLO 2: MAC MINI M4, €599, LA SCELTA PREDEFINITA

LIVELLO 3: RTX 3090 USATA, €700, IL MIGLIOR RAPPORTO QUALITÀ-PREZZO

LIVELLO 4: GMKtec EVO-X2, €1.700, LIVELLO FRONTIER IN LOCALE

LIVELLO 5: RIBALTA L'HARDWARE, GUADAGNA INVECE DI RISPARMIARE

UN UNICO STACK SOFTWARE CHE FUNZIONA SU OGNI DISPOSITIVO SOPRA

CHI DOVREBBE COMPRARE COSA: L'ALBERO DECISIONALE

RISULTATI DAI PRIMI 6 MESI DI TOMÁS

LA FINESTRA

Turn one viral article into a full content workflow

Trasforma il tuo Markdown in un articolo 𝕏 pulito

Articoli virali recenti

Il fenomenale agente AI del 2024: una guida completa a WorkBuddy da 0 a 1

La piattaforma X apre la prevendita del token $X e introduce X Wallet

Cowork engineering: la roadmap in 14 passaggi per trasformare una chat in un collega autonomo.

Loop Engineering per Trading Agent: 12 passaggi per costruire un Quant Desk autonomo

Consigli di carriera nell'era dell'IA

Ti presentiamo Rialto