Come sostituire gli abbonamenti AI da 412 $/mese con l'hardware locale

Hai un computer a casa che in questo momento è inutilizzato. Un laptop con lo schermo chiuso. Un Mac mini su uno scaffale. Un vecchio PC gaming sotto la scrivania che si accende per Spotify e si spegne di nuovo. Consuma corrente, occupa spazio e non contribuisce per niente alla tua vita.

Nel frattempo, l'estratto conto della tua carta di credito mostra 412 € al mese in abbonamenti AI. Claude Max, ChatGPT Pro, Cursor, Perplexity, due trascrittori che ti eri dimenticato di aver attivato, un "assistente di scrittura" che hai usato una volta. 4.944 € all'anno per noleggiare potenza di calcolo che starebbe su un singolo pezzo di hardware silenzioso in casa tua.

Nel 2026 questi due fatti entrano in collisione. Gli stessi modelli alla base degli abbonamenti più costosi sul mercato ora girano su hardware che costa meno di tre mensilità del conto che stanno sostituendo. E la macchina non si limita a eseguire il modello. Lavora mentre dormi, con una programmazione che imposti tu, svolgendo compiti che non avresti mai il tempo di fare personalmente.

Questo articolo sceglie l'hardware, sceglie il cervello e ti mostra cosa fa effettivamente la scatola quando smetti di essere tu a premere i pulsanti.

Scegli la scatola

Quattro opzioni che vale la pena acquistare. Due sono computer silenziosi e compatti. Due sono schede da inserire in un desktop che già possiedi.

La strada silenziosa è più semplice. Mac mini M4, 599 € è la scelta della maggior parte delle persone. Qualunque configurazione AI locale finisce per puntare qui a causa di una scelta progettuale. I PC normali copiano i dati tra RAM di sistema e VRAM della GPU, e sei limitato da ciò che la scheda offre. Apple Silicon condivide un unico pool di memoria. Il modello viene caricato una volta sola. Entrambi i processori leggono dalla stessa posizione. La versione da 599 € con 16 GB esegue modelli da 7-8B più velocemente di macchine Windows che costano il doppio. Passa a 32 GB per modelli da 14B. Sali all'M4 Pro a 1.399 € con 48 GB e puoi eseguire modelli Llama-class da 70B su qualcosa grande quanto un panino. Consumo elettrico da 8 a 25 W, ventola silenziosa, elettricità circa 4 € al mese. Questa è la scatola se non vuoi più pensare all'hardware.

Mac Studio M3 Ultra, 4.199 € è la versione senza compromessi della stessa idea. Configurazione base 96 GB di memoria unificata, massimo 192 GB. Oltre questo si entra nel territorio dei rack da server con cifre a sei zeri. 192 GB caricano i più grandi modelli open-weight attualmente esistenti, a grandezza naturale, senza trucchi di compressione. Stessa classe di peso degli abbonamenti più costosi sul mercato. Elettricità a pieno regime circa 14 € al mese, punto di pareggio rispetto a un singolo abbonamento da 200 €/mese al mese 22. Le macchine durano da 7 a 10 anni. Questa è la scatola per chi accumula abbonamenti per più di 400 € al mese oggi, o per chi lavora con dati che legalmente non possono uscire dal dispositivo. Avvocati, medici, giornalisti che proteggono le fonti, analisti finanziari.

Se invece preferisci usare un desktop che già possiedi, due schede. Tesla M40 24 GB, 130 € usata su eBay. Una scheda da datacenter rilasciata da NVIDIA nel 2015 a 3.500 $. Da tempo ritirata dai server, sta finendo sul mercato dell'usato a meno di 150 $. 24 GB di VRAM, come una nuovissima RTX 5090. Abbastanza per eseguire un modello da 27B che regge il confronto con i modelli frontier nella maggior parte dei benchmark. Avvertenze: nessuna uscita video, quindi tieni la GPU principale per il monitor; nessuna ventola integrata, quindi aggiungi 25 € per una copertura stampata in 3D e una Noctua; serve un adattatore da EPS a PCIe per 10 €. Totale circa 165 €. Si ripaga in due settimane rispetto a un singolo abbonamento Pro.

RTX 3090 usata, 700 €. Per l'AI locale, la VRAM conta più della generazione della GPU, e la 3090 è la vincitrice del rapporto prezzo/VRAM nel 2026. Una nuova RTX 5090 ha 32 GB a 3.800 $. Una 4090 usata ha 24 GB a 2.000 $. Una 3090 di cinque anni fa ha gli stessi 24 GB della 4090 e costa da 650 a 750 $. Stessa dimensione di modello utilizzabile, 70-80% della velocità, un terzo del prezzo. Inseriscila in un PC gaming esistente, totale circa 850 €, esegue un modello da 27B a 25-30 token al secondo. Due regole per comprare schede usate: feedback del venditore 98%+, e salta quelle che menzionano mining. Il calore elevato danneggia i chip di memoria. Il gaming consuma di meno.

Scegli in un respiro:

text

1vuoi silenzio, zero configurazione, funziona per sempre  -> Mac mini M4, 599 €
2accumuli abbonamenti da 400+ €/mese o dati sensibili     -> Mac Studio M3 Ultra, 4.199 €
3hai un desktop, ingresso più economico possibile          -> Tesla M40, 130 €
4hai un PC gaming, miglior velocità per il tuo denaro     -> RTX 3090 usata, 700 €

Qualunque scegli, l'installazione richiede tre comandi identici su ogni livello:

bash

1curl -fsSL https://ollama.com/install.sh | sh
2ollama pull qwen2.5:32b
3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

Scegli il cervello

L'hardware è il corpo. Il pensiero ha comunque bisogno di una mente, e il trucco che permette di risparmiare di più è usarne più di una.

Claude Sonnet è il peso massimo. Usalo per compiti che richiedono un ragionamento vero. Analizzare 15 fonti e soppesare le affermazioni più solide l'una contro l'altra. Decidere a quali delle 400 note nel tuo archivio si collega un nuovo articolo. Circa 3 $ per milione di token di input. Niente di locale lo eguaglia ancora nel pensiero complesso multi-step.

Claude Haiku è la manovalanza economica. Etichettatura. Controlli di coerenza. Scegliere quale di tre opzioni mostrare nel tuo briefing mattutino. Circa 12 volte più economico di Sonnet. Il tipo di lavoro che costa meno di un centesimo per chiamata.

Un modello locale, qualunque cosa entri nella VRAM della tua scatola, è il lavoratore che non invia mai dati all'esterno. Vive sulla tua macchina. Gestisce trascrizioni, riassunti, tutto ciò per cui preferisci non pagare per token e non inviare contenuti sensibili a un server. Gratuito a parte l'elettricità.

La regola che fa risparmiare di più: non usare Sonnet per etichettare, non usare Haiku per ragionare, non inviare contenuti privati all'esterno quando il locale li gestisce bene. La tua scatola ti permette di mescolare i fornelli. Non accendi la friggitrice per bollire un uovo.

Cosa fa mentre dormi

Una scatola sempre accesa è sprecata se tutto ciò che fa è sostituire una scheda di chat. Il punto è farla lavorare senza di te. Ogni lavoro ha la stessa struttura in quattro parti:

text

1ATTIVATORE   -> qualcosa lo avvia (programmazione, nuovo file, webhook)
2AZIONE        -> il lavoro viene svolto
3VERIFICA      -> risultato controllato con una regola rigida
4ITERAZIONE    -> correggi ciò che è fallito, o fermati se supera

Tre lavori che vale la pena impostare il primo weekend.

Il guardiano. Controlla la tua casella di posta. Ogni nuova email viene smistata in tre pile: richiede-risposta, per conoscenza, spazzatura. Viene scritta una bozza di risposta di due righe per la prima pila, così devi solo approvarla. Ti svegli con quattro risposte già scritte, invii tre, ne modifichi una. Casella di posta gestita in sette minuti.

Il cartografo. Vive nella cartella delle tue note. Ogni articolo che salvi, ogni link YouTube che lasci cadere, ogni trascrizione di riunione che finisce lì viene processato: riassunto di una riga, tre affermazioni principali, citazione più forte estratta, e la nuova nota viene collegata alle note esistenti sullo stesso argomento. Regola di verifica: la nota ha tutti e quattro gli elementi e almeno un collegamento wiki a una nota esistente. Le cose inutili vengono etichettate "basso segnale" e saltate. Dopo due mesi, la tua pila "da leggere" si trasforma in un archivio ricercabile di argomenti e citazioni, invece che in un cimitero di schede.

L'osservatore. Non fa niente per la maggior parte del tempo. Questo è il suo lavoro. Osserva un elenco di cose che gli hai detto di osservare. Una parola chiave in un canale Telegram. Un'offerta di lavoro specifica. Un prezzo su Amazon. L'osservatore ti avvisa sul telefono solo quando qualcosa supera effettivamente una soglia che hai impostato. Funziona su Haiku. Costa meno di un centesimo al giorno.

Le tre regole che separano i lavori che funzionano da quelli che bruciano soldi in silenzio: la verifica deve essere una regola rigida, non un'intuizione. Il lavoro deve ricordare cosa ha provato. Il lavoro deve sapere quando smettere. Salta una di queste e ti svegli con un conto di token invece che con un risultato.

I conti

text

1Hardware (una tantum)         130 € a 4.199 €
2Elettricità                   4 € a 14 € / mese
3Opzionale: tieni UN abbonamento  20 € / mese

Vecchio stack di abbonamenti: 412 €/mese, 4.944 €/anno.

Nuovo stack con l'ingresso più economico: 130 € di hardware + 96 €/anno di elettricità + 240 €/anno per un abbonamento tenuto = 466 € il primo anno, 336 € ogni anno successivo. Questo è il 90% in meno sulla bolletta, primo anno compresa la scatola. Anche il Mac Studio raggiunge il pareggio rispetto a un singolo abbonamento da 200 €/mese al mese 22, e dopo sono solo risparmi per il decennio in cui rimane in funzione.

Provane uno prima di comprare qualsiasi cosa

Puoi percepire un lavoro in questo momento, in qualsiasi chat, con nient'altro che un prompt:

text

1Lavorerai in un ciclo finché il compito non soddisfa lo standard.
2
3COMPITO: [descrivi esattamente cosa vuoi che venga prodotto]
4
5CRITERI DI SUCCESSO (severi, niente passaggi morbidi):
6- [criterio 1]
7- [criterio 2]
8- [criterio 3]
9
10PROTOCOLLO DEL CICLO, ripeti a ogni turno:
111. PIANIFICA   - indica il singolo passo successivo.
122. AZIONE      - produci o migliora il lavoro.
133. VERIFICA    - assegna un punteggio da 1 a 10 per ogni criterio, con onestà brutale.
144. DECIDI      - se ogni punteggio è 8+, stampa "FINE" e fermati.
15                Altrimenti stampa "IN ITERAZIONE" e correggi il punto più debole.
16
17Non dichiarare mai concluso fino a quando ogni criterio non è 8+.
18Non farmi domande. Fai un'ipotesi sensata e continua.

Bozza, si valuta, trova il punto debole, riscrive, ripete. Questo è un lavoro, costruito con un paragrafo. Quello che manca è la parte che conta: tu sei ancora l'attivatore. Chiudi la scheda e non esiste più.

Se esegui qualcosa del genere a mano tre volte in una settimana, si è guadagnato un posto permanente nella scatola. Se non lo usi due volte, nessuna quantità di hardware lo salverà.

L'ordine in cui farlo

Ottieni prima un'esecuzione manuale affidabile in una chat normale. Trasformala in uno script. Avvolgi lo script in un vero gate di verifica e una vera condizione di arresto. Solo allora mettilo in programmazione. Saltare i passaggi è esattamente il modo in cui un lavoro gira tutta la notte su un input sbagliato e ti costa soldi in silenzio mentre dormi.

Il punto

Il computer in casa tua che non fa niente per 23 ore al giorno era la macchina sbagliata. Era inattivo perché eri l'unica cosa che gli diceva cosa fare. La macchina giusta non aspetta. Lavora mentre sei a cena, mentre dormi, mentre sei in una riunione che non ha niente a che fare con lei. Il lavoro ti arriva sul telefono al mattino e decidi tu cosa farne.

Smetti di noleggiare potenza di calcolo che sta su una GPU da 130 €. Compra la scatola. Dormi mentre il lavoro si fa.

Se vuoi altri approfondimenti come questo, ne pubblico uno ogni due giorni.

X — https://x.com/gippp69

Telegram — https://t.me/GipArcAI

Un solo dispositivo, collegato una volta, elimina il tuo abbonamento AI da 412 $/mese

Turn one viral article into a full content workflow

Articoli virali recenti

Il baseball è in crisi e tutti lo sanno

27 impostazioni per trasformare Claude Code in un sistema di agenti autonomi

Smetti di essere il collo di bottiglia: come far lavorare Claude mentre dormi

Come creo video UGC con l'IA che funzionano con 2-4$ usando Claude + GPT Image 2 + Seedance 2 + Postiz

Abbiamo bisogno di Cavalieri Templari per il pensiero basato sui primi principi

Preparatevi per l'AX2026!