Il futuro è locale.
Al momento ho 3 Mac Studio sulla mia scrivania che alimentano il mio OpenClaw. Stanno tutti eseguendo Qwen 3.5, un modello locale super intelligente, praticamente buono come Sonnet 4.5. Token illimitati, nessun limite di velocità, tutto al costo dell'energia che entra nei computer.
100% privato. Niente finisce su server nel cloud che le aziende di IA possano leggere o usare per addestrare nuovi modelli. Tutto rimane sul dispositivo. Posso spegnere il Wi-Fi e funzionerà comunque per me.
Questo è il futuro. La tua super intelligenza personale, privata, illimitata, seduta sulla tua scrivania. Che lavora per te 24 ore su 24, 7 giorni su 7.
Ma la cosa importante è che non deve essere il tuo futuro. Può essere il tuo presente. E non hai bisogno di Mac Studio da $10.000 per farlo. Puoi farlo ora su un Mac Mini. Oggi. Subito.
Qwen 3.5 è stato lanciato un paio di giorni fa ed è rivoluzionario. Super intelligenza a livello di Sonnet 4.5, ma può stare in 32 GB di memoria.
Significa che se hai un Mac Mini di un gradino sopra il modello base, puoi inserire questo modello locale e ottenere intelligenza illimitata a livello Sonnet 4.5 (che era rivoluzionario 6 mesi fa) sulla tua scrivania, alimentando il tuo OpenClaw 24/7.
Niente limiti. Nessuno che ti butta fuori da Anthropic. Nessuna tariffa API. Tutto privato.
Intelligenza di livello frontier di 6 mesi fa. Sulla tua scrivania. Sempre al lavoro.
Questo è RIVOLUZIONARIO.
Adesso la lamentela numero 1 su OpenClaw sono i limiti e il prezzo. Se colleghi l'API di Anthropic, potresti spendere migliaia di dollari al mese in commissioni e colpire costantemente i limiti. Questo risolve il problema.
Non solo ti fa risparmiare sui costi, ma sblocca COSÌ tanti nuovi casi d'uso. Ora che non hai limiti, puoi far funzionare i tuoi agenti 24/7/365. Questo cambia completamente il tuo rapporto con l'IA.
Invece di essere una conversazione avanti e indietro come un chatbot, diventa una relazione passiva e ambientale in cui i tuoi agenti producono costantemente valore per te, migliorano se stessi e trovano nuovi compiti. Cose che non erano mai state possibili quando usavi l'API.
Per esempio: in questo momento ho una fabbrica SaaS con i miei agenti che ci lavorano dentro:

4 agenti OpenClaw che lavorano sullo stesso prodotto in sincronia, su compiti individuali. Quando un agente finisce un compito, ne trova un altro su cui lavorare. Se necessario, può creare i propri compiti.
Un altro agente (Ralph) fa il QA su ogni compito eseguito dagli agenti. Se uno degli agenti sbaglia, Ralph modifica le loro memorie e li migliora.
Un sistema a ciclo chiuso completo, auto-migliorante. Mi costerebbe migliaia al mese se usassi le API. Con i modelli locali (Qwen e MiniMax) è completamente gratuito (solo il costo dell'energia, che è abbastanza efficiente sui computer Mac).
Interi nuovi casi d'uso sbloccati che non erano mai stati possibili prima. Dandomi un potere che non avrei mai pensato di avere come azienda di una sola persona.
Puoi farlo anche tu. Puoi avere le tue squadre di agenti che lavorano e migliorano continuamente, anche se hai un Mac Mini.
Come far funzionare un modello locale
Per eseguire Qwen 3.5 (il modello di cui abbiamo parlato prima) avrai bisogno almeno di un Mac Mini con 32 GB di memoria. Il modello richiede solo 20 GB di memoria, ma vuoi un po' di spazio extra per svolgere altre attività.
Se hai solo il Mac Mini base da 16 GB va bene, non potrai eseguire questo modello, ma ci sono modelli più piccoli che puoi ancora eseguire. Non saranno di intelligenza frontier, ma potrai scaricare alcuni piccoli compiti sul tuo modello locale.
Ecco come configurare Qwen 3.5-35B-A3B sul tuo computer con 32 GB di memoria o superiore:
- Scarica LM Studio — lmstudio.ai (http://lmstudio.ai/http://lmstudio.ai/)), gratuito, trascina in Applicazioni
- Cerca Qwen3.5-35B-A3B-4bit — nella scheda Scopri, cerca "Qwen3.5-35B-A3B" e scegli la versione MLX a 4 bit
- Scaricalo — ~20 GB, ci vogliono pochi minuti con una connessione decente
- Carica il modello — cliccaci sopra nella barra laterale, premi Carica. Fatto. Ora hai un'IA locale in esecuzione
- Usalo — Chiedi al tuo OpenClaw di connettersi. Dì che l'hai scaricato in LM Studio e che vorresti usare il modello come strumento.
Se hai un computer con meno di 32 GB di memoria, come il Mac Mini modello base, ti consiglio di parlare con il tuo OpenClaw e chiedere "Qual è il miglior modello locale che posso eseguire sul mio hardware che mi aiuti a scaricare alcuni compiti che facciamo o a migliorare il nostro sistema di memoria?"
Quando usarlo
Questo modello è frontier di 6-12 mesi fa, ma non è frontier oggi. Quindi ecco il mio consiglio: usa Anthropic o ChatGPT come cervello per il tuo OpenClaw, poi fallo usare il tuo modello locale come muscoli
Il modello frontier pianificherà tutto, poi userà il modello locale per eseguire.
L'esecuzione è il 90% dell'utilizzo dei token, quindi ti farà risparmiare MASSICCIAMENTE.
Ti dà un modello ibrido, che è il meglio di entrambi i mondi.
Ti dà anche il vantaggio di sperimentare con l'intelligenza locale e imparare di più sull'IA. Inoltre mantenere i tuoi dati privati quando vuoi.
Questo ti preparerà anche per un futuro locale che credo arriverà quest'anno.
Credo che entro la fine dell'anno avremo modelli a livello Opus 4.6 che possono funzionare su un singolo Mac Studio o Mac Mini. E quando accadrà, il mondo si sveglierà alle possibilità.
Buona notizia per te: se agisci ora, sarai avanti rispetto a tutti gli altri, che è sempre dove si trova l'enorme opportunità.





