ComfyUI e Stable Diffusion in locale: guida gratis passo passo

Generare immagini con l'intelligenza artificiale non significa per forza pagare un abbonamento a Midjourney o tenere d'occhio i crediti di DALL-E. Con ComfyUI — un'interfaccia open source — e i modelli della famiglia Stable Diffusion (o FLUX) puoi far girare tutto sul tuo computer: gratis, senza limiti di immagini, senza censure imposte dal servizio e con i tuoi file che non lasciano mai il PC. In questa guida vediamo a chi conviene, cosa serve, come installarlo passo passo su Windows, Linux e Mac, quali modelli scaricare e quali prompt provare. È un tutorial di livello intermedio: niente di proibitivo, ma metti in conto un'ora la prima volta.

A chi serve e cosa otterrai

È pensato per chi crea contenuti (social, blog, presentazioni), per chi fa grafica o prototipazione, per chi vuole sperimentare senza spendere e per chi ha bisogno di lavorare offline o con immagini riservate. Alla fine avrai ComfyUI installato, almeno un modello funzionante e la capacità di generare immagini da testo (text-to-image), modificarle (image-to-image) e ritoccarne porzioni (inpainting).

Requisiti reali: che computer serve

GPU NVIDIA con almeno 6 GB di VRAM (8-12 GB consigliati): è lo scenario migliore. Con 6 GB lavori bene con Stable Diffusion 1.5 e a fatica con SDXL; con 12 GB o più gestisci SDXL e FLUX senza patemi.
Mac con chip Apple Silicon (M1/M2/M3/M4): funziona tramite il backend MPS, più lento di una GPU NVIDIA equivalente ma usabile, soprattutto dai modelli M-Pro/Max in su.
GPU AMD: possibile su Linux con ROCm, più complicato su Windows.
Solo CPU: tecnicamente possibile, ma un'immagine può richiedere diversi minuti: sconsigliato se non per provare.
Disco: almeno 15-20 GB liberi (i modelli pesano da 2 a 12 GB l'uno).

Quale strumento scegliere (e perché ComfyUI)

Per generare immagini in locale ci sono tre strade principali:

ComfyUI — interfaccia «a nodi»: colleghi blocchi (carica modello → prompt → campionamento → salva). Più ripido da imparare, ma è il più flessibile, il più veloce ad adottare i nuovi modelli (SDXL, FLUX, video) e il più leggero in memoria. Prima scelta per chi vuole crescere.
Automatic1111 / Forge — interfaccia «a moduli» classica, più immediata per chi inizia, enorme libreria di estensioni. Ottima alternativa se ComfyUI ti spaventa.
Fooocus — pensato per la massima semplicità (assomiglia a Midjourney): pochissime impostazioni, risultati buoni con SDXL. Perfetto se vuoi solo «scrivi prompt, ottieni immagine».

Per questa guida usiamo ComfyUI perché è quello che ti porta più lontano e gira anche su hardware modesto. Tutti questi strumenti sono gratuiti e open source; l'unico «costo» è l'elettricità e il tempo di download dei modelli.

Persona con visore in un ambiente illuminato al neon che lavora al computer — ComfyUI usa un'interfaccia a nodi: più da imparare, ma molto più flessibile.

Installazione passo passo

Windows (il modo più semplice)

Vai sulla pagina GitHub di ComfyUI e scarica il pacchetto «ComfyUI Windows Portable» (un file .7z).
Estrai l'archivio in una cartella con spazio libero (ti serve 7-Zip).
Scarica un modello (vedi sotto) e mettilo nella cartella ComfyUI/models/checkpoints/.
Avvia run_nvidia_gpu.bat (o run_cpu.bat se non hai una GPU NVIDIA). Si apre una finestra del terminale e, dopo qualche secondo, il browser su http://127.0.0.1:8188.

Linux / Mac (da sorgente)

git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
python3 -m venv venv
source venv/bin/activate
# GPU NVIDIA:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu124
# Mac Apple Silicon: pip install torch torchvision   (usa MPS in automatico)
pip install -r requirements.txt
python main.py

Poi apri http://127.0.0.1:8188 nel browser. Su Mac, se vuoi più stabilità, aggiungi --force-fp16 al comando di avvio.

Consiglio per tutti: ComfyUI Manager

Installa l'estensione ComfyUI Manager (si clona dentro ComfyUI/custom_nodes/): aggiunge un pulsante «Manager» nell'interfaccia da cui scarichi modelli e nodi extra con un clic, senza smanettare a mano tra le cartelle.

Quali modelli scaricare

Stable Diffusion 1.5 (~2 GB): leggero, gira ovunque, enorme ecosistema di varianti. Buono per iniziare e per PC modesti.
Stable Diffusion XL (SDXL) base 1.0 (~6,5 GB): qualità nettamente superiore, immagini fino a 1024×1024 native. Vuole almeno 8 GB di VRAM per andare comodo.
FLUX.1 [schnell] di Black Forest Labs (~12 GB, licenza Apache 2.0): tra i migliori modelli aperti per realismo e testo nelle immagini, e «schnell» significa veloce (poche iterazioni). Esiste anche FLUX.1 [dev], ancora più curato ma con licenza non commerciale.

Scarichi i file (formato .safetensors) da Hugging Face — cerca «stabilityai» per Stable Diffusion e «black-forest-labs» per FLUX — e li metti in ComfyUI/models/checkpoints/ (per FLUX servono anche i file VAE e text encoder nelle rispettive cartelle: il Manager te li scarica al posto giusto).

La tua prima immagine

Apri ComfyUI: vedi già un workflow di esempio (i nodi «Load Checkpoint», «CLIP Text Encode» per prompt e prompt negativo, «KSampler», «VAE Decode», «Save Image»).
Nel nodo «Load Checkpoint» seleziona il modello che hai scaricato.
Nel campo del prompt positivo scrivi la tua descrizione (in inglese funziona meglio). Nel prompt negativo metti ciò che non vuoi (es. blurry, low quality, extra fingers, watermark).
Premi «Queue Prompt». Dopo qualche secondo (o minuto su CPU) l'immagine compare nel nodo finale e viene salvata in ComfyUI/output/.

Prompt da provare:

cinematic photo of an espresso cup on a marble table, soft morning light, shallow depth of field, 50mm, highly detailed — risultato atteso: una foto pulita, sfondo sfocato, luce calda.

flat vector illustration of a friendly robot reading a book, pastel colors, minimal, white background — risultato atteso: un'illustrazione piatta in stile icona, adatta a un blog.

storefront sign that reads "AI NOTIZIE", neon letters, night, rain reflections on the pavement, photorealistic — risultato atteso: con FLUX il testo nell'insegna viene leggibile, con SD 1.5 quasi mai.

Andare oltre: image-to-image, inpainting, LoRA

Una volta presa la mano: con image-to-image parti da una tua foto e la trasformi (cambi stile, illuminazione); con l'inpainting selezioni una zona dell'immagine e la rigeneri (togliere un oggetto, cambiare un volto); con i LoRA — piccoli file da poche decine di MB — aggiungi stili o soggetti specifici a un modello base. Su ComfyUI tutto questo si fa aggiungendo nodi: il Manager e i workflow condivisi online (li importi trascinando un'immagine PNG generata da altri, che porta dentro il suo workflow) accorciano la curva di apprendimento. Per video c'è il supporto a modelli come Stable Video Diffusion e altri, sempre come nodi.

Errori comuni e come risolverli

«CUDA out of memory»: la GPU non ha abbastanza VRAM. Riduci la risoluzione (es. 768×768 invece di 1024), usa SD 1.5 al posto di SDXL, oppure avvia ComfyUI con --lowvram (o --medvram).
L'immagine esce tutta nera: tipico problema di VAE/half precision. Avvia con --no-half-vae o, su Mac, con --force-fp16.
«Error: checkpoint not found»: il file del modello non è nella cartella giusta (models/checkpoints/) o non hai premuto «Refresh»: ricarica la pagina del browser.
Generazione lentissima: stai girando su CPU. Verifica di aver avviato lo script «nvidia_gpu» e di avere i driver aggiornati; su laptop con doppia GPU, forza l'uso di quella dedicata.
Mani e dita sbagliate: classico dei modelli di immagini. Aiuta un buon prompt negativo, modelli più recenti (SDXL, FLUX) e, se serve, l'inpainting sulla zona da correggere.

Quando NON usare l'IA in locale

Se generi due immagini al mese, l'installazione non vale la candela: i piani gratuiti di Bing Image Creator, Google ImageFX o lo stesso ChatGPT bastano. Se non hai una GPU decente e non hai un Mac Apple Silicon, l'esperienza sarà frustrante: meglio un servizio cloud (anche RunPod o Replicate, a consumo) o gli strumenti online. E ricorda: le immagini generate non sono «libere da tutto» — verifica la licenza del modello (FLUX schnell è Apache 2.0, FLUX dev no), non usare l'IA per imitare lo stile di artisti viventi a fini commerciali senza pensarci, e non creare immagini di persone reali senza consenso. Fatti questi conti, ComfyUI è lo strumento gratuito più potente che puoi tenere sul tuo disco.

Generare immagini con l'IA gratis sul tuo PC: guida a ComfyUI

A chi serve e cosa otterrai

Requisiti reali: che computer serve

Quale strumento scegliere (e perché ComfyUI)

Installazione passo passo

Windows (il modo più semplice)

Linux / Mac (da sorgente)

Consiglio per tutti: ComfyUI Manager

Quali modelli scaricare

La tua prima immagine

Andare oltre: image-to-image, inpainting, LoRA

Errori comuni e come risolverli

Quando NON usare l'IA in locale

Fonti

Andrea Bertolotti

📬 Newsletter di AI Notizie

Continua a leggere

Chiamare le API di OpenAI, Anthropic e Gemini con Python

Installare un'IA in locale con Ollama: la guida completa

Prompt engineering avanzato: 8 tecniche che cambiano i risultati

Automatizzare il lavoro con n8n e l'IA: guida pratica