Generare immagini con l'intelligenza artificiale non significa per forza pagare un abbonamento a Midjourney o tenere d'occhio i crediti di DALL-E. Con ComfyUI — un'interfaccia open source — e i modelli della famiglia Stable Diffusion (o FLUX) puoi far girare tutto sul tuo computer: gratis, senza limiti di immagini, senza censure imposte dal servizio e con i tuoi file che non lasciano mai il PC. In questa guida vediamo a chi conviene, cosa serve, come installarlo passo passo su Windows, Linux e Mac, quali modelli scaricare e quali prompt provare. È un tutorial di livello intermedio: niente di proibitivo, ma metti in conto un'ora la prima volta.
A chi serve e cosa otterrai
È pensato per chi crea contenuti (social, blog, presentazioni), per chi fa grafica o prototipazione, per chi vuole sperimentare senza spendere e per chi ha bisogno di lavorare offline o con immagini riservate. Alla fine avrai ComfyUI installato, almeno un modello funzionante e la capacità di generare immagini da testo (text-to-image), modificarle (image-to-image) e ritoccarne porzioni (inpainting).
Requisiti reali: che computer serve
- GPU NVIDIA con almeno 6 GB di VRAM (8-12 GB consigliati): è lo scenario migliore. Con 6 GB lavori bene con Stable Diffusion 1.5 e a fatica con SDXL; con 12 GB o più gestisci SDXL e FLUX senza patemi.
- Mac con chip Apple Silicon (M1/M2/M3/M4): funziona tramite il backend MPS, più lento di una GPU NVIDIA equivalente ma usabile, soprattutto dai modelli M-Pro/Max in su.
- GPU AMD: possibile su Linux con ROCm, più complicato su Windows.
- Solo CPU: tecnicamente possibile, ma un'immagine può richiedere diversi minuti: sconsigliato se non per provare.
- Disco: almeno 15-20 GB liberi (i modelli pesano da 2 a 12 GB l'uno).
Quale strumento scegliere (e perché ComfyUI)
Per generare immagini in locale ci sono tre strade principali:
- ComfyUI — interfaccia «a nodi»: colleghi blocchi (carica modello → prompt → campionamento → salva). Più ripido da imparare, ma è il più flessibile, il più veloce ad adottare i nuovi modelli (SDXL, FLUX, video) e il più leggero in memoria. Prima scelta per chi vuole crescere.
- Automatic1111 / Forge — interfaccia «a moduli» classica, più immediata per chi inizia, enorme libreria di estensioni. Ottima alternativa se ComfyUI ti spaventa.
- Fooocus — pensato per la massima semplicità (assomiglia a Midjourney): pochissime impostazioni, risultati buoni con SDXL. Perfetto se vuoi solo «scrivi prompt, ottieni immagine».
Per questa guida usiamo ComfyUI perché è quello che ti porta più lontano e gira anche su hardware modesto. Tutti questi strumenti sono gratuiti e open source; l'unico «costo» è l'elettricità e il tempo di download dei modelli.

Installazione passo passo
Windows (il modo più semplice)
- Vai sulla pagina GitHub di ComfyUI e scarica il pacchetto «ComfyUI Windows Portable» (un file .7z).
- Estrai l'archivio in una cartella con spazio libero (ti serve 7-Zip).
- Scarica un modello (vedi sotto) e mettilo nella cartella
ComfyUI/models/checkpoints/. - Avvia
run_nvidia_gpu.bat(orun_cpu.batse non hai una GPU NVIDIA). Si apre una finestra del terminale e, dopo qualche secondo, il browser suhttp://127.0.0.1:8188.
Linux / Mac (da sorgente)
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
python3 -m venv venv
source venv/bin/activate
# GPU NVIDIA:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu124
# Mac Apple Silicon: pip install torch torchvision (usa MPS in automatico)
pip install -r requirements.txt
python main.py
Poi apri http://127.0.0.1:8188 nel browser. Su Mac, se vuoi più stabilità, aggiungi --force-fp16 al comando di avvio.
Consiglio per tutti: ComfyUI Manager
Installa l'estensione ComfyUI Manager (si clona dentro ComfyUI/custom_nodes/): aggiunge un pulsante «Manager» nell'interfaccia da cui scarichi modelli e nodi extra con un clic, senza smanettare a mano tra le cartelle.
Quali modelli scaricare
- Stable Diffusion 1.5 (~2 GB): leggero, gira ovunque, enorme ecosistema di varianti. Buono per iniziare e per PC modesti.
- Stable Diffusion XL (SDXL) base 1.0 (~6,5 GB): qualità nettamente superiore, immagini fino a 1024×1024 native. Vuole almeno 8 GB di VRAM per andare comodo.
- FLUX.1 [schnell] di Black Forest Labs (~12 GB, licenza Apache 2.0): tra i migliori modelli aperti per realismo e testo nelle immagini, e «schnell» significa veloce (poche iterazioni). Esiste anche FLUX.1 [dev], ancora più curato ma con licenza non commerciale.
Scarichi i file (formato .safetensors) da Hugging Face — cerca «stabilityai» per Stable Diffusion e «black-forest-labs» per FLUX — e li metti in ComfyUI/models/checkpoints/ (per FLUX servono anche i file VAE e text encoder nelle rispettive cartelle: il Manager te li scarica al posto giusto).
La tua prima immagine
- Apri ComfyUI: vedi già un workflow di esempio (i nodi «Load Checkpoint», «CLIP Text Encode» per prompt e prompt negativo, «KSampler», «VAE Decode», «Save Image»).
- Nel nodo «Load Checkpoint» seleziona il modello che hai scaricato.
- Nel campo del prompt positivo scrivi la tua descrizione (in inglese funziona meglio). Nel prompt negativo metti ciò che non vuoi (es.
blurry, low quality, extra fingers, watermark). - Premi «Queue Prompt». Dopo qualche secondo (o minuto su CPU) l'immagine compare nel nodo finale e viene salvata in
ComfyUI/output/.
Prompt da provare:
cinematic photo of an espresso cup on a marble table, soft morning light, shallow depth of field, 50mm, highly detailed — risultato atteso: una foto pulita, sfondo sfocato, luce calda.
flat vector illustration of a friendly robot reading a book, pastel colors, minimal, white background — risultato atteso: un'illustrazione piatta in stile icona, adatta a un blog.
storefront sign that reads "AI NOTIZIE", neon letters, night, rain reflections on the pavement, photorealistic — risultato atteso: con FLUX il testo nell'insegna viene leggibile, con SD 1.5 quasi mai.
Andare oltre: image-to-image, inpainting, LoRA
Una volta presa la mano: con image-to-image parti da una tua foto e la trasformi (cambi stile, illuminazione); con l'inpainting selezioni una zona dell'immagine e la rigeneri (togliere un oggetto, cambiare un volto); con i LoRA — piccoli file da poche decine di MB — aggiungi stili o soggetti specifici a un modello base. Su ComfyUI tutto questo si fa aggiungendo nodi: il Manager e i workflow condivisi online (li importi trascinando un'immagine PNG generata da altri, che porta dentro il suo workflow) accorciano la curva di apprendimento. Per video c'è il supporto a modelli come Stable Video Diffusion e altri, sempre come nodi.
Errori comuni e come risolverli
- «CUDA out of memory»: la GPU non ha abbastanza VRAM. Riduci la risoluzione (es. 768×768 invece di 1024), usa SD 1.5 al posto di SDXL, oppure avvia ComfyUI con
--lowvram(o--medvram). - L'immagine esce tutta nera: tipico problema di VAE/half precision. Avvia con
--no-half-vaeo, su Mac, con--force-fp16. - «Error: checkpoint not found»: il file del modello non è nella cartella giusta (
models/checkpoints/) o non hai premuto «Refresh»: ricarica la pagina del browser. - Generazione lentissima: stai girando su CPU. Verifica di aver avviato lo script «nvidia_gpu» e di avere i driver aggiornati; su laptop con doppia GPU, forza l'uso di quella dedicata.
- Mani e dita sbagliate: classico dei modelli di immagini. Aiuta un buon prompt negativo, modelli più recenti (SDXL, FLUX) e, se serve, l'inpainting sulla zona da correggere.
Quando NON usare l'IA in locale
Se generi due immagini al mese, l'installazione non vale la candela: i piani gratuiti di Bing Image Creator, Google ImageFX o lo stesso ChatGPT bastano. Se non hai una GPU decente e non hai un Mac Apple Silicon, l'esperienza sarà frustrante: meglio un servizio cloud (anche RunPod o Replicate, a consumo) o gli strumenti online. E ricorda: le immagini generate non sono «libere da tutto» — verifica la licenza del modello (FLUX schnell è Apache 2.0, FLUX dev no), non usare l'IA per imitare lo stile di artisti viventi a fini commerciali senza pensarci, e non creare immagini di persone reali senza consenso. Fatti questi conti, ComfyUI è lo strumento gratuito più potente che puoi tenere sul tuo disco.




