Generare immagini con l'intelligenza artificiale non richiede per forza un abbonamento a Midjourney o crediti da comprare. Con ComfyUI puoi far girare modelli come Stable Diffusion XL e FLUX direttamente sul tuo computer: gratis, senza limiti di immagini, senza censure di servizio e con i tuoi file che non lasciano mai il disco. In cambio devi installare qualche componente e avere una scheda video decente. Questa guida ti porta dall'installazione alla prima immagine, fino ai trucchi per non restare bloccato.
A chi serve questa guida e cosa ti serve davvero
E' pensata per chi vuole un controllo totale sulla generazione di immagini: creativi, sviluppatori, appassionati che vogliono sperimentare con modelli, LoRA e workflow personalizzati. Non serve saper programmare, ma non spaventarti se vedrai qualche comando da terminale.
Requisiti hardware reali, in ordine di importanza:
- GPU NVIDIA con almeno 8 GB di VRAM per SDXL; per FLUX.1 [dev] meglio 12 GB o piu'. E' la configurazione ideale.
- Mac con Apple Silicon (M1/M2/M3/M4): funziona, piu' lento di una GPU NVIDIA ma del tutto utilizzabile.
- Solo CPU: possibile ma molto lento (minuti per immagine), sconsigliato se non per provare.
- Spazio su disco: ComfyUI occupa pochi GB, ma i modelli pesano. SDXL e' circa 7 GB, FLUX.1 [dev] circa 24 GB. Tieni almeno 30–50 GB liberi.
Sistemi operativi supportati: Windows 10/11, macOS, Linux.
ComfyUI o le alternative? Quale scegliere
Non e' l'unico strumento per generare immagini in locale. Ecco un confronto sintetico per scegliere con cognizione:
| Strumento | Pro | Contro | Per chi |
|---|---|---|---|
| ComfyUI | Massima flessibilita', supporta tutti i modelli nuovi (FLUX, SD3.5), workflow a nodi riutilizzabili | Curva d'apprendimento iniziale | Chi vuole controllo e crescere nel tempo |
| Fooocus | Semplicissimo, "scrivi e genera" | Poco personalizzabile, meno aggiornato | Principianti assoluti |
| Automatic1111 / Forge | Interfaccia classica a schede, tante estensioni | Piu' lento ad adottare i modelli nuovissimi | Chi viene dal "vecchio" mondo SD |
Prima scelta consigliata: ComfyUI. A fronte di un po' di pazienza iniziale, e' lo strumento che invecchia meglio: i nuovi modelli arrivano qui per primi e i workflow a nodi, una volta capiti, ti danno una potenza che le interfacce "a pulsante" non offrono.
Passo 1: installare ComfyUI
Hai tre strade, dalla piu' semplice alla piu' controllabile. Scegline una.
Opzione A – App desktop (Windows e macOS, consigliata per iniziare)
Windows e macOS hanno un'app ufficiale: vai su comfy.org, scarica ComfyUI Desktop, installalo come un normale programma e avvialo. Gestisce da solo Python e le dipendenze. E' il modo piu' indolore per partire.
Opzione B – Comfy CLI (riga di comando, ordinata)
Se hai gia' Python 3.10+ installato, lo strumento ufficiale a riga di comando fa tutto in due passi:
pip install comfy-cli
comfy install
Al termine, per avviare il server:
comfy launch
Opzione C – Installazione manuale (massimo controllo)
Per chi vuole vedere tutto. Clona il repository e installa le dipendenze:
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt
Su GPU NVIDIA assicurati di avere la versione di PyTorch con supporto CUDA (il sito di PyTorch fornisce il comando esatto per la tua CUDA). Poi avvia:
python main.py
In tutti i casi, a installazione conclusa apri il browser su http://127.0.0.1:8188: e' l'interfaccia di ComfyUI.
Passo 2: installare ComfyUI-Manager (fondamentale)
Prima di tutto, installa ComfyUI-Manager: e' l'estensione che ti fa scaricare modelli e nodi mancanti con un clic, senza copiare file a mano. Nelle versioni desktop e CLI recenti e' spesso gia' incluso; se non lo e', lo trovi sul GitHub del progetto (ltdrdata/ComfyUI-Manager) clonandolo nella cartella custom_nodes. Dopo l'installazione, riavvia ComfyUI: comparira' un pulsante Manager nell'interfaccia. Da li' potrai installare i nodi mancanti di qualsiasi workflow con il tasto "Install Missing Custom Nodes".
Passo 3: scaricare un modello
ComfyUI senza modelli e' un motore senza benzina. Hai due scelte iniziali a seconda della tua VRAM.
SDXL (equilibrato, da 8 GB di VRAM)
Scarica il file sd_xl_base_1.0.safetensors dalla pagina di Stability AI su Hugging Face e copialo nella cartella ComfyUI/models/checkpoints/. Da terminale puoi usare lo strumento di Hugging Face:
pip install -U "huggingface_hub[cli]"
hf download stabilityai/stable-diffusion-xl-base-1.0 \
sd_xl_base_1.0.safetensors \
--local-dir ComfyUI/models/checkpoints
FLUX.1 [schnell] (qualita' alta, licenza aperta, veloce)
FLUX di Black Forest Labs e' oggi tra i modelli open piu' apprezzati per realismo e testo leggibile nelle immagini. La variante schnell e' rilasciata con licenza Apache 2.0 e genera in pochi passi. Scaricala cosi':
hf download black-forest-labs/FLUX.1-schnell \
flux1-schnell.safetensors \
--local-dir ComfyUI/models/checkpoints
FLUX richiede anche due encoder di testo (CLIP) e un VAE: il modo piu' semplice e' usare il template "FLUX" che trovi nei workflow di esempio di ComfyUI, che indica esattamente i file da scaricare e dove metterli (cartelle models/clip e models/vae). Il Manager puo' scaricarli per te.
Passo 4: la tua prima immagine
All'avvio, ComfyUI carica un workflow di esempio per il testo-immagine. E' un grafo di nodi collegati che rappresenta, visivamente, la "pipeline" di generazione:
- Load Checkpoint: seleziona qui il modello che hai scaricato.
- CLIP Text Encode (Prompt): ci sono due nodi, uno per il prompt positivo (cosa vuoi) e uno per il negativo (cosa evitare).
- KSampler: il cuore della generazione. Qui imposti steps (passi: 20–30 per SDXL; per FLUX schnell bastano 4), CFG (quanto il modello segue il prompt: 6–8 per SDXL, basso per FLUX), sampler e seed (il numero casuale che rende un'immagine ripetibile).
- VAE Decode e Save Image: trasformano il risultato in un'immagine e la salvano.
Scrivi il tuo testo nel nodo del prompt positivo e premi Queue Prompt (o Ctrl+Invio). Dopo qualche secondo l'immagine compare nel nodo finale e viene salvata nella cartella ComfyUI/output.
Ecco tre prompt copiabili per partire (in inglese, perche' i modelli rendono meglio):
1) "professional product photo of a ceramic coffee cup on a marble table, soft window light, shallow depth of field, 50mm lens, photorealistic, high detail"
2) "cozy bookshop interior, warm afternoon light, plants, wooden shelves, watercolor illustration style, soft colors"
3) "a vintage travel poster of the Dolomites mountains at sunrise, flat design, bold typography 'DOLOMITI', retro color palette"
Risultato atteso: una foto-prodotto pulita con sfondo sfocato (1), un'illustrazione calda in stile acquerello (2) e un poster grafico con scritta leggibile — il terzo prompt e' un buon test per FLUX, che gestisce il testo meglio di SDXL.
Errori comuni e come risolverli
- "Torch not compiled with CUDA enabled": hai PyTorch in versione CPU. Reinstalla la versione con CUDA seguendo il comando ufficiale di PyTorch per la tua scheda.
- "CUDA out of memory" o "torch.OutOfMemoryError": la VRAM non basta. Avvia con la modalita' a basso consumo —
python main.py --lowvram(o--medvram) — usa una versione fp8 del modello, oppure abbassa la risoluzione (1024x1024 per SDXL, non di piu'). - Nodi rossi / "Missing node types": il workflow usa nodi che non hai. Apri il Manager e clicca "Install Missing Custom Nodes", poi riavvia.
- Il checkpoint non compare nel menu Load Checkpoint: hai messo il file nella cartella sbagliata o non hai aggiornato la lista. Verifica che sia in
models/checkpointse ricarica la pagina. - Immagini sgranate o "rumorose": troppi pochi step o CFG sbagliato. Aumenta gli step (SDXL) o controlla che, con FLUX, il CFG sia basso come previsto dal template.
Varianti e passi successivi
Una volta a tuo agio con il testo-immagine, ComfyUI apre un mondo:
- img2img: parti da un'immagine esistente e modificala con un prompt.
- LoRA: piccoli file (da 10 a 500 MB) che aggiungono uno stile o un soggetto specifico; si caricano con un nodo dedicato e si scaricano da Civitai o Hugging Face.
- ControlNet: guida la composizione partendo da uno scheletro, una posa o i contorni di un'immagine.
- Upscaling: porta le immagini a risoluzioni alte con nodi di ingrandimento.
Il bello di ComfyUI e' che ogni workflow e' un file JSON: puoi salvarlo, condividerlo e ricaricarlo trascinandolo nell'interfaccia. La community ne pubblica a migliaia.
Quando NON usare l'approccio locale
Se generi immagini una volta ogni tanto, non hai una GPU adeguata o non vuoi gestire installazioni, i servizi cloud (Midjourney, DALL-E in ChatGPT, o lo stesso ComfyUI ospitato online) sono piu' comodi. La generazione in locale conviene quando produci tante immagini, ti serve riservatezza totale sui contenuti, vuoi modelli e stili che i servizi commerciali non offrono, o semplicemente vuoi imparare come funziona davvero la generazione per immagini. In tutti questi casi, ComfyUI e' lo strumento giusto da cui partire.




