Generare immagini con l'IA senza pagare abbonamenti, senza limiti di crediti e senza inviare i tuoi prompt a un servizio cloud: è possibile installando ComfyUI, l'interfaccia a nodi più potente e flessibile per far girare Stable Diffusion e i modelli aperti più recenti direttamente sul tuo computer. In questa guida partiamo da zero: requisiti, installazione, download di un modello, primo workflow e prompt di prova.
A chi serve e cosa otterrai
Questa guida è per chi vuole il pieno controllo sulla generazione di immagini — creativi, sviluppatori, appassionati — ed è disposto a investire un'ora nella configurazione iniziale. Alla fine avrai ComfyUI funzionante e sarai in grado di generare immagini da testo, salvarle e iniziare a sperimentare con workflow avanzati. Tutto in locale e gratuito (a parte il costo dell'energia e del tuo hardware).
Requisiti hardware reali
ComfyUI gira meglio con una scheda video NVIDIA. Indicazioni pratiche:
- NVIDIA con 6-8 GB di VRAM: sufficiente per modelli SDXL a risoluzioni standard (1024x1024). Con 12 GB o più lavori comodo anche con i modelli Flux.
- Mac con Apple Silicon (M1/M2/M3/M4): supportato, più lento delle GPU NVIDIA ma utilizzabile.
- Solo CPU o GPU AMD: possibile ma lento; su AMD servono configurazioni specifiche (ROCm su Linux o DirectML su Windows).
- Spazio su disco: i modelli pesano da 2 a oltre 12 GB ciascuno; tieni liberi almeno 20-30 GB.
Quale strumento scegliere? ComfyUI è la prima scelta se vuoi flessibilità e workflow riproducibili. Se preferisci un'interfaccia più semplice, valuta Fooocus (zero configurazione, ottimo per iniziare) o Automatic1111; se non hai un PC adatto, restano i servizi online come quelli basati su Stable Diffusion o i generatori commerciali, che però sono a pagamento o con limiti.
Passo 1: installare ComfyUI
Hai due strade. La più semplice è l'app ComfyUI Desktop: scarica l'installer dal sito ufficiale (per Windows e macOS), eseguilo e avrai tutto pronto, aggiornamenti inclusi.
La via "manuale", più adatta a chi vuole controllo, parte dal repository GitHub. Su Windows con GPU NVIDIA puoi scaricare il pacchetto portatile; su Linux/macOS o per chi preferisce, si clona il progetto e si installa in un ambiente Python dedicato:
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
python -m venv venv
source venv/bin/activate # su Windows: venv\Scripts\activate
pip install -r requirements.txt
Per le GPU NVIDIA installa la versione di PyTorch con supporto CUDA seguendo le istruzioni del repository. Poi avvii il server:
python main.py
Apri il browser all'indirizzo che compare nel terminale (di norma http://127.0.0.1:8188): è l'interfaccia di ComfyUI.
Passo 2: scaricare un modello
ComfyUI senza un modello non genera nulla. Un modello (detto "checkpoint") è il file che contiene la "conoscenza" per creare immagini. Due ottime opzioni gratuite:
- Stable Diffusion XL (SDXL): equilibrato, ben supportato, gira anche con 6-8 GB di VRAM. Si scarica da Hugging Face.
- Flux (versioni aperte): qualità superiore, soprattutto su testi e dettagli, ma più pesante e affamato di VRAM.
Scarica il file del checkpoint (estensione .safetensors) e copialo nella cartella ComfyUI/models/checkpoints. Puoi farlo manualmente dal sito di Hugging Face oppure da terminale:
pip install -U "huggingface_hub[cli]"
huggingface-cli download stabilityai/stable-diffusion-xl-base-1.0 sd_xl_base_1.0.safetensors --local-dir ComfyUI/models/checkpoints
Riavvia ComfyUI (o premi "Refresh") perché rilevi il nuovo modello.
Passo 3: il primo workflow e il prompt di prova
All'avvio ComfyUI mostra un workflow predefinito già pronto per il testo-immagine. I nodi principali sono: Load Checkpoint (seleziona il modello scaricato), due nodi di testo per il prompt positivo (cosa vuoi) e negativo (cosa non vuoi), un nodo KSampler (i parametri di generazione) e Save Image (salva il risultato).
Imposta nel nodo Load Checkpoint il tuo modello, scrivi il prompt e premi "Queue Prompt". Esempio di prompt positivo in inglese (i modelli rispondono meglio all'inglese):
cinematic photo of an old Italian artisan workshop, warm light from a window, wooden tools on a table, highly detailed, 50mm, shallow depth of field
Prompt negativo tipico, per evitare difetti comuni:
blurry, low quality, deformed hands, extra fingers, watermark, text, oversaturated
Parametri di partenza nel KSampler: steps 25-30, cfg 6-8, sampler "dpmpp_2m" con scheduler "karras", risoluzione 1024x1024 per SDXL. Dopo pochi secondi (o qualche decina, secondo la GPU) troverai l'immagine nella cartella ComfyUI/output.
Passo 4: varianti e funzioni avanzate
- Seed: nel KSampler il "seed" determina la casualità. Fissalo per riprodurre la stessa immagine, cambialo per esplorare varianti.
- LoRA: piccoli file aggiuntivi che modificano lo stile o introducono soggetti specifici. Si mettono in
models/lorase si collegano con un nodo "Load LoRA". - img2img: parti da un'immagine esistente invece che dal rumore, per ritoccarla o cambiarne lo stile.
- Upscaling: aggiungi nodi di ingrandimento per portare l'immagine a risoluzioni più alte mantenendo i dettagli.
La forza di ComfyUI è che ogni workflow si salva ed è condivisibile: trascinando un'immagine generata dentro l'interfaccia, ComfyUI ne ricostruisce il workflow completo. È il modo migliore per imparare da quelli pubblicati dalla community.
Errori comuni e soluzioni
- "CUDA out of memory": la VRAM non basta. Riduci la risoluzione (es. 768x768), genera una immagine alla volta o avvia con il flag
--lowvram(o--medvram). - Il modello non compare: file nella cartella sbagliata o ComfyUI non riavviato. Controlla che il
.safetensorssia inmodels/checkpointse premi Refresh. - Immagini deformate o "bruciate": cfg troppo alto. Abbassalo a 5-7 e aumenta leggermente gli steps.
- Mani e dita sbagliate: problema noto; aiutano un buon prompt negativo, modelli più recenti come Flux e, in caso, un ritocco con img2img.
- Generazione lentissima su Mac/CPU: normale senza GPU NVIDIA; riduci risoluzione e steps, oppure valuta un servizio cloud per i lavori pesanti.
Quando NON usare ComfyUI e come proseguire
Se ti serve solo qualche immagine occasionale e non vuoi gestire driver, modelli e VRAM, ComfyUI è probabilmente eccessivo: meglio Fooocus o un servizio online. Ma se vuoi controllo totale, riproducibilità e zero costi ricorrenti, è lo strumento di riferimento. Da qui puoi proseguire studiando i workflow della community, provando i modelli Flux per la massima qualità e integrando LoRA per definire uno stile coerente. E ricorda: le immagini generate con l'IA andrebbero etichettate come tali quando pubblicate, soprattutto in contesti informativi.




