ComfyUI: generare immagini IA in locale gratis

Generare immagini con l'IA senza pagare abbonamenti, senza limiti di crediti e senza inviare i tuoi prompt a un servizio cloud: è possibile installando ComfyUI, l'interfaccia a nodi più potente e flessibile per far girare Stable Diffusion e i modelli aperti più recenti direttamente sul tuo computer. In questa guida partiamo da zero: requisiti, installazione, download di un modello, primo workflow e prompt di prova.

A chi serve e cosa otterrai

Questa guida è per chi vuole il pieno controllo sulla generazione di immagini — creativi, sviluppatori, appassionati — ed è disposto a investire un'ora nella configurazione iniziale. Alla fine avrai ComfyUI funzionante e sarai in grado di generare immagini da testo, salvarle e iniziare a sperimentare con workflow avanzati. Tutto in locale e gratuito (a parte il costo dell'energia e del tuo hardware).

Requisiti hardware reali

ComfyUI gira meglio con una scheda video NVIDIA. Indicazioni pratiche:

NVIDIA con 6-8 GB di VRAM: sufficiente per modelli SDXL a risoluzioni standard (1024x1024). Con 12 GB o più lavori comodo anche con i modelli Flux.
Mac con Apple Silicon (M1/M2/M3/M4): supportato, più lento delle GPU NVIDIA ma utilizzabile.
Solo CPU o GPU AMD: possibile ma lento; su AMD servono configurazioni specifiche (ROCm su Linux o DirectML su Windows).
Spazio su disco: i modelli pesano da 2 a oltre 12 GB ciascuno; tieni liberi almeno 20-30 GB.

Quale strumento scegliere? ComfyUI è la prima scelta se vuoi flessibilità e workflow riproducibili. Se preferisci un'interfaccia più semplice, valuta Fooocus (zero configurazione, ottimo per iniziare) o Automatic1111; se non hai un PC adatto, restano i servizi online come quelli basati su Stable Diffusion o i generatori commerciali, che però sono a pagamento o con limiti.

Con ComfyUI puoi generare immagini in locale, senza crediti né limiti di un servizio cloud.

Passo 1: installare ComfyUI

Hai due strade. La più semplice è l'app ComfyUI Desktop: scarica l'installer dal sito ufficiale (per Windows e macOS), eseguilo e avrai tutto pronto, aggiornamenti inclusi.

La via "manuale", più adatta a chi vuole controllo, parte dal repository GitHub. Su Windows con GPU NVIDIA puoi scaricare il pacchetto portatile; su Linux/macOS o per chi preferisce, si clona il progetto e si installa in un ambiente Python dedicato:

git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
python -m venv venv
source venv/bin/activate   # su Windows: venv\Scripts\activate
pip install -r requirements.txt

Per le GPU NVIDIA installa la versione di PyTorch con supporto CUDA seguendo le istruzioni del repository. Poi avvii il server:

python main.py

Apri il browser all'indirizzo che compare nel terminale (di norma http://127.0.0.1:8188): è l'interfaccia di ComfyUI.

Passo 2: scaricare un modello

ComfyUI senza un modello non genera nulla. Un modello (detto "checkpoint") è il file che contiene la "conoscenza" per creare immagini. Due ottime opzioni gratuite:

Stable Diffusion XL (SDXL): equilibrato, ben supportato, gira anche con 6-8 GB di VRAM. Si scarica da Hugging Face.
Flux (versioni aperte): qualità superiore, soprattutto su testi e dettagli, ma più pesante e affamato di VRAM.

Scarica il file del checkpoint (estensione .safetensors) e copialo nella cartella ComfyUI/models/checkpoints. Puoi farlo manualmente dal sito di Hugging Face oppure da terminale:

pip install -U "huggingface_hub[cli]"
huggingface-cli download stabilityai/stable-diffusion-xl-base-1.0 sd_xl_base_1.0.safetensors --local-dir ComfyUI/models/checkpoints

Riavvia ComfyUI (o premi "Refresh") perché rilevi il nuovo modello.

Passo 3: il primo workflow e il prompt di prova

All'avvio ComfyUI mostra un workflow predefinito già pronto per il testo-immagine. I nodi principali sono: Load Checkpoint (seleziona il modello scaricato), due nodi di testo per il prompt positivo (cosa vuoi) e negativo (cosa non vuoi), un nodo KSampler (i parametri di generazione) e Save Image (salva il risultato).

Imposta nel nodo Load Checkpoint il tuo modello, scrivi il prompt e premi "Queue Prompt". Esempio di prompt positivo in inglese (i modelli rispondono meglio all'inglese):

cinematic photo of an old Italian artisan workshop, warm light from a window, wooden tools on a table, highly detailed, 50mm, shallow depth of field

Prompt negativo tipico, per evitare difetti comuni:

blurry, low quality, deformed hands, extra fingers, watermark, text, oversaturated

Parametri di partenza nel KSampler: steps 25-30, cfg 6-8, sampler "dpmpp_2m" con scheduler "karras", risoluzione 1024x1024 per SDXL. Dopo pochi secondi (o qualche decina, secondo la GPU) troverai l'immagine nella cartella ComfyUI/output.

Passo 4: varianti e funzioni avanzate

Seed: nel KSampler il "seed" determina la casualità. Fissalo per riprodurre la stessa immagine, cambialo per esplorare varianti.
LoRA: piccoli file aggiuntivi che modificano lo stile o introducono soggetti specifici. Si mettono in models/loras e si collegano con un nodo "Load LoRA".
img2img: parti da un'immagine esistente invece che dal rumore, per ritoccarla o cambiarne lo stile.
Upscaling: aggiungi nodi di ingrandimento per portare l'immagine a risoluzioni più alte mantenendo i dettagli.

La forza di ComfyUI è che ogni workflow si salva ed è condivisibile: trascinando un'immagine generata dentro l'interfaccia, ComfyUI ne ricostruisce il workflow completo. È il modo migliore per imparare da quelli pubblicati dalla community.

Errori comuni e soluzioni

"CUDA out of memory": la VRAM non basta. Riduci la risoluzione (es. 768x768), genera una immagine alla volta o avvia con il flag --lowvram (o --medvram).
Il modello non compare: file nella cartella sbagliata o ComfyUI non riavviato. Controlla che il .safetensors sia in models/checkpoints e premi Refresh.
Immagini deformate o "bruciate": cfg troppo alto. Abbassalo a 5-7 e aumenta leggermente gli steps.
Mani e dita sbagliate: problema noto; aiutano un buon prompt negativo, modelli più recenti come Flux e, in caso, un ritocco con img2img.
Generazione lentissima su Mac/CPU: normale senza GPU NVIDIA; riduci risoluzione e steps, oppure valuta un servizio cloud per i lavori pesanti.

Quando NON usare ComfyUI e come proseguire

Se ti serve solo qualche immagine occasionale e non vuoi gestire driver, modelli e VRAM, ComfyUI è probabilmente eccessivo: meglio Fooocus o un servizio online. Ma se vuoi controllo totale, riproducibilità e zero costi ricorrenti, è lo strumento di riferimento. Da qui puoi proseguire studiando i workflow della community, provando i modelli Flux per la massima qualità e integrando LoRA per definire uno stile coerente. E ricorda: le immagini generate con l'IA andrebbero etichettate come tali quando pubblicate, soprattutto in contesti informativi.