ComfyUI: generare immagini IA in locale gratis

Generare immagini con l'intelligenza artificiale non richiede per forza un abbonamento a Midjourney o crediti da comprare. Con ComfyUI puoi far girare modelli come Stable Diffusion XL e FLUX direttamente sul tuo computer: gratis, senza limiti di immagini, senza censure di servizio e con i tuoi file che non lasciano mai il disco. In cambio devi installare qualche componente e avere una scheda video decente. Questa guida ti porta dall'installazione alla prima immagine, fino ai trucchi per non restare bloccato.

A chi serve questa guida e cosa ti serve davvero

E' pensata per chi vuole un controllo totale sulla generazione di immagini: creativi, sviluppatori, appassionati che vogliono sperimentare con modelli, LoRA e workflow personalizzati. Non serve saper programmare, ma non spaventarti se vedrai qualche comando da terminale.

Requisiti hardware reali, in ordine di importanza:

GPU NVIDIA con almeno 8 GB di VRAM per SDXL; per FLUX.1 [dev] meglio 12 GB o piu'. E' la configurazione ideale.
Mac con Apple Silicon (M1/M2/M3/M4): funziona, piu' lento di una GPU NVIDIA ma del tutto utilizzabile.
Solo CPU: possibile ma molto lento (minuti per immagine), sconsigliato se non per provare.
Spazio su disco: ComfyUI occupa pochi GB, ma i modelli pesano. SDXL e' circa 7 GB, FLUX.1 [dev] circa 24 GB. Tieni almeno 30–50 GB liberi.

Sistemi operativi supportati: Windows 10/11, macOS, Linux.

ComfyUI o le alternative? Quale scegliere

Non e' l'unico strumento per generare immagini in locale. Ecco un confronto sintetico per scegliere con cognizione:

Strumento	Pro	Contro	Per chi
ComfyUI	Massima flessibilita', supporta tutti i modelli nuovi (FLUX, SD3.5), workflow a nodi riutilizzabili	Curva d'apprendimento iniziale	Chi vuole controllo e crescere nel tempo
Fooocus	Semplicissimo, "scrivi e genera"	Poco personalizzabile, meno aggiornato	Principianti assoluti
Automatic1111 / Forge	Interfaccia classica a schede, tante estensioni	Piu' lento ad adottare i modelli nuovissimi	Chi viene dal "vecchio" mondo SD

Prima scelta consigliata: ComfyUI. A fronte di un po' di pazienza iniziale, e' lo strumento che invecchia meglio: i nuovi modelli arrivano qui per primi e i workflow a nodi, una volta capiti, ti danno una potenza che le interfacce "a pulsante" non offrono.

Passo 1: installare ComfyUI

Hai tre strade, dalla piu' semplice alla piu' controllabile. Scegline una.

Opzione A – App desktop (Windows e macOS, consigliata per iniziare)

Windows e macOS hanno un'app ufficiale: vai su comfy.org, scarica ComfyUI Desktop, installalo come un normale programma e avvialo. Gestisce da solo Python e le dipendenze. E' il modo piu' indolore per partire.

Opzione B – Comfy CLI (riga di comando, ordinata)

Se hai gia' Python 3.10+ installato, lo strumento ufficiale a riga di comando fa tutto in due passi:

pip install comfy-cli
comfy install

Al termine, per avviare il server:

comfy launch

Opzione C – Installazione manuale (massimo controllo)

Per chi vuole vedere tutto. Clona il repository e installa le dipendenze:

git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt

Su GPU NVIDIA assicurati di avere la versione di PyTorch con supporto CUDA (il sito di PyTorch fornisce il comando esatto per la tua CUDA). Poi avvia:

python main.py

In tutti i casi, a installazione conclusa apri il browser su http://127.0.0.1:8188: e' l'interfaccia di ComfyUI.

Passo 2: installare ComfyUI-Manager (fondamentale)

Prima di tutto, installa ComfyUI-Manager: e' l'estensione che ti fa scaricare modelli e nodi mancanti con un clic, senza copiare file a mano. Nelle versioni desktop e CLI recenti e' spesso gia' incluso; se non lo e', lo trovi sul GitHub del progetto (ltdrdata/ComfyUI-Manager) clonandolo nella cartella custom_nodes. Dopo l'installazione, riavvia ComfyUI: comparira' un pulsante Manager nell'interfaccia. Da li' potrai installare i nodi mancanti di qualsiasi workflow con il tasto "Install Missing Custom Nodes".

Una GPU con almeno 8 GB di VRAM rende la generazione locale fluida; con meno memoria esistono comunque modalita' dedicate.

Passo 3: scaricare un modello

ComfyUI senza modelli e' un motore senza benzina. Hai due scelte iniziali a seconda della tua VRAM.

SDXL (equilibrato, da 8 GB di VRAM)

Scarica il file sd_xl_base_1.0.safetensors dalla pagina di Stability AI su Hugging Face e copialo nella cartella ComfyUI/models/checkpoints/. Da terminale puoi usare lo strumento di Hugging Face:

pip install -U "huggingface_hub[cli]"
hf download stabilityai/stable-diffusion-xl-base-1.0 \
  sd_xl_base_1.0.safetensors \
  --local-dir ComfyUI/models/checkpoints

FLUX.1 [schnell] (qualita' alta, licenza aperta, veloce)

FLUX di Black Forest Labs e' oggi tra i modelli open piu' apprezzati per realismo e testo leggibile nelle immagini. La variante schnell e' rilasciata con licenza Apache 2.0 e genera in pochi passi. Scaricala cosi':

hf download black-forest-labs/FLUX.1-schnell \
  flux1-schnell.safetensors \
  --local-dir ComfyUI/models/checkpoints

FLUX richiede anche due encoder di testo (CLIP) e un VAE: il modo piu' semplice e' usare il template "FLUX" che trovi nei workflow di esempio di ComfyUI, che indica esattamente i file da scaricare e dove metterli (cartelle models/clip e models/vae). Il Manager puo' scaricarli per te.

Passo 4: la tua prima immagine

All'avvio, ComfyUI carica un workflow di esempio per il testo-immagine. E' un grafo di nodi collegati che rappresenta, visivamente, la "pipeline" di generazione:

Load Checkpoint: seleziona qui il modello che hai scaricato.
CLIP Text Encode (Prompt): ci sono due nodi, uno per il prompt positivo (cosa vuoi) e uno per il negativo (cosa evitare).
KSampler: il cuore della generazione. Qui imposti steps (passi: 20–30 per SDXL; per FLUX schnell bastano 4), CFG (quanto il modello segue il prompt: 6–8 per SDXL, basso per FLUX), sampler e seed (il numero casuale che rende un'immagine ripetibile).
VAE Decode e Save Image: trasformano il risultato in un'immagine e la salvano.

Scrivi il tuo testo nel nodo del prompt positivo e premi Queue Prompt (o Ctrl+Invio). Dopo qualche secondo l'immagine compare nel nodo finale e viene salvata nella cartella ComfyUI/output.

Ecco tre prompt copiabili per partire (in inglese, perche' i modelli rendono meglio):

1) "professional product photo of a ceramic coffee cup on a marble table, soft window light, shallow depth of field, 50mm lens, photorealistic, high detail"

2) "cozy bookshop interior, warm afternoon light, plants, wooden shelves, watercolor illustration style, soft colors"

3) "a vintage travel poster of the Dolomites mountains at sunrise, flat design, bold typography 'DOLOMITI', retro color palette"

Risultato atteso: una foto-prodotto pulita con sfondo sfocato (1), un'illustrazione calda in stile acquerello (2) e un poster grafico con scritta leggibile — il terzo prompt e' un buon test per FLUX, che gestisce il testo meglio di SDXL.

Errori comuni e come risolverli

"Torch not compiled with CUDA enabled": hai PyTorch in versione CPU. Reinstalla la versione con CUDA seguendo il comando ufficiale di PyTorch per la tua scheda.
"CUDA out of memory" o "torch.OutOfMemoryError": la VRAM non basta. Avvia con la modalita' a basso consumo — python main.py --lowvram (o --medvram) — usa una versione fp8 del modello, oppure abbassa la risoluzione (1024x1024 per SDXL, non di piu').
Nodi rossi / "Missing node types": il workflow usa nodi che non hai. Apri il Manager e clicca "Install Missing Custom Nodes", poi riavvia.
Il checkpoint non compare nel menu Load Checkpoint: hai messo il file nella cartella sbagliata o non hai aggiornato la lista. Verifica che sia in models/checkpoints e ricarica la pagina.
Immagini sgranate o "rumorose": troppi pochi step o CFG sbagliato. Aumenta gli step (SDXL) o controlla che, con FLUX, il CFG sia basso come previsto dal template.

Varianti e passi successivi

Una volta a tuo agio con il testo-immagine, ComfyUI apre un mondo:

img2img: parti da un'immagine esistente e modificala con un prompt.
LoRA: piccoli file (da 10 a 500 MB) che aggiungono uno stile o un soggetto specifico; si caricano con un nodo dedicato e si scaricano da Civitai o Hugging Face.
ControlNet: guida la composizione partendo da uno scheletro, una posa o i contorni di un'immagine.
Upscaling: porta le immagini a risoluzioni alte con nodi di ingrandimento.

Il bello di ComfyUI e' che ogni workflow e' un file JSON: puoi salvarlo, condividerlo e ricaricarlo trascinandolo nell'interfaccia. La community ne pubblica a migliaia.

Quando NON usare l'approccio locale

Se generi immagini una volta ogni tanto, non hai una GPU adeguata o non vuoi gestire installazioni, i servizi cloud (Midjourney, DALL-E in ChatGPT, o lo stesso ComfyUI ospitato online) sono piu' comodi. La generazione in locale conviene quando produci tante immagini, ti serve riservatezza totale sui contenuti, vuoi modelli e stili che i servizi commerciali non offrono, o semplicemente vuoi imparare come funziona davvero la generazione per immagini. In tutti questi casi, ComfyUI e' lo strumento giusto da cui partire.

ComfyUI: generare immagini con l'IA in locale, gratis

A chi serve questa guida e cosa ti serve davvero

ComfyUI o le alternative? Quale scegliere

Passo 1: installare ComfyUI

Opzione A – App desktop (Windows e macOS, consigliata per iniziare)

Opzione B – Comfy CLI (riga di comando, ordinata)

Opzione C – Installazione manuale (massimo controllo)

Passo 2: installare ComfyUI-Manager (fondamentale)

Passo 3: scaricare un modello

SDXL (equilibrato, da 8 GB di VRAM)

FLUX.1 [schnell] (qualita' alta, licenza aperta, veloce)

Passo 4: la tua prima immagine

Errori comuni e come risolverli

Varianti e passi successivi

Quando NON usare l'approccio locale

Fonti

Andrea Bertolotti

📬 Newsletter di AI Notizie

Continua a leggere

API di Gemini in Python: la guida pratica da zero

Tradurre documenti e siti con l'IA mantenendo il formato

LM Studio: usare un'IA in locale senza riga di comando

API di Claude (Anthropic) in Python: la guida pratica