FLUX.2: il modello aperto per immagini con testo leggibile

Se vuoi generare immagini con l'IA e ti serve che il testo dentro l'immagine sia leggibile — un manifesto, un'infografica, la copertina di un menù, l'interfaccia finta di un'app — il modello aperto più potente oggi è FLUX.2 di Black Forest Labs, il laboratorio tedesco fondato da ex creatori di Stable Diffusion. Presentato il 25 novembre 2025 e maturato nei mesi successivi con il supporto di strumenti come ComfyUI e le ottimizzazioni per le GPU NVIDIA, FLUX.2 è diventato il riferimento per chi vuole qualità da modello commerciale ma con pesi scaricabili e gratuiti. Vediamo le sue versioni e, soprattutto, come provarlo.

Le quattro versioni di FLUX.2: quale scegliere

FLUX.2 non è un modello unico ma una famiglia, pensata per usi e hardware diversi:

FLUX.2 [pro]: la versione di massima qualità, accessibile solo via API a pagamento. È quella che dà i risultati migliori, senza dover gestire hardware.
FLUX.2 [flex]: offre controllo fine su parametri come il numero di passi di generazione e l'aderenza al prompt, per chi vuole mettere le mani sotto il cofano.
FLUX.2 [dev]: il modello aperto da 32 miliardi di parametri, scaricabile da Hugging Face. La licenza è non commerciale: ottimo per sperimentare, studiare e progetti personali.
FLUX.2 [klein]: una versione compatta da 4 miliardi di parametri rilasciata con licenza Apache 2.0, quindi usabile anche commercialmente. È la scelta giusta per chi ha una GPU modesta o vuole integrare la generazione immagini in un prodotto.

Cosa lo distingue: testo leggibile, 4 megapixel e dieci riferimenti

Il punto di forza più celebrato di FLUX.2 è la resa del testo. Generare scritte corrette e leggibili dentro un'immagine è da sempre uno dei problemi più difficili per i modelli di diffusione: FLUX.2 lo affronta bene, producendo tipografia, infografiche, mockup di interfacce e persino meme con testo coerente. A questo si aggiungono una risoluzione e una capacità di editing fino a 4 megapixel e la possibilità di usare fino a 10 immagini di riferimento contemporaneamente, per mantenere coerenti uno stile, un personaggio o un prodotto attraverso più generazioni.

Sul piano tecnico, la versione aperta da 32 miliardi di parametri accoppia un modello di linguaggio visivo a un transformer che lavora sui "latenti" dell'immagine: è questa combinazione a dare a FLUX.2 la sua comprensione fine delle richieste in linguaggio naturale.

FLUX.2 eccelle nella resa del testo dentro l'immagine: utile per manifesti, infografiche e mockup.

Quanto costa: playground gratuito e API a pagamento

Il modo più rapido e gratuito per provarlo è il playground ufficiale sul sito di Black Forest Labs, dove si generano immagini direttamente dal browser. Per usi intensivi o in produzione c'è l'API a pagamento (con prezzi per immagine generata) e diversi provider di inferenza che ospitano il modello. I pesi, infine, si scaricano gratis: la versione [dev] per uso non commerciale, la [klein] anche per uso commerciale grazie alla licenza Apache 2.0.

Come provarlo subito, dal web e in locale

Per la prova senza installare nulla, vai sul playground di Black Forest Labs oppure su uno degli Space dedicati su Hugging Face, scrivi il prompt e genera. Un esempio pensato apposta per mettere alla prova la resa del testo:

Prima pagina di un giornale italiano d'epoca con il titolo a caratteri cubitali "INTELLIGENZA ARTIFICIALE", stile fotorealistico, carta ingiallita, 4 megapixel.

Chi ha una GPU adeguata può invece eseguire FLUX.2 in locale con la libreria Diffusers di Hugging Face:

pip install -U diffusers transformers accelerate

# Esempio in Python
import torch
from diffusers import DiffusionPipeline

pipe = DiffusionPipeline.from_pretrained(
    "black-forest-labs/FLUX.2-dev",
    dtype=torch.bfloat16,
    device_map="cuda",
)
prompt = "Un manifesto minimalista con la scritta 'AI NOTIZIE' in grande, stile bauhaus, colori vivaci"
immagine = pipe(prompt=prompt).images[0]
immagine.save("manifesto.png")

Per chi preferisce un'interfaccia grafica a nodi, FLUX.2 è supportato anche da ComfyUI, con versioni quantizzate (FP8) e ottimizzazioni per le schede NVIDIA RTX che riducono in modo sensibile la memoria video necessaria. La versione [klein] da 4 miliardi di parametri è quella più adatta a girare su GPU di fascia consumer.

Quando usare FLUX.2 e quali sono le alternative

FLUX.2 è la scelta migliore quando vuoi qualità alta, controllo sul testo nell'immagine e la libertà di eseguire il modello in casa o di integrarlo (con la versione Apache) in un prodotto. Se invece cerchi la massima resa artistica senza pensare all'hardware, restano valide alternative commerciali come Midjourney e Imagen di Google; per il fotorealismo o per chi è già nell'ecosistema OpenAI, c'è la generazione immagini integrata in ChatGPT. E se vuoi il massimo della personalizzazione open con una comunità enorme di estensioni, l'universo di Stable Diffusion resta un punto di riferimento. La forza di FLUX.2 è proprio stare nel mezzo: qualità vicina ai modelli chiusi, ma con pesi che puoi scaricare e controllare tu.