Il 28 maggio 2026 ElevenLabs ha presentato Dubbing v2, una nuova generazione del suo modello di doppiaggio automatico. La promessa che lo distingue dai sistemi precedenti e' una sola, ma pesante: per la prima volta l'emozione e l'interpretazione di chi parla nell'originale vengono trasportate in ogni lingua di destinazione. Niente piu' voci tradotte ma piatte: tono, ritmo, pause e intenzione emotiva restano riconoscibili.

Cosa cambia rispetto a prima

I doppiatori automatici di generazione precedente funzionavano in due fasi distinte: trascrizione e traduzione del parlato, poi sintesi di una nuova voce. Il problema e' che la sintesi partiva dal testo, perdendo per strada la recitazione originale. Dubbing v2, secondo ElevenLabs, si condiziona direttamente sulla performance vocale di partenza: ascolta come e' stata detta una frase — con quale enfasi, quale velocita', quale emozione — e riproduce quelle caratteristiche nella lingua tradotta. Il supporto dichiarato e' di oltre 90 lingue e accenti.

E' una differenza che si sente. Nel doppiaggio tradizionale automatico, un discorso appassionato diventava spesso una lettura monocorde; una battuta ironica perdeva il sorriso nella voce. Conservare l'interpretazione significa che un video motivazionale resta motivante anche in tedesco, e che l'enfasi su una parola chiave rimane dove l'autore l'aveva messa. Per chi crea contenuti, e' la differenza tra una traduzione che funziona e una che suona finta.

Dubbing v2 conserva tono, ritmo ed emozione della voce originale.

Dove si trova e come provarlo

Dubbing v2 e' disponibile dentro ElevenCreative e tramite ElevenProductions, oltre che nel Dubbing Studio della piattaforma. Il flusso di lavoro e' pensato per essere semplice anche senza competenze tecniche. Ecco i passaggi tipici:

  1. Crea un account su elevenlabs.io e apri la sezione Dubbing Studio dal menu degli strumenti.
  2. Carica il contenuto da doppiare: un file video o audio, oppure il link a un video.
  3. Scegli la lingua di partenza (o lascia il rilevamento automatico) e una o piu' lingue di destinazione.
  4. Avvia il doppiaggio e attendi l'elaborazione: ottieni una traccia con voci naturali allineate al parlato originale.
  5. Rifinisci nello Studio: puoi correggere la traduzione, regolare i tempi e aggiungere musica o effetti senza strumenti esterni.
Caso d'uso tipico: un creator italiano carica un tutorial di 10 minuti, sceglie inglese, spagnolo e tedesco come lingue di destinazione e ottiene tre versioni doppiate che conservano il suo tono di voce, pronte da pubblicare sui canali esteri.

Quanto costa

Il doppiaggio si paga a minuti e, dettaglio importante, ogni lingua viene conteggiata separatamente: un video di 10 minuti doppiato in spagnolo, francese e tedesco vale 30 minuti di utilizzo, non 10. Al lancio ElevenLabs ha previsto una finestra promozionale di 7 giorni con minuti gratuiti per provare la funzione — circa un minuto sul piano gratuito, quindici sul piano Starter e trenta sui piani Creator e superiori. L'accesso via API e' annunciato come "in arrivo".

Nel Dubbing Studio si rifiniscono traduzione, tempi e musica.

Come ottenere un risultato migliore

Anche con un modello avanzato, qualche accortezza alza nettamente la qualita'. Parti da un audio originale pulito: rumori di fondo, musica sovrapposta al parlato e piu' voci che si accavallano confondono il sistema. Quando possibile, fornisci una traccia in cui la voce e' isolata. Indica correttamente la lingua di partenza se il rilevamento automatico sbaglia, e dopo l'elaborazione rivedi sempre la traduzione nello Studio: i nomi propri, gli acronimi e i termini tecnici sono i punti dove serve un controllo umano. Infine, per i video, verifica la sincronizzazione labiale percepita: Dubbing v2 lavora sui tempi, ma su clip molto serrate puo' essere utile aggiustare manualmente le pause.

ElevenLabs, Suno e gli altri: il quadro

Il doppiaggio automatico e' un segmento in piena espansione. ElevenLabs si e' costruita una reputazione sulla qualita' delle voci sintetiche e sul cloning vocale; sul fronte musicale i riferimenti sono altri, come Suno e Udio, mentre per la sola trascrizione molti usano soluzioni open come Whisper. La forza di Dubbing v2 sta nel mettere insieme traduzione, recitazione e montaggio in un unico flusso, dove prima servivano strumenti diversi. Per un'azienda che vuole portare i propri video di formazione su mercati esteri, o per una testata che vuole pubblicare le proprie interviste in piu' lingue, e' un salto di produttivita' concreto.

Pro, contro e il nodo etico

Per chi produce contenuti — youtuber, aziende, formatori, testate — Dubbing v2 abbatte il costo e i tempi della localizzazione, che con il doppiaggio tradizionale richiede studi, attori e settimane di lavoro. Il limite e' il modello a consumo per lingua, che puo' diventare costoso su grandi volumi, e la qualita' che, per quanto alta, va sempre controllata su sfumature e termini tecnici. Resta poi il tema etico e legale: clonare e tradurre una voce richiede il consenso di chi parla, e in Europa l'AI Act imporra' obblighi di trasparenza sui contenuti generati o manipolati con l'IA. Usato con queste accortezze, e' uno degli strumenti piu' utili per chi vuole parlare a un pubblico globale. I dettagli sono nell'annuncio ufficiale e nella documentazione di ElevenLabs.