Trascrizione YouTube. Meglio delle didascalie automatiche.Più conveniente della trascrizione umana.

Incolla un URL di video YouTube. Ottieni una trascrizione accurata al 95%+ con etichette dei relatori, timestamp dei capitoli e didascalie SRT/VTT che puoi re-caricare — nessun Premium, nessuna estensione Chrome.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Visualizza cosa esce

URL dentro. Didascalie e trascrizione pulita fuori.

Incolla un link youtu.be o youtube.com. Lo risolviamo, estraiamo la traccia audio a bitrate più alto lato server, eseguiamo la diarizzazione e restituiamo una trascrizione con timestamp più SRT/VTT pronti per il caricamento come didascalie della comunità.

youtu.be/dQw4w9WgXcQREC Intervista · 2 relatori · 28:14
rilevato automaticamente en-USopus 160 kbps · 48 kHz
~90s
Trascrizione · streamingPrecisione 96%
S1

Allora il canale ha raggiunto 100k iscritti in otto mesi — cosa ha effettivamente fatto la differenza?

S2

Onestamente, postare Shorts ogni giorno per sei settimane. Il tempo di visualizzazione long-form è seguito.

S1

E la revisione della miniatura — è stata testata A/B in YouTube Studio?

S2

Sì, il nuovo strumento Test & Compare. Due di tre vincitori non avevano un viso.

96% su audio con parlante frontaleSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre opzioni reali · confronto onesto

Didascalie automatiche YouTube. Rev umana. O noi.

YouTube fornisce didascalie automatiche su ogni video gratuitamente — semplicemente non sono molto accurate e non hanno etichette dei relatori. Rev vende trascrizioni digitate da umani a $1.50/min. Siamo nel mezzo: AI al 95%+, etichette dei relatori, turnaround di tre minuti.

Option 01

Didascalie automatiche YouTube

Gratuito, integrato in ogni video pubblico. Nessun passaggio di punteggiatura, nessuna etichetta del relatore.

CostoGratuito
Precisione~80% su parlato pulito
Etichette dei relatoriNessuna
PunteggiaturaScarsa, nessun paragrafo
EsportaCopia-incolla dal pannello di trascrizione
Funziona suSolo video pubblici
Best forScansione rapida di un video che non possiedi quando la precisione non è importante.
Option 02

Transcription.Solutions

Incolla l'URL. Tre minuti dopo: trascrizione pulita, SRT/VTT, riepilogo AI con link ai capitoli.

Costo · per min$0.03 su Pro
Precisione95%+ su parlante frontale
Etichette dei relatoriSì (Pro e Business)
PunteggiaturaCompleta, con paragrafi
EsportaSRT · VTT · DOCX · TXT · JSON
Funziona suURL pubblici + non elencati
Best forCreator che re-caricano didascalie, podcaster che riutilizzano video per blog, ricercatori che estraggono citazioni da interviste.
Option 03

Trascrizione umana Rev

Un umano la digita. Massima precisione, turnaround più lento, prezzi al minuto.

Costo · per min$1.50
Precisione99%+ garantito
Etichette dei relatori
PunteggiaturaCompleta, livello editoriale
TurnaroundTipicamente 12-24 ore
Funziona suQualsiasi file caricato
Best forContenuti ammissibili in tribunale, sottotitoli di trasmissione, o interviste dove una parola mancata rovina la citazione.

Prezzi accurati a partire dal 2026. I prezzi Rev riflettono il loro tier di servizio standard; i tier solo AI dei concorrenti non vengono confrontati qui.

Specifico per YouTube

Tre cose che colpiscono le persone sugli strumenti di trascrizione generici.

L'audio di YouTube ha particolarità che i trascrittori standard non gestiscono. Attiva le impostazioni giuste e la trascrizione ritorna pronta per il re-caricamento come didascalie.

Cosa va storto

  1. 1I letti musicali confondono il riconoscitore. Gli stacchi introduttivi e la musica di sottofondo vengono trascritti come parole distorte. L'AI generico non sa ignorarli.
  2. 2Le lunghezze delle righe SRT non corrispondono alle regole delle didascalie di YouTube. I sottotitoli trabordano l'area sicura su mobile, o si tagliano a metà parola perché il chunker non era sintonizzato per il video.
  3. 3I nomi specifici del canale (marchi sponsor, titoli di gioco, handle guest come @MKBHD) vengono scritti foneticamente. Un errore di battitura e la citazione non è ricercabile.

Cosa attivare qui

  1. 1Attiva la Segmentazione consapevole della musica nel modulo di lavoro. Etichettiamo le regioni musicali con `[music]` invece di allucinare testi, e riprendiamo la trascrizione pulita quando ritorna la voce.
  2. 2Scegli SRT sicuro per YouTube come esportazione. Le righe sono limitate a 42 caratteri, max due righe per riga, e le interruzioni cadono su confini di frase — rilascia il file direttamente in YouTube Studio.
  3. 3Incolla il vocabolario del canale (nomi sponsor, ospiti ricorrenti, titoli di gioco) in Vocabolario personalizzato. Lo forniamo al riconoscitore come suggerimento in modo che le ortografie dei marchi rimangano corrette.

Impostazioni di lavoro consigliate per YouTube

Incolla un URL YouTube e questi si attivano automaticamente. Sovrascrivi per lavoro dal modulo.

Fonte
Incolla URL · risoluzione automatica youtu.be
Diarizzazione
Acustica · 1-4 relatori
Gestione della musica
Etichetta [music], salta testi
Parole di riempimento
Rimosse per impostazione predefinita
Riepilogo
Timestamp dei capitoli + momenti chiave
Esporta
SRT sicuro per YouTube · VTT · DOCX

Accuracy · real-world numbers

95%+ su video con parlante frontale. Audio musicale e di gioco con limite inferiore.

Il contenuto di YouTube varia selvaggiamente — un podcast in studio e uno streaming Fortnite non sono lo stesso problema. Il parlante frontale con microfono a bavero è il caso migliore; la musica di sottofondo e l'audio di gioco sovrapposto trascinano la precisione più velocemente. I numeri sottostanti provengono da URL YouTube di clienti reali in produzione.

97%
Podcast in studio · microfono separato per ospite

Setup stile Joe Rogan: ogni ospite ha un microfono boom separato, trattamento acustico leggero, nessun letto musicale. La diarizzazione è banale quando le voci non si mescolano.

95%
Singolo parlante frontale · microfono a bavero/USB

Tutorial standard o saggio video. Un solo relatore, audio interno, musica intro abbassata sotto la voce. La maggior parte dei caricamenti su YouTube rientra qui.

89%
Vlog con B-roll · audio all'aperto

Vento, traffico, musica ambientale sotto la voce fuori. Le parole sono ancora utilizzabili; prevedi occasionali errori su nomi propri e marchi.

84%
Gaming stream · voce su audio di gioco

Effetti sonori di gioco, musica e lettura della chat a volume variabile. La voce dello streamer è solitamente chiara; i compagni su Discord cadono più velocemente. Caso peggiore nei nostri dati.

Domande frequenti

8 cose che le persone chiedono sulla trascrizione YouTube.

01Incolla solo l'URL o devo scaricare il video prima?+
Incolla solo l'URL. Accettiamo URL youtube.com/watch, link brevi youtu.be e URL di video non elencati. Lo risolviamo lato server, estraiamo solo la traccia audio (non il video) e iniziamo la trascrizione — solitamente entro 10 secondi dall'incolla.
02Funziona su video privati o non elencati?+
Non elencati sì, privati no. Gli URL non elencati sono risolvibili pubblicamente se hai il link, quindi possiamo recuperarli. I video privati richiedono l'accesso al tuo account Google — non possiamo impersonarti. Scarica il MP4 da YouTube Studio prima, quindi carica il file.
03Perché la tua trascrizione è così molto meglio delle didascalie automatiche di YouTube?+
Le didascalie automatiche di YouTube eseguono un modello di streaming sintonizzato per il costo su scala attraverso miliardi di video. Eseguiamo un modello più grande con decodifica a contesto completo, vocabolario personalizzato e un passaggio di diarizzazione separato. Risultato: ~95% vs ~80%, più etichette dei relatori e punteggiatura corretta.
04Posso caricare l'SRT di nuovo su YouTube come didascalie della comunità?+
Sì. Esporta come SRT sicuro per YouTube, apri YouTube Studio → Sottotitoli → Aggiungi → Carica file. Le nostre lunghezze di riga e timing corrispondono alle regole di visualizzazione di YouTube, quindi le riga non traborderanno su mobile o si spezzeranno a metà parola.
05Che dire del copyright — è legale trascrivere il video di qualcun altro?+
La trascrizione per uso personale, ricerca, giornalismo o commento è generalmente fair use negli Stati Uniti. La ri-pubblicazione del testo completo commercialmente è più ambigua. Non memorizziamo l'audio o il video, ti consegniamo il testo — quello che fai con esso dipende da te. Non è consulenza legale.
06Riesci a gestire video lunghi come episodi di podcast di 4 ore?+
Sì. Il nostro limite massimo è 8 ore per file. Un episodio Lex Fridman di 4 ore viene trascritto in circa 8-12 minuti in tempo reale e costa circa $7.20 su prezzi Pro. La diarizzazione mantiene la qualità per la lunghezza completa.
07Gestisci video YouTube in lingue diverse dall'inglese?+
Sì — 99 lingue rilevate automaticamente. Spagnolo, hindi, portoghese e giapponese si aggirano tutti entro 2-3 punti di precisione dell'inglese su audio pulito. Il code-switching (inglese + spagnolo nella stessa frase) funziona ma si degrada di ~5 punti.
08Posso ottenere timestamp dei capitoli come gli auto-capitoli di YouTube?+
Sì. Il riepilogo AI include timestamp in stile capitolo per transizioni di argomenti più link ai momenti chiave. Incollali nella descrizione del tuo video come `00:00 Intro / 03:42 Setup / …` — YouTube li rende automaticamente come capitoli cliccabili.

Incolla un URL YouTube. Visualizza cosa esce.

30 minuti gratuiti ogni mese. Nessuna carta. Etichette dei relatori, SRT sicuro per YouTube, riepilogo AI con timestamp dei capitoli — tutto incluso.

Inizia gratis