Trascrizione di interviste.Registrazione diversa, stesso risultato.

Memo telefonico, chiamata Zoom, microfono a clip, o registratore portatile — inserisci la registrazione dell'intervista e ottieni testo con etichette parlanti e timestamp che puoi citare.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Guarda cosa esce

Due voci dentro. Due voci fuori, etichettate.

La maggior parte delle interviste è tra due persone su un dispositivo — un telefono sul tavolo, un registratore tra voi. Separiamo l'audio dell'intervista in reporter e fonte anche da un singolo canale mono, quindi aggiungiamo timestamp a ogni turno per la citazione.

Registratore portatile · WAVREC 2 parlanti · 38:42
auto-rilevato en-US48 kHz mono · 1411 kbps
~90s
Trascrizione · streaming94% di precisione
S1

Mi puoi spiegare cosa hai visto la mattina del diciotto?

S2

Sono arrivato intorno alle sei. La porta della baia di carico era già aperta, il che non avrebbe dovuto accadere.

S1

E avevi segnalato il problema della porta prima — a chi?

S2

A Diane Okafor in facilities, due volte a marzo. Ho le email.

94% su WAV portatileDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre opzioni vere · confronto onesto

Rev umano. Otter o Trint. O noi.

Rev invia il tuo audio a trascrittori umani — lento e costoso ma ad alta fedeltà su audio difficile. Otter e Trint sono AI-first come noi, ottimizzati per giornalisti e ricercatori. Ecco dove si adatta ognuno.

Option 01

Trascrizione umana Rev

Persone vere che trascrivono la tua intervista. Migliore su audio ostile, ma aspetti e paghi.

Tempo di risposta12–24 ore tipico
Precisione su audio pulito99% (affermato)
Etichette parlantiManuale, incluso
LingueEN umano · 30+ AI
Costo · per minuto$1,50 umano · $0,25 AI
PrivacyAudio inviato ad appaltatori
Best forInterviste critiche per tribunale o pubblicazione su audio cattivo dove hai bisogno di un orecchio umano e hai un giorno di attesa.
Option 02

Transcription.Solutions

Trascrizione AI, speaker-split, pronta in minuti. Stesso motore per memo telefonico, Zoom, o registratore portatile.

Tempo di risposta~3 min per ora di audio
Precisione su audio pulito94–96%
Etichette parlantiAuto · rinomina nell'editor
Lingue99, rilevamento automatico
Costo · per minuto$0,03
PrivacyAudio eliminato in 24h · nessun addestramento
Best forGiornalisti, ricercatori e produttori che fanno più interviste a settimana e hanno bisogno di testo veloce e citabile senza caricare su un appaltatore.
Option 03

Otter / Trint

Trascrizione AI con editor orientato alla ricerca. Forte in inglese, bloccato a piani mensili.

Tempo di rispostaTempo reale a ~5 min
Precisione su audio pulito~90–93%
Etichette parlantiSì · EN-sintonizzato
LingueOtter solo EN · Trint 30+
Costo$17–80/utente/mese (abbonamento)
PrivacyArchiviato in account per impostazione predefinita
Best forTeam che vogliono una libreria ospitata di ogni intervista mai registrata e non si dispiaciono di una tassa di posto mensile per utente.

Prezzi e flag di funzionalità accurati a partire dal 2026. Il tempo di risposta umano di Rev varia in base alla profondità della coda e alla lunghezza dell'audio.

Specifico per interviste

Tre cose che mordono le persone su strumenti di trascrizione generici.

L'audio dell'intervista è raramente pulito. Cambia queste impostazioni e la trascrizione regge sotto citazione.

Cosa va storto

  1. 1Cross-talk su un singolo canale. Quando la tua fonte diventa enfatica e parla sopra la tua domanda, la diarizzazione generica le unisce in un blocco unico di parlante.
  2. 2Nomi e luoghi di fonte (Okafor, Tigray, Maranello) tornano fonetici. Inutili per il fact-checking rispetto a una trascrizione.
  3. 3Momenti off the record finiscono nella stessa trascrizione del materiale citabile — nessun modo di marcare una regione come redatta.

Cosa cambiare qui

  1. 1Se il tuo registratore portatile scrive un WAV a due canali (un microfono per traccia), carica quel file direttamente. Rileviamo per canale e saltiamo completamente la diarizzazione.
  2. 2Incolla le tue note di preparazione — nomi di fonte, organizzazioni, nomi di luoghi — in Vocabolario personalizzato nel modulo di lavoro. Il riconoscitore li tratta come nomi propri noti.
  3. 3Dopo che la trascrizione arriva, marca una regione come off-record nell'editor. Esporta come `[REDACTED 14:22–15:08]` in DOCX e TXT, con l'audio sorgente eliminato in 24 ore indipendentemente.

Impostazioni di lavoro consigliate per interviste

Inserisci un file di intervista e questi si attivano per impostazione predefinita. Sovrascrivi per lavoro dal modulo.

Diarizzazione
Per canale se stereo · acustico altrimenti
Modello parlante
Intervista · 2–4 parlanti
Lingua
Rilevamento automatico · code-switch attivo
Parole di riempimento
Mantenute (modalità verbatim)
Riassunto
Citazioni chiave + indice argomenti
Esportazione
DOCX con timestamp · TXT semplice · JSON

Accuracy · real-world numbers

96% su un buon lav. Ancora leggibile su una registrazione al caffè.

La precisione dell'intervista è limitata da ciò che il microfono ha effettivamente sentito. La stereo close-mic su ogni parlante è il soffitto; un telefono su un tavolo rumoroso è il pavimento. I numeri di seguito provengono da file di interviste di produzione, non da benchmark sintetici.

96%
Doppio lavalier · studio silenzioso

Un microfono per parlante, canali separati (Zoom H5/H6, Tascam DR-40). La diarizzazione è banale — l'errore è solo testuale.

94%
Registratore portatile sul tavolo

Singolo condensatore tra due parlanti, stanza silenziosa. La diarizzazione acustica separa le voci in modo affidabile sotto i 4 piedi.

90%
Memo vocale telefonico · vicino

Memo vocale iPhone o Pixel sul tavolo. Nomi e numeri occasionalmente mancano; la cadenza è fine per le citazioni.

84%
Registrazione sul campo · caffè o strada

Macchine espresso, traffico, terze voci vicine. Caso peggiore nei nostri dati — utilizzabile per la navigazione, verifica le citazioni rispetto all'audio.

Domande comuni

8 cose che le persone chiedono sulla trascrizione di interviste.

01Posso usare queste trascrizioni in un articolo pubblicato senza verificare rispetto all'audio?+
Per le citazioni dirette — no, verifica sempre rispetto all'audio. Le trascrizioni AI al 94% di precisione leggono ancora male una parola su 17 in media, e la parola sbagliata in una citazione è una correzione. La trascrizione è per la navigazione e la bozza; l'audio è la fonte della verità.
02Il mio registratore ha salvato un WAV stereo con un microfono per parlante. Cosa faccio?+
Carica quel file direttamente — non convertire a mono prima. Rileviamo i due canali e instrada ognuno al suo traccia di diarizzazione, che è il percorso di massima precisione che abbiamo. Aspettati il 96%+ in una stanza silenziosa.
03E gli intervalli registrati su una chiamata telefonica?+
L'audio telefonico è a banda stretta di 8 kHz, che limita la precisione a circa l'88% anche su una linea pulita. Dividiamo comunque i due partiti usando la separazione del canale se la tua app di registrazione li ha catturati separatamente (la maggior parte lo fa). Le chiamate VoIP su WhatsApp o Signal suonano un po' meglio di PSTN.
04Posso redigere le sezioni off the record prima di condividere la trascrizione?+
Sì. Nell'editor, seleziona l'intervallo di timestamp e marcalo `[REDACTED]`. L'esportazione sostituisce il testo con un marcatore di redazione ma mantiene i timestamp in modo che il documento tracci ancora l'audio.
05Addestri i modelli sulle mie registrazioni di interviste?+
No. L'audio sorgente viene eliminato dalla nostra infrastruttura entro 24 ore dal completamento, e non usiamo le registrazioni del cliente per l'addestramento del modello in alcun piano. Il testo della trascrizione rimane nel tuo account fino a quando non lo elimini.
06Tre o quattro persone su un'intervista a tavola rotonda — la diarizzazione funziona ancora?+
Fino a circa sei voci distinte, sì, ma la precisione nell'assegnazione del parlante cala con ogni persona aggiunta e peggiora quando due parlanti suonano simili. Pianifica un passaggio di rinomina di 2-3 minuti sui chip del parlante dopo che la trascrizione arriva.
07Puoi trascrivere interviste in lingue diverse dall'inglese?+
99 lingue, rilevamento automatico. Il code-switching (fonte inglese che scivola in spagnolo a metà frase) è gestito in 12 coppie di lingue. La precisione varia per lingua — le lingue europee corrispondono all'inglese; le lingue africane e dell'Asia centrale a basse risorse hanno 5-10 punti inferiori.
08Registro su una chiamata Zoom — dovrei usare la tua pagina Zoom invece?+
Stesso motore, stesso risultato. La pagina Zoom copre gli specifici della registrazione cloud (audio per partecipante, degradazione dial-in). Se stai conducendo un'intervista alla volta su Zoom, entrambi i percorsi funzionano — inserisci il MP4 qui e le etichette dei parlanti escono uguali.

Inserisci la tua registrazione di intervista. Vedi cosa esce.

30 minuti gratuiti ogni mese. Nessuna carta. Etichette parlanti, 99 lingue, tutte le esportazioni incluse.

Inizia gratis