Transcriere interviu.Înregistrare diferită, același rezultat.

Memento telefonic, apel Zoom, lavalieră sau înregistrator de teren handheld — plasați înregistrarea interviului și obțineți text cu etichete de vorbitori și marcaje de timp din care puteți cita.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Vedeți ce iese

Doi vorbitori intră. Doi vorbitori ies, etichetați.

Majoritatea interviurilor sunt doi oameni pe un singur dispozitiv — un telefon pe masă, un înregistrator între voi. Separăm audio-ul interviului în reporter și sursă chiar și dintr-un singur canal mono, apoi marcăm cu timp fiecare tur pentru citare.

Înregistrator de teren · WAVREC 2 vorbitori · 38:42
detectat automat en-US48 kHz mono · 1411 kbps
~90s
Transcriere · streamingAcuratețe 94%
S1

Puteți să-mi descrieți ce ați văzut dimineața din optsprezece?

S2

Am ajuns acolo în jurul orei șase. Ușa garajului era deja deschisă, ceea ce nu ar trebui să fie.

S1

Și ați mai raportat problema ușii înainte — cui?

S2

Danei Okafor din administrație, de două ori în martie. Am email-urile.

94% pe WAV de terenDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Trei opțiuni reale · comparație onestă

Rev uman. Otter sau Trint. Sau noi.

Rev trimite audio-ul dvs. transcriptorilor umani — lent și scump dar fidelitate înaltă pe audio dificil. Otter și Trint sunt AI-first ca noi, acordate pentru jurnaliști și cercetători. Iată unde se potrivește fiecare.

Option 01

Transcriere umană Rev

Oameni adevărați tastând interviul dvs. Cel mai bun pe audio ostil, dar așteptați și plătiți.

Timp de finalizare12–24 ore obișnuite
Acuratețe pe audio curat99% (pretins)
Etichete de vorbitoriManual, inclus
LimbiEN uman · 30+ AI
Cost · per minut$1.50 uman · $0.25 AI
ConfidențialitateAudio trimis contractorilor
Best forInterviuri legate de instanță sau critice pentru publicare pe audio prost, unde aveți nevoie de o ureche umană și aveți o zi să așteptați.
Option 02

Transcription.Solutions

Transcriere AI, scindată de vorbitor, gata în minute. Același motor pentru memento telefonic, Zoom sau înregistrator de teren.

Timp de finalizare~3 min per oră de audio
Acuratețe pe audio curat94–96%
Etichete de vorbitoriAuto · redenumire în editor
Limbi99, detectate automat
Cost · per minut$0.03
ConfidențialitateAudio șters în 24h · no training
Best forJurnaliști, cercetători și producători care fac mai multe interviuri pe săptămână și au nevoie de text rapid și citabil fără a încărca unui contractor.
Option 03

Otter / Trint

Transcriere AI cu editor orientat pe cercetare. Engleza puternică, blocat pe planuri lunare.

Timp de finalizareTimp real până la ~5 min
Acuratețe pe audio curat~90–93%
Etichete de vorbitoriDa · acordat EN
LimbiOtter EN-doar · Trint 30+
Cost$17–80/utilizator/lună (abonament)
ConfidențialitateStocat în cont implicit
Best forEchipe care doresc o bibliotecă găzduită a fiecărui interviu vreodată înregistrat și nu-i pasă de taxa de șezut lunar per utilizator.

Prețuri și steaguri de caracteristici exacte din 2026. Timpul de finalizare Rev uman variază în funcție de adâncimea cozii și lungimea audio.

Specific pentru interviuri

Trei lucruri care supără oamenii pe instrumentele de transcriere generice.

Audio-ul interviului este rar curat. Inversați aceste setări și transcripțiile rezistă citatelor.

Ce merge prost

  1. 1Cross-talk pe un singur canal. Când sursa dvs. devine enfatică și vorbește peste întrebarea dvs., diarizarea generică fuzionează ambele într-un bloc de vorbitor.
  2. 2Nume și locuri ale sursei (Okafor, Tigray, Maranello) vin fonetice. Inutile pentru verificarea faptelor după o transcriere.
  3. 3Momentele off-the-record ajung în aceeași transcriere ca materialul citabil — nu există modalitate de a marca o regiune ca redactată.

Ce trebuie să inversați aici

  1. 1Dacă înregistratorul dvs. de teren scrie un WAV cu două canale (un microfon per pistă), încărcați acel fișier direct. Detectăm per-canal și omitem diarizarea în totalitate.
  2. 2Lipiseți notele de pregătire — nume ale surselor, organizații, nume de locuri — în Vocabular personalizat pe formularul de job. Recunoașterea le tratează ca substantive proprii cunoscute.
  3. 3După ce transcrierile sosesc, marcați o regiune ca off-record în editor. Se exportă ca `[REDACTED 14:22–15:08]` în DOCX și TXT, cu audio-ul sursă șters în 24 de ore indiferent.

Setări recomandate de job pentru interviuri

Plasați un fișier de interviu și acestea se activează implicit. Anulați per-job din formular.

Diarizare
Per-canal dacă stereo · acustică altfel
Model de vorbitor
Interviu · 2–4 vorbitori
Limbă
Detectare automată · schimbare de cod pe
Cuvinte umplutură
Păstrat (mod verbatim)
Rezumat
Citate cheie + index de subiecte
Exportare
DOCX cu marcaje de timp · TXT simplu · JSON

Accuracy · real-world numbers

96% pe o lavalieră bună. Încă citibil pe o înregistrare de cafenea.

Acuratețea interviului este limitată de ceea ce microfoanele au auzit de fapt. Microfon apropiat stereo pe fiecare vorbitor este plafonul; un telefon pe o masă zgomotoasă este podeaua. Numerele de mai jos provin din fișiere de interviu în producție, nu din benchmark-uri sintetice.

96%
Lavalieră duală · liniștit studio

Un microfon per vorbitor, canale separate (Zoom H5/H6, Tascam DR-40). Diarizarea este banală — eroarea este doar în text.

94%
Înregistrator handheld pe masă

Condensator singular între doi vorbitori, cameră liniștită. Diarizarea acustică separă vocile în mod fiabil sub 4 ft.

90%
Memento vocal telefonic · apropiat

Memento vocal iPhone sau Pixel pe masă. Numele și numerele ocazional lipsesc; ritmul este bun pentru citate.

84%
Înregistrare de teren · cafenea sau stradă

Mașini de espresso, trafic, voci terțe în apropiere. Cel mai rău caz în datele noastre — utilizabil pentru navigare, verificați citatele împotriva audio.

Întrebări frecvente

8 lucruri pe care oamenii le întreabă despre transcriere interviu.

01Pot folosi aceste transcrieri într-un articol publicat fără a verifica împotriva audio?+
Pentru citate directe — nu, verificați întotdeauna împotriva audio. Transcripțiile AI la 94% acuratețe încă citesc în mod eronat un cuvânt din 17 în medie, și cuvântul greșit într-un citat este o corecție. Transcripțiile sunt pentru navigare și redactare; audio-ul este sursa de adevăr.
02Recorder-ul meu a salvat un WAV stereo cu un microfon per vorbitor. Ce fac?+
Încărcați acel fișier direct — nu convertiți la mono mai întâi. Detectăm cele două canale și rutăm fiecare la pista sa proprie de diarizare, care este calea de acuratețe limită pe care o avem. Așteptați 96%+ pe o cameră liniștită.
03Dar interviurile înregistrate pe apel telefonic?+
Audio-ul telefonic este 8 kHz bandă îngustă, care limită acuratețea la aproximativ 88% chiar și pe o linie curată. Încă separăm cele două părți folosind separarea canalelor dacă aplicația dvs. de înregistrator le-a capturat separat (majoritatea o fac). Apelurile VoIP peste WhatsApp sau Signal sună puțin mai bine decât PSTN.
04Pot redacta secțiuni off-the-record înainte de a partaja transcripțiile?+
Da. În editor, selectați intervalul de timp și marcați-l `[REDACTED]`. Exportul înlocuiește textul cu un marker de redactare, dar păstrează marcajele de timp, deci documentul încă urmărește audio.
05Antrenați modele pe înregistrările mele de interviu?+
Nu. Audio-ul sursă este șters din infrastructura noastră în termen de 24 de ore de la finalizare, și nu folosim înregistrări client pentru antrenament model sub niciun plan. Textul transcrii rămâne în cont până îl ștergeți.
06Trei sau patru oameni pe un interviu de panou — diarizarea funcționează încă?+
Până la aproximativ șase voci distincte, da, dar acuratețea pe atribuirea vorbitoarelor scade cu fiecare persoană adăugată și se înrăutățește când doi vorbitori sună similar. Planificați o trecere de redenumire de 2–3 minute pe cipurile de vorbitor după ce transcrierile sosesc.
07Puteți transcrieri interviuri în alte limbi decât engleza?+
99 de limbi, detectate automat. Schimbarea de cod (sursa de engleză alunecă în spaniolă în mijlocul propoziției) este tratată în 12 perechi de limbi. Acuratețea variază în funcție de limbă — limbile europene se potrivesc cu engleza; limbile africane și asiatice centrale cu resurse reduse funcționează 5–10 puncte mai mici.
08Înregistrez pe un apel Zoom — ar trebui să folosesc pagina dvs. Zoom în schimb?+
Același motor, același rezultat. Pagina Zoom acoperă particularități de înregistrare cloud (audio per-participant, degradare dial-in). Dacă conduceți un interviu o dată pe Zoom, oricare cale funcționează — plasați MP4 aici și etichetele de vorbitor ies la fel.

Plasați înregistrarea interviului. Vedeți ce iese.

30 de minute gratuite în fiecare lună. Fără card. Etichete de vorbitori, 99 de limbi, toate exporturile incluse.

Să încep gratuit