Interview transcriptie.Andere opname, hetzelfde resultaat.

Telefoonnotitie, Zoom-oproep, lavalier-setup, of handheld veldrecorder — zet je interview-opname neer en krijg tekst met spreker labels en timestamps die je kunt citeren.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Kijk wat er uit komt

Twee stemmen in. Twee stemmen eruit, gelabeld.

De meeste interviews zijn twee mensen op één apparaat — een telefoon op tafel, een recorder tussen je. We scheiden de interview-audio in verslaggever en bron, zelfs van een enkel mono-kanaal, en voorzien elke beurt van een timestamp voor citatie.

Veldrecorder · WAVREC 2 speakers · 38:42
automatisch gedetecteerd en-US48 kHz mono · 1411 kbps
~90s
Transcript · streaming94% nauwkeurigheid
S1

Kun je me stap voor stap vertellen wat je op de ochtend van de achttiende hebt gezien?

S2

Ik ben daar rond zes uur aangekomen. De laadplaatsdeur stond al open, wat niet zou mogen.

S1

En je hebt het deurprobleem eerder gerapporteerd — aan wie?

S2

Aan Diane Okafor van facilities, twee keer in maart. Ik heb de e-mails.

94% op veld WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Drie echte opties · eerlijke vergelijking

Rev human. Otter of Trint. Of ons.

Rev stuurt je audio naar menselijke transcripteurs — langzaam en duur, maar hoge kwaliteit op moeilijke audio. Otter en Trint zijn AI-first zoals wij, afgestemd op journalisten en onderzoekers. Hier is waar elk past.

Option 01

Rev menselijke transcriptie

Echte mensen typen je interview. Best op vijandige audio, maar je wacht en je betaalt.

Omlooptijd12–24 uur typisch
Nauwkeurigheid op schone audio99% (geclaimd)
Spreker labelsHandmatig, inbegrepen
TalenEN human · 30+ AI
Kosten · per min$1.50 human · $0.25 AI
PrivacyAudio naar contractanten gestuurd
Best forInterviews voor rechtszaken of publicatie-kritische interviews op slechte audio waar je een menselijk oor nodig hebt en je een dag kunt wachten.
Option 02

Transcription.Solutions

AI-transcript, spreker-gesplitst, klaar in minuten. Dezelfde engine voor telefoonnotitie, Zoom, of veldrecorder.

Omlooptijd~3 min per uur audio
Nauwkeurigheid op schone audio94–96%
Spreker labelsAutomatisch · hernoemen in editor
Talen99, automatisch gedetecteerd
Kosten · per min$0.03
PrivacyAudio verwijderd in 24u · geen training
Best forJournalisten, onderzoekers en producers die meerdere interviews per week doen en snelle, citeerbare tekst nodig hebben zonder naar een contractant te uploaden.
Option 03

Otter / Trint

AI-transcriptie met een onderzoeksgericht editor. Engels-sterk, gebonden aan maandelijkse abonnementen.

OmlooptijdReal-time tot ~5 min
Nauwkeurigheid op schone audio~90–93%
Spreker labelsJa · EN-afgestemd
TalenOtter EN-only · Trint 30+
Kosten$17–80/user/mo (abonnement)
PrivacyStandaard opgeslagen in account
Best forTeams die een gehoste bibliotheek van elk opgenomen interview willen en geen probleem hebben met een maandelijkse zitplaatstarief per gebruiker.

Prijsstelling en feature flags nauwkeurig per 2026. Human Rev omlooptijd varieert per wachtrij diepte en audiolengte.

Specifiek voor interviews

Drie dingen die mensen bijten op generieke transcriptietools.

Interview-audio is zelden schoon. Zet deze instellingen om en het transcript houdt stand onder citeren.

Wat gaat fout

  1. 1Kruisgesprek op één kanaal. Wanneer je bron nadrukkelijk wordt en over je vraag heen praat, voegt generieke diarisatie beide in één sprekerblok samen.
  2. 2Bronnamen en plaatsen (Okafor, Tigray, Maranello) komen terug als fonetisch. Waardeloos voor feitencontrole tegen een transcript.
  3. 3Off-the-record momenten eindigen in hetzelfde transcript als citeerbaar materiaal — geen manier om een regio als geredigeerd te markeren.

Wat je hier instelt

  1. 1Als je veldrecorder een twee-kanaals WAV schrijft (één microfoon per spoor), upload dat bestand direct. We detecteren per kanaal en slaan diarisatie volledig over.
  2. 2Plak je voorbereidingsaantekeningen — bronnamen, organisaties, plaatsnamen — in Aangepaste woordenschat op het taakformulier. De herkenner behandelt ze als bekende eigennamen.
  3. 3Nadat het transcript aankomt, markeer je een regio als off-record in de editor. Het exporteert als `[REDACTED 14:22–15:08]` in DOCX en TXT, waarbij de brongeluid ongeacht wordt verwijderd binnen 24 uur.

Aanbevolen taaginstellingen voor interviews

Zet een interviewbestand neer en deze schakelen standaard in. Negeer per taak vanuit het formulier.

Diarisatie
Per kanaal als stereo · akoestisch anders
Sprekermodel
Interview · 2–4 sprekers
Taal
Automatische detectie · code-switch aan
Vulwoorden
Behouden (woordelijke modus)
Samenvatting
Belangrijkste citaten + onderwerpindex
Export
DOCX met timestamps · plain TXT · JSON

Accuracy · real-world numbers

96% op een goede lav. Nog steeds leesbaar op een café-opname.

Interview nauwkeurigheid wordt begrensd door wat de microfoon werkelijk hoorde. Close-mic stereo op elke spreker is het plafond; een telefoon op een rumoerige tafel is de vloer. Getallen hieronder komen uit productie-interviewbestanden, niet synthetische benchmarks.

96%
Dubbele lavalier · studiorust

Een microfoon per spreker, afzonderlijke kanalen (Zoom H5/H6, Tascam DR-40). Diarisatie is triviaal — fout is alleen tekst.

94%
Handheld recorder op tafel

Enkel condensator tussen twee sprekers, rustige kamer. Akoestische diarisatie scheidt stemmen betrouwbaar onder 4 ft.

90%
Telefoonspraaknotitie · dicht

iPhone of Pixel spraaknotitie op tafel. Namen en nummers missen occasioneel; cadans is goed om te citeren.

84%
Veldopname · café of straat

Espressomachines, verkeer, derde stemmen in de buurt. Slechtste geval in onze data — bruikbaar voor navigatie, verifieer citaten tegen audio.

Veelgestelde vragen

8 dingen die mensen vragen over interview transcriptie.

01Kan ik deze transcripten in een gepubliceerd artikel gebruiken zonder tegen de audio te verifiëren?+
Voor directe citaten — nee, controleer altijd tegen de audio. AI-transcripten met 94% nauwkeurigheid lezen nog steeds gemiddeld één woord op de 17 verkeerd, en het verkeerde woord in een citaat is een correctie. Het transcript dient voor navigatie en concepten; de audio is de bron van waarheid.
02Mijn recorder heeft een stereo WAV opgeslagen met één microfoon per spreker. Wat moet ik doen?+
Upload dat bestand direct — niet eerst naar mono converteren. We detecteren de twee kanalen en routeren elk naar zijn eigen diarisatiepad, wat het nauwkeurigste pad is dat we hebben. Verwacht 96%+ in een rustige kamer.
03Hoe zit het met interviews opgenomen via een telefoongesprek?+
Telefoonautio is 8 kHz narrowband, wat de nauwkeurigheid tot ongeveer 88% beperkt, zelfs op een schone lijn. We splitsen nog steeds de twee partijen met behulp van kanaalscheiding als je recorder-app ze afzonderlijk heeft opgenomen (de meeste doen dit). VoIP-oproepen via WhatsApp of Signal klinken iets beter dan PSTN.
04Kan ik off-the-record secties redigeren voordat ik het transcript deel?+
Ja. Selecteer in de editor het timestamp bereik en markeer het `[REDACTED]`. De export vervangt de tekst door een redigeringmarker, maar behoudt de timestamps zodat het document nog steeds de audio volgt.
05Train je modellen op mijn interview-opnames?+
Nee. Brongeluid wordt uit onze infrastructuur verwijderd binnen 24 uur na voltooiing, en we gebruiken klantenopnames niet voor modeltraining onder enig plan. De transcripttekst blijft in je account totdat je deze verwijdert.
06Drie of vier mensen in een paneelinterview — werkt diarisatie nog steeds?+
Tot ongeveer zes verschillende stemmen, ja, maar de nauwkeurigheid van spreker toewijzing daalt met elke toegevoegde persoon en wordt slechter wanneer twee sprekers hetzelfde klinken. Plan een hernoem pass van 2–3 minuten op de sprekerchips nadat het transcript aankomt.
07Kun je interviews in andere talen dan Engels transcriberen?+
99 talen, automatisch gedetecteerd. Code-switching (Engelse bron glijdt midden in een zin in het Spaans) wordt afgehandeld in 12 taalparen. De nauwkeurigheid varieert per taal — Europese talen komen overeen met Engels; talen met weinig middelen in Afrika en Centraal-Azië lopen 5–10 punten lager.
08Ik neem op in een Zoom-oproep — zou ik je Zoom-pagina in plaats daarvan gebruiken?+
Dezelfde engine, hetzelfde resultaat. De Zoom-pagina omvat cloud-binding specifics (audio per deelnemer, inbel-degradatie). Als je één interview tegelijk via Zoom voert, werkt elk pad — zet de MP4 hier neer en de spreker labels komen hetzelfde eruit.

Zet je interview-opname neer. Zien wat eruit komt.

30 gratis minuten per maand. Geen kaart. Spreker labels, 99 talen, alle exports inbegrepen.

Gratis starten