MP3 naar tekst — converteer MP3 naar tekst of transcribeer MP3-audio, snel

Transcribeer MP3 naar tekst.Spreker-labels, 100+ talen.

Sleep een MP3-bestand op elke bitrate van 64 tot 320 kbps. Krijg een transcript met tijdstempel en spreker-labels in 99 talen — geen formaatconversie, geen her-encoding, geen wachtrij.

Sleep je audio of video erin

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Opnemen direct vanuit je browser

Aanmelden duurt 30 seconden — opnemen kan direct daarna, in het dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTBestanden worden binnen 24u automatisch verwijderd

MP3 in. Gedialiseerd transcript uit.

We lezen de MP3 frame headers rechtstreeks — VBR, CBR, joint-stereo, elke encoder (LAME, Fraunhofer, FFmpeg). Als het bestand echte stereo is met sprekers op afzonderlijke kanalen, gebruiken we dat om stemmen te splitsen. Mono mix-down valt terug op akoestische diarisatie.

interview-tape-04.mp3REC 192 kbps · stereo · 38:42

auto-detected en-GB44.1 kHz · LAME 3.100

~90s

Transcript · live95% nauwkeurigheid

Dus wanneer besefte je dat het archief onvolledig was?

Waarschijnlijk rond 2019, toen we de spoelenrecorders gingen digitaliseren.

En de ontbrekende banden — waren ze ergens geregistreerd?

Er is een papieren index uit '78, maar de helft ervan is waterbeschadigd.

95% bij 192 kbps stereoSRT · DOCX · TXT · JSON · VTT

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Samenvatting 5Transcriptie 1,420Sprekers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Hoofdpunten

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Taken

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Whisper lokaal / open source

Gratis als je een GPU en een middag hebt. Geen spreker-diarisatie uit de doos.

InstellingPython + CUDA + 10 GB modellen

Spreker-diarisatieNiet inbegrepen (pyannote-invoegsel)

Snelheid · 1 uur MP35–40 min op consumer GPU

Talen99, maar klein model daalt onder 80%

ExporterenTXT / SRT / VTT / JSON

KostenGratis + je elektriciteit

Best forTechnische mensen die al een GPU hebben, geen spreker-labels nodig hebben en volledige lokale privacy willen.

Option 02

Transcription.Solutions

Sleep de MP3 erin. Krijg spreker-gelabelde tekst terug in ongeveer realtime × 0,025.

InstellingSleep-en-drop, geen account nodig om te proberen

Spreker-diarisatieIngebouwd (Pro & Business-plannen)

Snelheid · 1 uur MP3~90 seconden

Talen99, automatisch gedetecteerd

ExporterenSRT · VTT · DOCX · TXT · JSON

Kosten · per minuut$0.03

Best forIedereen met een MP3 — journalisttape, podcast-export, spraaknotitie, archiefkopie — die gewoon nauwkeurige tekst aan de andere kant wil.

Option 03

Otter / Sonix

Gepolijst dashboard, maandelijks minutenlimiet, Engels-tuning. Bestandsupload voelt als een bijzaak.

InstellingAccount + betaald plan

Spreker-diarisatieAkoestisch, Engels-gericht

Snelheid · 1 uur MP35–10 min in wachtrij

TalenOtter alleen EN; Sonix ~40

ExporterenAchter betaalde lagen vergrendeld

Kosten$17+/maand of $10+/uur (Sonix)

Best forTeams die meer een transcripteditor en samenwerkings-UI willen dan een schone bestand→tekst-flow.

Prijzen en functiebeschikbaarheid correct vanaf mei 2026. Whisper-prestaties variëren naargelang modelgrootte en hardware.

8 dingen die mensen vragen over MP3-transcriptie.

01Wat is de minimale MP3-bitrate die nog een bruikbaar transcript geeft?+

64 kbps is praktisch het onderste limiet. Daaronder comprimeren sibilanten (s, sh, f) tot ruis en de woordfoutfrequentie klimt boven de 20%. Als je vers opneemt, richt je op 128 kbps mono of 192 kbps stereo — alles hoger is overkill voor spraak.

02Moet ik mijn MP3 eerst naar WAV converteren?+

Nee. MP3 → WAV hercoderen voegt nul nauwkeurigheid toe omdat de gegevens die het encoderprogramma verwierp voorgoed weg zijn. Upload de MP3 rechtstreeks. We decoderen frames in het geheugen en voeden PCM naar de herkenner.

03Geeft stereo MP3 mij betere spreker-labels dan mono?+

Alleen als de sprekers daadwerkelijk op afzonderlijke kanalen zijn opgenomen — de meeste stereo MP3's hebben hetzelfde audio aan beide zijden ('dual mono') en winnen niets. Echt kanaal-split (bijv. Riverside-exports, twee-microfoon veldsetups) laat ons akoestische diarisatie overslaan en sprekers bijna perfect labelen.

04Wat is de maximale MP3-bestandsgrootte die je accepteert?+

5 GB per upload, wat ruwweg 60 uur bij 192 kbps of 90 uur bij 128 kbps is. Als je bestand groter is, tonen we een opgedeelde upload — je hoeft het niet zelf op te splitsen.

05Hoe lang duurt het om een 60-minuten MP3 te transcriberen?+

Typisch 90 seconden van upload-voltooid tot transcript-klaar, ongeacht bitrate. MP3-frames decoderen is snel; de tijd zit in de herkenner. Diarisatie voegt 5-10 seconden toe op multispreaker-bestanden.

06Mijn MP3 heeft achtergrondmuziek — wordt het transcript verpest?+

Stille achtergrondmuziek onder spreektaal is prima. Luide muziek die met de stem concurreert (intromagneten, scoring onder interviews) triggert soms misherkenningen op overlappende lettergrepen. Schakel muziekonderdrukking in op het taakformulier om vooraf te filteren.

07Kun je MP3's afkomstig van telefonische voicemail of antwoordapparaten verwerken?+

Ja, hoewel deze vaak 8 kHz narrowband-hergeëncodeert zijn als MP3 — het audiokwaliteitsplafond wordt bepaald door de originale PSTN-capture, niet door de MP3-wrapper. Verwacht 78-85% nauwkeurigheid op dat soort bron, wat hetzelfde is als wat we zouden krijgen op het onderliggende gesprek.

08Jullie houden mijn MP3 nadat het transcript klaar is?+

Bestanden worden standaard na 30 dagen verwijderd, of onmiddellijk op verzoek via het dashboard. Het transcript blijft in je account totdat je het verwijdert. We gebruiken klantaudio nooit om enig model te trainen — nooit.

Transcribeer MP3 naar tekst.Spreker-labels, 100+ talen.

Sleep je audio of video erin

Paste a link, we’ll fetch the audio

Opnemen direct vanuit je browser

MP3 in. Gedialiseerd transcript uit.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Gratis lokale Whisper. Otter of Sonix. Of ons.

Whisper lokaal / open source

Transcription.Solutions

Otter / Sonix

Drie dingen die mensen bijten op generieke transcriptietools.

Wat gaat mis

Wat we in plaats daarvan doen

Aanbevolen taakinstellingen voor MP3-uploads

95%+ bij 192 kbps stereo. Bruikbaar tot 64 kbps mono.

8 dingen die mensen vragen over MP3-transcriptie.

Sleep je MP3. Krijg tekst terug in 90 seconden.