MP3 til tekst — konverter MP3 til tekst eller transkriber MP3-lyd hurtigt

Transkriber MP3 til tekst.Taler-etiketter, 100+ sprog.

Slip en MP3-fil ved enhver bitrate fra 64 til 320 kbps. Få et tidsstemplet, taler-mærket manuskript på 99 sprog — ingen formatkonvertering, ingen genindkodning, ingen ventetid i kø.

Træk din lyd eller video herind

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Optag direkte fra browseren

Tilmelding tager 30 sekunder — optagelse åbner lige efter, i dashboardet.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiler slettes automatisk efter 24 timer

MP3 ind. Diarisereret manuskript ud.

Vi læser MP3-rammehoveder direkte — VBR, CBR, joint-stereo, enhver encoder (LAME, Fraunhofer, FFmpeg). Hvis filen er ægte stereo med talere på separate kanaler, bruger vi det til at opdele stemmer. Mono mix-down falder tilbage til akustisk diarisering.

interview-tape-04.mp3REC 192 kbps · stereo · 38:42

autodetekteret en-GB44.1 kHz · LAME 3.100

~90s

Manuskript · streaming95% nøjagtighed

Så hvornår indså du først, at arkivet var ufuldstændigt?

Nok omkring 2019, da vi begyndte at digitalisere spoler.

Og de manglende bånd — blev de katalogiseret nogen steder?

Der er et papirindeks fra '78, men halvdelen er vandskade.

95% på 192 kbps stereoSRT · DOCX · TXT · JSON · VTT

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Resumé 5Transskription 1,420Talere 2Eksport

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Hovedpointer

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

To-do's

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Whisper lokal / open source

Gratis, hvis du har en GPU og en eftermiddag. Ingen taler-diarisering ud af boksen.

OpsætningPython + CUDA + 10 GB modeller

Taler-diariseringIkke inkluderet (pyannote add-on)

Hastighed · 1 time MP35–40 min på consumer GPU

Sprog99, men lille model falder under 80%

EksportTXT / SRT / VTT / JSON

OmkostningGratis + din elektricitet

Best forIngeniører der allerede ejer en GPU, har ikke brug for taler-etiketter, og ønsker fuld lokal privathed.

Option 02

Transcription.Solutions

Slip MP3-filen. Få taler-mærket tekst tilbage på cirka realtid × 0,025.

OpsætningTræk-og-slip, ingen konto påkrævet for at prøve

Taler-diariseringBygget ind (Pro & Business-planer)

Hastighed · 1 time MP3~90 sekunder

Sprog99, autodetekteret

EksportSRT · VTT · DOCX · TXT · JSON

Omkostning · per minut$0,03

Best forAlle med en MP3 — journalistbånd, podcasteksport, stemmebeskeder, arkivafspilning — som blot ønsker præcis tekst ud.

Option 03

Otter / Sonix

Poleret dashboard, månedligt minut-loft, engelsk-tunet. Fil-upload føles som en sidebemærkning.

OpsætningKonto + betalt plan

Taler-diariseringAkustisk, EN-hældende

Hastighed · 1 time MP35–10 min i kø

SprogOtter kun EN; Sonix ~40

EksportLåst bag betalte niveauer

Omkostning$17+/md eller $10+/time (Sonix)

Best forTeams, der ønsker en transskriptions-editor og samarbejds-UI mere end et rent API-stil fil-til-tekst-flow.

Priser og funktionel tilgængelighed præcis som af maj 2026. Whisper-ydeevne varierer efter modelstørrelse og hardware.

8 ting folk spørger om MP3-transskription.

01Hvad er den minimale MP3-bitrate, der stadig giver et brugbart manuskript?+

64 kbps er den praktiske grænse. Under det starter sibylantser (s, sh, f) at komprimere til støj, og ord-fejlrate klatrer over 20%. Hvis du optager nyt, sigter du mod 128 kbps mono eller 192 kbps stereo — alt højere er overkill for tale.

02Skal jeg konvertere min MP3 til WAV først?+

Nej. Genindkodning MP3 → WAV tilføjer nul nøjagtighed, fordi de data, encoderen kasserede, er væk for godt. Upload MP3'en direkte. Vi dekoder rammen i hukommelsen og fodrer PCM til genkendelsen.

03Vil stereo MP3 give mig bedre taler-etiketter end mono?+

Kun hvis talerne faktisk blev optaget på separate kanaler — de fleste stereo MP3'er har samme lyd på begge sider ('dual mono') og vinder ingenting. Ægte kanal-split (f.eks. Riverside-eksporter, to-mikrofon-feltrig) lader os springe akustisk diarisering over og mærke talere næsten perfekt.

04Hvad er den maksimale MP3-filstørrelse, du accepterer?+

5 GB per upload, hvilket er cirka 60 timer ved 192 kbps eller 90 timer ved 128 kbps. Hvis din fil er større, viser vi en segmenteret upload — ingen grund til at dele den selv.

05Hvor lang tid tager en 60-minutters MP3 at transskribere?+

Typisk 90 sekunder fra upload-fuldført til manuskript-færdig, uanset bitrate. Dekodning af MP3-ramme er hurtig; tiden er i genkendelsen. Diarisering tilføjer 5-10 sekunder på multi-taler-filer.

06Min MP3 har baggrundsmusik — bliver manuskriptet ødelagt?+

Stille sengebedmusik under tale er fin. Høj musik, der konkurrerer med stemmen (intro-singes, scoring under interviews), udløser til tider fejlgenkendelser på overlappende stavelser. Skift musikundertrykkelse til på job-formularen for forbehandling.

07Kan du håndtere MP3'er rippet fra telefonbesked eller telefonsvarer?+

Ja, selvom disse ofte er 8 kHz snævrband genindkodet som MP3 — lydkvalitetstaget er sat af oprindeligt PSTN-opsamling, ikke MP3-pakningen. Forvent 78-85% nøjagtighed på den slags kilde, som er hvad vi ville få på det underliggende opkald.

08Gemmer du min MP3 efter transskriptet er lavet?+

Filer slettes efter 30 dage som standard, eller øjeblikkeligt på anmodning via dashboardet. Manuskriptet forbliver på din konto, indtil du sletter det. Vi bruger aldrig kundelyd til at træne nogen model — nogensinde.

Transkriber MP3 til tekst.Taler-etiketter, 100+ sprog.

Træk din lyd eller video herind

Paste a link, we’ll fetch the audio

Optag direkte fra browseren

MP3 ind. Diarisereret manuskript ud.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Gratis lokal Whisper. Otter eller Sonix. Eller os.

Whisper lokal / open source

Transcription.Solutions

Otter / Sonix

Tre ting, der bider mennesker på generiske transskriptions-værktøjer.

Hvad der går galt

Hvad vi gør i stedet

Anbefalede job-indstillinger for MP3-uploads

95%+ på 192 kbps stereo. Brugbart ned til 64 kbps mono.

8 ting folk spørger om MP3-transskription.

Slip din MP3. Få tekst tilbage på 90 sekunder.