Transkribera ljudfiler upp till 10 timmar — långt ljud till text, ingen timeout

Transkribera långa ljudfiler.Upp till 10 timmar. Ingen timeout.

Släpp en lång ljudfil — upp till 10 timmar, 5 GB på Business. Vi delar upp parallellt, håller talar-ID:n konstanta från början till slut, och levererar ett transkript istället för en numrerad mapp.

Släpp in ditt ljud eller video

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Spela in direkt från webbläsaren

Registrering tar 30 sekunder — inspelningen öppnas direkt efter, i dashboarden.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiler raderas automatiskt efter 24 h

Timmar in. En ren fil ut.

De flesta verktyg timeout omkring 90-minutersmärket eller delar din långa inspelning in i numrerade delar du måste sy ihop. Vi delar upp i 12-minutersöverlappande fönster, bearbetar parallellt och återmonterar med ett globalt talarpass.

StyrelsemöteREC 3 talare · 5:14:22 · 3,1 GB

auto-detekterad en-GB44,1 kHz stereo · 192 kbps

~90s

Transkript · en fil92% noggrannhet · t=3:14:08

Vi är tre timmar in — låt oss gå tillbaka till leveranskedjepunkten från morgonsessionen.

Exakt, Vietnampivarn för tillverkning. Jag tror vi skidade över ledtidsrisken.

Ledtider gick från 14 till 31 dagar efter tullförändringen.

Och det är innan vi räknar in hamncongestion vid Long Beach.

92% över hela 5h-filenDOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Sammanfattning 5Transkript 1,420Talare 2Export

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Huvudpunkter

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Att göra-punkter

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

Begränsar långa filer till 4 timmar per inspelning. Talaretikett glider förbi 2-timmars märket.

Max fillängd4 timmar (Pro-tier)

Max filstorlek~1,5 GB uppladdning

Talar-ID:n från början till slutGlider efter 2 timmar

LångfilutdataEn doc, trunkerad vid gränsen

Kostnad$16,99/användare/månad

Resumbar uppladdningNej

Best forKorta möten under 2 timmar. Bryter ihop på heldag-långa inspelningar.

Option 02

Transcription.Solutions

10 timmar per fil. Parallell uppdelning, globalt talarpass, en DOCX ut.

Max fillängd10 timmar (Pro & Business)

Max filstorlek2 GB Pro · 5 GB Business

Talar-ID:n från början till slutGlobalt inbäddningspass

LångfilutdataEn fil · DOCX/SRT/TXT

Kostnad · per minut$0,03 fast oavsett längd

Resumbar uppladdningFlerdelad, tål avbrott

Best forHeldag-workshop, vittnesmål, styrelsemöten, muntlig historia — allt förbi 90-minutersväggen.

Option 03

Whisper API + DIY-uppdelning

Billigast per minut. Du bygger uppdelaren, talarsammanfogningen och retry-logiken.

Max fillängd25 MB per request (~25 min)

Max filstorlek25 MB hårt tak

Talar-ID:n från början till slutInget — ingen diarisering

LångfilutdataNumrerade delar, du syr ihop

Kostnad · per minut$0,006 (OpenAI Whisper)

EngineeringstidTimmar till dagar per pipeline

Best forIngenjörer som vill ha råtext per uppdelning och inte behöver talare, sammanfattningar eller en enda utdata.

Prissättning och gränser exakta från maj 2026. Otter Pro längdgräns senast kontrollerad på deras offentliga prissida.

8 saker folk frågar om långt ljudtranskription.

01Vilka är de faktiska längd- och storleksgränserna för filer?+

10 timmar per fil på både Pro och Business. Pro begränsar filstorlek till 2 GB, Business till 5 GB. Om du har något längre än 10 timmar, dela det en gång vid en naturlig paus — vi håller talar-ID:n konsekventa om du laddar upp dem direkt efter varandra på samma projekt.

02Får jag ett transkript eller en mapp med numrerade delar?+

En fil. Alltid. DOCX, SRT, TXT eller JSON — ditt val. Tidsstämplar körs kontinuerligt från 00:00:00 till slutet av inspelningen, inte återställda vid varje uppdelningsgräns.

03Hur länge tar det för en 6-timmars fil att komma tillbaka?+

Ungefär 18-25 minuter på Pro-kön, 8-12 på Business-prioritet. Vi bearbetar 12-minutersuppdelningarna parallellt, så faktisk tid skalas sub-linjärt med fillängden, inte minut-för-minut.

04Förblir talar-ID:n konsekventa från början till slut?+

Ja. Efter per-uppdelningsdiarisering klustrar ett globalt inbäddningspass röster över hela filen. Talare 3 vid minut 12 är samma Talare 3 vid minut 487. Detta är det viktigaste DIY Whisper-pipelines får fel.

05Vad händer om min uppladdning försvinner vid timme 3 av en 4 GB-fil?+

Resumbar flerdelad uppladdning fortsätter från sista slutförda delen. Du laddar inte upp de första 3 GB igen. Fungerar på dålig hotell-Wi-Fi och mobil-tethering — vi testade båda.

06Varför kväs Whisper API av långa filer?+

OpenAI:s Whisper-slutpunkt har ett 25 MB per-request hårt tak — ungefär 25 minuters komprimerad ljud. Allt längre kräver att du delar upp, transkriberar parallellt, sedan syr ihop transkripter och justerar talare själv. Vi gör allt detta på servern.

07Är per-minut priset detsamma på en 10-timmars fil som en 10-minuters fil?+

Ja. $0,03 per minut fast, oavsett längd. En 10-timmars fil kostar $18. Vi tar inte extra för långa filer som Rev gör ($1,50/min människa × 10 timmar = $900).

08Kan jag få kapitelmarkörer eller tidsstämplar varje timme?+

Slå på 'Timmarmarkörerna' på jobbformuläret och DOCX exporteras med en rubrikbrytning var 60:e minut. SRT behåller kontinuerlig tidskod. JSON har båda — kapitelmatris plus ord-nivå tidsstämplar.

Transkribera långa ljudfiler.Upp till 10 timmar. Ingen timeout.

Släpp in ditt ljud eller video

Paste a link, we’ll fetch the audio

Spela in direkt från webbläsaren

Timmar in. En ren fil ut.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro. DIY Whisper-delning. Eller vi.

Otter Pro

Transcription.Solutions

Whisper API + DIY-uppdelning

Tre sätt generiska verktyg dör förbi 90-minutersmärket.

Vad går fel

Vad du kan vända här

Rekommenderade jobbinställningar för långa filer

92% gäller över en 5-timmars fil. Kvaliteten förblir stabil timme för timme.

8 saker folk frågar om långt ljudtranskription.

Släpp din långa fil. Få ett transkript tillbaka.