Intervjutranskriktion — transkribera en intervju med talarmarkeringar och tidsstämplar

Intervjutranskriktion.Olika inspelning, samma resultat.

Telefonmemo, Zoom-samtal, lavalier-mikrofon eller handhållen fältspelare — lämna intervjuinspelningen och få talarmarkserad, tidsstämplad text som du kan citera.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Två röster in. Två röster ut, märkta.

De flesta intervjuer är två personer på en enhet — en telefon på bordet, en inspelare mellan er. Vi separerar intervjuljudet i reporter och källa även från en enda monokanal, sedan tidsstämplar vi varje tur för citering.

Fältspelare · WAVREC 2 talare · 38:42

auto-detekterad sv-SE48 kHz mono · 1411 kbps

~90s

Transkript · streaming94% noggrannhet

Kan du gå igenom vad du såg på morgonen den artonde?

Jag kom dit omkring sex. Lastkajdörren var redan öppen, vilket den inte borde ha varit.

Och du hade rapporterat dörproblemet tidigare — till vem?

Till Diane Okafor i fastighetsdriften, två gånger i mars. Jag har e-postmeddelandena.

94% på fält-WAVDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Rev mänsklig transkription

Riktiga människor skriver din intervju. Bäst på fientligt ljud, men du väntar och betalar.

Vändtid12–24 timmar typiskt

Noggrannhet på rent ljud99% (påstås)

TalarmarkeringarManuell, ingår

SpråkSV mänsklig · 30+ AI

Kostnad · per minut$1.50 mänsklig · $0.25 AI

IntegritetLjud skickat till uppdragstagare

Best forDomstolsrelaterade eller publicerings-kritiska intervjuer på dåligt ljud där du behöver ett människooöra och har en dag att vänta.

Option 02

Transcription.Solutions

AI-transkript, talarsplittrat, klart på minuter. Samma motor för telefonmemo, Zoom eller fältspelare.

Vändtid~3 min per timme ljud

Noggrannhet på rent ljud94–96%

TalarmarkeringarAuto · byt namn i redigeraren

Språk99, auto-detekterat

Kostnad · per minut$0.03

IntegritetLjud raderat om 24h · ingen träning

Best forJournalister, forskare och producenter som gör flera intervjuer per vecka och behöver snabbt, citebar text utan att ladda upp till en uppdragstagare.

Option 03

Otter / Trint

AI-transkription med forskningsvänd redigerare. Starkt på engelska, låst till månatliga planer.

VändtidRealtid till ~5 min

Noggrannhet på rent ljud~90–93%

TalarmarkeringarJa · EN-anpassat

SpråkOtter EN-endast · Trint 30+

Kostnad$17–80/användare/mån (prenumeration)

IntegritetLagrat på konto som standard

Best forTeam som vill ha ett värdbibliotek med varje intervju någonsin inspelad och inte störs av en månatlig sätesavgift per användare.

Prissättning och funktionsflaggor korrekta från 2026. Rev mänsklig vändtid varierar beroende på ködjup och ljudlängd.

8 saker folk frågar om intervjutranskriktion.

01Kan jag använda dessa transkript i en publicerad artikel utan att verifiera mot ljudet?+

För direkta citat — nej, verifiera alltid mot ljudet. AI-transkript på 94% noggrannhet mislässer fortfarande ett ord på 17 i genomsnitt, och det felaktiga ordet i ett citat är en rättelse. Transkriptet är för navigering och utkast; ljudet är sanningens källa.

02Min inspelare sparade en stereo-WAV med en mikrofon per talare. Vad gör jag?+

Ladda upp den filen direkt — konvertera inte till mono först. Vi detekterar de två kanalerna och dirigerar varje till sitt eget diarization-spår, vilket är den högsta-noggrannhets vägen vi har. Förvänta 96%+ på ett stilla rum.

03Vad med intervjuer inspelade över ett telefonsamtal?+

Telefonljudet är 8 kHz smalband, vilket begränsar noggrannheten till omkring 88% även på en ren linje. Vi separerar fortfarande de två parterna med kanaluppdelning om din inspelarapp fångade dem separat (de flesta gör det). VoIP-samtal över WhatsApp eller Signal låter lite bättre än PSTN.

04Kan jag redigera off-the-record-sektioner innan jag delar transkriptet?+

Ja. I redigeraren väljer du tidsstämpelintervallet och markerar det `[REDACTED]`. Exporten ersätter texten med en redigeringsmarkering men behåller tidsstämplarna så dokumentet fortfarande spårar ljudet.

05Tränar ni modeller på mina intervjuinspelningar?+

Nej. Källljudet raderas från vår infrastruktur inom 24 timmar från slutförandet, och vi använder inte kundspelningar för modellträning under någon plan. Transkripttexten stannar på ditt konto tills du raderar den.

06Tre eller fyra personer på en panelintervju — fungerar diarization fortfarande?+

Upp till omkring sex distinkta röster, ja, men noggrannheten på talaruppdelning sjunker med varje tillagd person och blir värre när två talare låter lika. Planera en 2–3-minuters omdöpar-pass på talarskipporna efter att transkriptet landar.

07Kan du transkribera intervjuer på andra språk än engelska?+

99 språk, auto-detekterat. Kodväxling (engelsk källa glider in i spanska mitt i meningen) hanteras i 12 språkpar. Noggrannheten varierar beroende på språk — europeiska språk matchar engelska; resurser-låga afrikanska och centralasiatiska språk kör 5–10 poäng lägre.

08Jag spelar in på ett Zoom-samtal — ska jag istället använda din Zoom-sida?+

Samma motor, samma resultat. Zoom-sidan täcker molninspelings-detaljer (per-deltagare ljud, dial-in-försämring). Om du genomför en intervju åt gången över Zoom, fungerar båda vägar — lämna MP4 här och talarmarkeringarna kommer ut likadant.

Intervjutranskriktion.Olika inspelning, samma resultat.

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

Två röster in. Två röster ut, märkta.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Rev mänsklig. Otter eller Trint. Eller vi.

Rev mänsklig transkription

Transcription.Solutions

Otter / Trint

Tre saker som slår till folk med generiska transkriptionsverktyg.

Vad som går fel

Vad du vänder här

Rekommenderade jobbinställningar för intervjuer

96% på en bra lav. Fortfarande läsbar på en caféinspelning.

8 saker folk frågar om intervjutranskriktion.

Lämna din intervjuinspelning. Se vad som kommer ut.