Transkription för akademiska forskare.IRB-medveten, CAQDAS-redo, 100+ språk.

Ladda upp en forskningsintervju eller fokusgruppinspelning. Få talarmärkad, tidsstämplad text redo för NVivo, Atlas.ti eller MaxQDA — med audio raderat inom 24 timmar.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Se vad som kommer ut

Inspelning in. Kodningsredo transkription ut.

Vi märker varje deltagaromgång med en tidsstämpel från början, behåller fyllerord om du ber om ordagrant, och exporterar DOCX med talarstilar som ditt CAQDAS-verktyg redan känner igen.

Halvstrukturerad intervju · .wavREC 2 talare · 1:08:24
auto-detected en-GB44.1 kHz mono · lavalier mic
~90s
Transkription · streaming94% noggrannhet · ordagrant läge
S1

Kan du gå igenom första gången du märkte förändringen i området?

S2

Eh, det var nog 2019 — bakeriet på hörnet stängde, och, ja, då gick det upp för mig.

S1

Och hur kändes det att se det hända under dessa månader?

S2

Ärligt talat? Som om platsen jag känt i trettio år försvann, bit för bit.

94% på lavaliermic-intervjuDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre riktiga alternativ · ärlig jämförelse

Rev human. NVivo Transcription. Eller vi.

Revs mänskliga service är historiens standard för avhandlingskvalitets citat. NVivo integrerar AI-transkription direkt i CAQDAS-verktyget. Vi ligger däremellan — snabbare än Rev, mer noggrann och IRB-vänligare än NVivos inbyggda tjänst.

Option 01

Rev (mänsklig transkription)

Människor skriver det. Långsamt, teget, men guldstandarden för publicerbar ordagran text.

Vändtid12–24 timmar (vanligt)
Kostnad · per minut$1.50 mänsklig / $0.25 AI
TalarmärkningJa, placerad manuellt
LjudlagringLagrat på Revs servrar
SpråkEN mänsklig · ~30 AI
CAQDAS-exportDOCX, TXT (manuell)
Best forEnstaka höginsatsintervjuer avsedda för direktcitat i en publicerad artikel, där budget inte är begränsningen.
Option 02

Transcription.Solutions

AI-transkription på minuter, audio raderat inom 24h, DOCX utformad för NVivo och Atlas.ti-import.

Vändtid~5 min för en 60-min fil
Kostnad · per minut$0.03
TalarmärkningDiariserad, byt namn i appen
LjudlagringRaderat inom 24 timmar
Språk100+, automatisk igenkänning
CAQDAS-exportDOCX rubrikstiler + TXT
Best forForskare som genomför 20+ intervjuer och behöver snabba första förslag transkriptioner, för att sedan handkorrigera de 5% av citaten som ska publiceras.
Option 03

NVivo Transcription / Otter

AI-transkription paketerad inuti ditt CAQDAS-verktyg eller anteckningsapp. Praktiskt, engelskfokuserat, mindre kontroll.

VändtidJämförbar (AI)
KostnadKreditpaket · ~$0.30/min
TalarmärkningAkustisk, engelskoptimerad
LjudlagringBunden till abonnemang
SpråkNoggrannheten sjunker för icke-engelska
CAQDAS-exportEndast inbyggd i NVivo
Best forSolo-doktorander som arbetar helt på engelska inom ett CAQDAS-ekosystem och vill ha en enda faktura.

Prissättning och funktionsflaggor korrekta från 2026. Revs AI/mänsklig uppdelning och NVivo Transcription-kreditprissättning varierar beroende på region och akademisk licensiering.

Specifikt för kvalitativ forskning

Tre saker som skadar forskare med generiska transkriptionsverktyg.

Ändra rätt inställningar innan du laddar upp och transkriptionen importeras direkt till ditt CAQDAS-projekt.

Det som går fel

  1. 1Fyllerord tas bort tystlåst. Generisk AI tar bort "eh", "liksom", felaktiga starter — okej för mötesanteckningar, dödligt för samtalanalys eller diskursarbete.
  2. 2Domänterminn (teoretiska ramverk, läkemedelnamn, ortnamn, släktskapsvillkor) transkriberas fonetiskt. Kodningen behöver då ett sök-och-ersätt-pass.
  3. 3Audio sitter på leverantörens servrar på obestämd tid. De flesta IRB-datahanteringsplaner kräver radering eller kontrollerad lagring — leverantörer dokumenterar detta sällan tydligt.

Vad du ändrar här

  1. 1Växla till Ordagrant läge på jobbformuläret. Vi behåller fyllerord, felaktiga starter, upprepningar och skrattmarkeringar — rent läge är opt-in, inte standard för forskare.
  2. 2Klistra in dina kodebokstermer och egennamn i Anpassad vokabulär. Vi skickar det som ett igenkänningstips, inte en hård substitution, så kontext vinner fortfarande.
  3. 3Audio raderas inom 24 timmar efter jobbbeslutning. Transkriptionen stannar i ditt konto. Vi kan ge ett raderingbevis för din IRB-fil på begäran.

Rekommenderade jobinställningar för forskningsintervjuer

Ladda upp en fältinspelning och dessa är på som standard. Åsidosätt per jobb från formuläret.

Läge
Ordagrant (fyllerord + felstarter på)
Talarmodell
Intervju · 2–8 talare
Språk
Automatisk igenkänning · brytningstoleramt
Tidsstämplar
Varje omgång
Ljudlagring
Radera inom 24h
Export
DOCX (CAQDAS-stilar) · TXT · SRT

Accuracy · real-world numbers

94% på en ren lavaliermic-intervju. Ärlig om vad fältarbete bryter.

Fältljud är det svåra fallet inom transkription — öppna rum, brytningsbehäftad engelska, överlappande tal i fokusgrupper. Lavaliermic tvåparts intervjuer når sitt maximum; omgivningsljudfältinspelningar och stora fokusgrupper försämras snabbast. Siffrorna nedan kommer från faktiska forskaruppladdningar, inte syntetiska riktmärken.

95%
1-till-1, lavalier eller USB-mikrofon

Tyst rum, en L2 eller modersmål talare, inspelningsapparat på bordet. Bästa fall för semistrukturerade intervjuer — de flesta tvåparts studier hamnar här.

91%
Handhållen inspelare, 2–3 talare

Zoom H4n eller telefoninspelning på bordet. Talarnas positioner identifieras efter riktning. Räkna med ~5 min för omdöpning.

85%
Fältintervju, omgivningsljud

Café, marknad, gångintervju. Bakgrundsprat och trafik påverkar korta svar; huvudsamtalen förblir kodbara.

80%
Fokusgrupp, 5–8 deltagare

Överlappande tal och delad mikrofon. Diarisering kan sammanslå några tystare röster — räkna med att behöva klargöra vid kodning.

Vanliga frågor

8 saker forskare frågar om akademisk transkription.

01Är detta acceptabelt enligt en typisk IRB-datahanteringsplan?+
De flesta planer vi sett godkänner oss när de läser två faktorer: audio raderas inom 24 timmar efter jobbbeslutning, och transkriptioner stannar endast i forskarens konto. Vi är inte själva en IRB — din styrelse gör det slutgiltiga beslutet — men vi kan ge en skriftlig bearbetningsbeskrivning för ditt protokoll på begäran.
02Behåller du min intervjuaudio?+
Nej. Audiofilen raderas inom 24 timmar efter att jobbet är klart. Endast transkriptionen stannar i ditt konto, och du kan ta bort det när som helst. Vi använder inte forskningsaudio för att träna modeller.
03Kan du göra äkta ordagrant — med fyllerord, felstarter och överlappningar — för samtalanalys?+
Ja. Slå på Ordagrant läge på jobbformuläret och vi behåller "eh", "uh", upprepningar, felstarter och skrattmarkeringar. Överlappning märks med en kröllig parentes vid omgångsgränsen. Vi gör inte Jefferson-notation automatiskt — det är fortfarande ett mänskligt pass.
04Kommer DOCX att importeras rent in i NVivo, Atlas.ti eller MaxQDA?+
Ja. Vår DOCX använder rubrik- och talarstilar som varje verktyg förväntar sig för automatisk kodning efter talare. I NVivo, använd Arkiv → Importera → Transkriptioner. I Atlas.ti och MaxQDA, bevaras talarstrukturen så automatisk kodning efter talare fungerar direkt utan ytterligare anpassning.
05Hur hanterar den brytningsbehäftad engelska eller flerspråkiga intervjuer?+
Vi stöder 100+ språk med automatisk igenkänning, inklusive kodväxlande inom en enda inspelning. Tung L2-brytning landar omkring 85–90% på rent ljud. För minoritetsspråk med sparsmakad träningsdata (t.ex. vissa afrikanska och inhemska språk), är noggrannheten lägre och vi säger det på språkväljaren.
06Fokusgrupper med 6–8 personer — fungerar diarisering verkligen?+
Delvis. Akustisk diarisering separerar på ett tillförlitligt sätt 4–5 distinkta röster på en delad mikrofon. Därefter förväntar du att modellen sammanslår de två tystaste deltagarna. En snabb fix är att manuellt omdöpa dessa talare i transkriptionseditorn — vanligtvis tar det 10–15 minuter per transkription.
07Kan andra forskare och doktorander i mitt projekt få åtkomst till transkriptioner?+
Ja. Arbetsytor stöder delade mappar med behörigheter per användare — forskarledning kan se alla intervjuer, forskarassistenter ser endast sin tilldelad kohort. Användbara för multisätesstudier där du inte vill att en student exporterar en annan students data.
08Erbjuder du en mänsklig granskning för direktcitat i publiceringar?+
Inte ännu, och vi säger inte att vi gör det. För citat som går in i en avhandling eller artikel rekommenderar vi: kör AI-transkriptionen först, kod i ditt CAQDAS-verktyg, sedan handkorrigera de specifika 30–60 sekunder omkring varje citat mot audion innan det raderas. Det är arbetsflödet som de flesta av våra forskaranvändare använder.

Ladda upp en intervju. Se om transkriptionen kodas på det sätt du skulle koda det.

30 gratis minuter varje månad. Inget kort. Ordagrant läge, 100+ språk, CAQDAS-redo DOCX, audio raderat inom 24h.

Börja gratis