Fokusgrupptranskription — transkribera fokusgrupper med talarbeteckningar för varje deltagare

Fokusgrupptranskription.Varje talare märkt, varje ord.

Ladda upp en fokusgruppinspelning med 6, 8 eller till och med 10 röster. Få en ordagrant transkription med varje deltagare märkt, överlappning märkt, och en DOCX som öppnas direkt i NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Åtta deltagare in. Märkt ordagrant ut.

Fokusgrupper är det svåraste talaridentifieringsfallet i vår kö — liknande bakgrund, likande röster, ofta överlappande tal. Vi märker överlappningen inline istället för att ta bort den, sedan kan du byta namn på Talare 3 → 'Deltagare_F2' en gång och det sprids till hela transkriptet.

FokusgruppinspelningREC Moderator + 7 deltagare · 1:23:14

auto-identifierad en-US44 kHz gränsmikrofon · WAV

~90s

Transkription · direkt91% noggrannhet · 8 talare

Så när du först öppnade förpackningen — gå igenom vad du märkte.

Ärligt talat? Det första var lukten. Som ett sjukhus, typ klinisk —

Ja, samma. Jag trodde det skulle vara lavendelversionen.

Ja, och etiketten säger lavendel men det gör den verkligen inte —

91% på 8-talare gränsmikrofonDOCX (QDA-ready) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev mänsklig. Generisk AI. Eller vi.

Forskare väljer vanligtvis mellan att betala en mänsklig transkriptor (långsamt, noggrant, dyrt) eller köra filen genom ett generiskt AI-verktyg som inte var byggt för 8-röstrum. Vi sitter emellan — AI-hastighet, talaridentifiering inställd för forskningsmaterial, och en DOCX som importeras direkt till NVivo utan redigering.

Option 01

Rev mänsklig

En människa skriver det. Högt noggrannhet, men 24 timmars väntetid och priset ökar med varje transkriberad minut.

Noggrannhet~99% (mänsklig)

Väntetid12–24 timmar typiskt

ÖverlappningMärkt [överlappning]

QDA-exportDOCX, manuell redigering

Kostnad · per minut$1,50 ordagrant

90-min grupp~$135

Best forAvhandlingsarbete eller reglerad forskning där varje felökning måste verifieras av människa.

Option 02

Transcription.Solutions

Talaridentifiering inställd för 6-10 röster, överlappning märkt inline, DOCX-export anpassad för NVivo, ATLAS.ti och Dedoose.

Noggrannhet88–94% på gruppljud

Väntetid~1× realtid

ÖverlappningMärkt, inte borttagen

QDA-exportDOCX med talarturer

Kostnad · per minut$0,03

90-min grupp~$2,70

Best forForskare som kör flera grupper och behöver en första transkription i NVivo imorgon, inte nästa vecka.

Option 03

Otter / Sonix

Generisk AI byggd för möten. Bra på 2-3 talare, fallerar efter 5 — och exporten är inte gjord för QDA-programvara.

NoggrannhetSjunker efter 5 talare

VäntetidSnabb

ÖverlappningOfta borttagen

QDA-exportInget NVivo-format

TalargränsMjuk gräns ~6

Kostnad$17–22/användare/månad

Best forKorta intervjuer och 1-på-1-möten där inspelningen har 2-3 röster och finns i ett kalenderarbetsflöde.

Priser exakta från maj 2026. Noggrannhetsintervall kommer från vår interna sampling av kundlfokusgruppsfiler, inte syntetiska benchmark.

94% med lavaliermikrofon per deltagare. Håller på 82% med en enda gränsmikrofon.

Fokusgruppnoggranhet begränsas av mikrofontopologi, inte modellen. En lavaliermikrofon på varje deltagare ger oss rena per-talarekanaler — talaridentifiering blir trivial. En gränsmikrofon på ett konferensbord med 8 röster är det svåra fallet. Siffror nedan kommer från riktiga forskningsmaterial i vår pipeline.

8 saker som folk frågar om fokusgrupptranskription.

01Kan jag döpa om Talare 1 till en deltagers riktiga namn eller ID?+

Ja. Klicka på någon talarmarör i redigeraren, skriv namnet eller screener-ID:t (t.ex. 'P04_F_34'), och det sprids till varje turn från den talaren i transkriptet. DOCX-exporten använder de omkallade beteckningarna.

02Hur hanterar ni överlappning och överlappande tal?+

Vi märker det inline med `[överlappning]`-markörer och behåller båda talarnas yttranden i transkriptet. Generiska verktyg väljer vanligtvis en röst och kastar bort den andra — vi gör det inte, för överlappningsmomenten är ofta där fokusgruppsdynamiken faktiskt lever.

03Importeras DOCX:en verkligen clean in i NVivo och ATLAS.ti?+

Ja. Vi exporterar med talarbeteckningar som styckenformat-rubriker, som NVivo auto-kodar vid import och ATLAS.ti känner igen som talarturer. Dedoose accepterar samma DOCX via sin transkriptimportväg.

04Hur många talare kan ni identifiera i en fil?+

Mjuk gräns omkring 12. Efter det börjar akustisk klustring slå samman likande röster — vilket vanligtvis betyder 10-15 minuters ombenämning från din sida. Ställ in 'Förväntade talare' explicit i jobbformuläret för bästa resultat.

05Ordagrant eller rensat — kan jag välja?+

Båda. Ordagrant läge behåller varje 'um', felstart och upprepad ord för diskursanalys. Rensat tar bort felökningar för läsbarhet. Du väljer per jobb; standardvalet för research-mallen är ordagrant.

06Vad sägs om IRB-krav och deltagarnas sekretess?+

Filer behandlas i vår infrastruktur, inte skickad till tredjepartsAPI:er. Vi erbjuder en per-jobb auto-delete-after-N-days flagga för IRB-protokoll. Vi är SOC 2 Type II och GDPR-kompatibla; DPA:n finns på juridikesidan om din IRB behöver den.

07Bör jag spela in video eller bara ljud?+

Bara ljud är fint — vi använder inte video för talaridentifiering. Om du har video för deltagaridentifiering, behåll den lokalt för din egen kodning; att ladda upp bara ljudspåret är snabbare och billigare.

08Hur jämför kostnaden med Rev mänsklig ordagrant?+

En 90-minuters fokusgrupp kostar omkring $2,70 här jämfört med ungefär $135 på Rev mänsklig. Trade-off är noggrannhet: vi landar på 86-94% beroende på mikrofonuppsättning, Revs mänskliga transkriptörer når ~99%. De flesta forskare använder oss för första passet och eskalerar bara specifika grupper till mänsklig om de behöver det.