Fokusgrupptranskription.Varje talare märkt, varje ord.

Ladda upp en fokusgruppinspelning med 6, 8 eller till och med 10 röster. Få en ordagrant transkription med varje deltagare märkt, överlappning märkt, och en DOCX som öppnas direkt i NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Se resultat

Åtta deltagare in. Märkt ordagrant ut.

Fokusgrupper är det svåraste talaridentifieringsfallet i vår kö — liknande bakgrund, likande röster, ofta överlappande tal. Vi märker överlappningen inline istället för att ta bort den, sedan kan du byta namn på Talare 3 → 'Deltagare_F2' en gång och det sprids till hela transkriptet.

FokusgruppinspelningREC Moderator + 7 deltagare · 1:23:14
auto-identifierad en-US44 kHz gränsmikrofon · WAV
~90s
Transkription · direkt91% noggrannhet · 8 talare
S1

Så när du först öppnade förpackningen — gå igenom vad du märkte.

S2

Ärligt talat? Det första var lukten. Som ett sjukhus, typ klinisk —

S3

Ja, samma. Jag trodde det skulle vara lavendelversionen.

S2

Ja, och etiketten säger lavendel men det gör den verkligen inte —

91% på 8-talare gränsmikrofonDOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre riktiga alternativ · ärlig jämförelse

Rev mänsklig. Generisk AI. Eller vi.

Forskare väljer vanligtvis mellan att betala en mänsklig transkriptor (långsamt, noggrant, dyrt) eller köra filen genom ett generiskt AI-verktyg som inte var byggt för 8-röstrum. Vi sitter emellan — AI-hastighet, talaridentifiering inställd för forskningsmaterial, och en DOCX som importeras direkt till NVivo utan redigering.

Option 01

Rev mänsklig

En människa skriver det. Högt noggrannhet, men 24 timmars väntetid och priset ökar med varje transkriberad minut.

Noggrannhet~99% (mänsklig)
Väntetid12–24 timmar typiskt
ÖverlappningMärkt [överlappning]
QDA-exportDOCX, manuell redigering
Kostnad · per minut$1,50 ordagrant
90-min grupp~$135
Best forAvhandlingsarbete eller reglerad forskning där varje felökning måste verifieras av människa.
Option 02

Transcription.Solutions

Talaridentifiering inställd för 6-10 röster, överlappning märkt inline, DOCX-export anpassad för NVivo, ATLAS.ti och Dedoose.

Noggrannhet88–94% på gruppljud
Väntetid~1× realtid
ÖverlappningMärkt, inte borttagen
QDA-exportDOCX med talarturer
Kostnad · per minut$0,03
90-min grupp~$2,70
Best forForskare som kör flera grupper och behöver en första transkription i NVivo imorgon, inte nästa vecka.
Option 03

Otter / Sonix

Generisk AI byggd för möten. Bra på 2-3 talare, fallerar efter 5 — och exporten är inte gjord för QDA-programvara.

NoggrannhetSjunker efter 5 talare
VäntetidSnabb
ÖverlappningOfta borttagen
QDA-exportInget NVivo-format
TalargränsMjuk gräns ~6
Kostnad$17–22/användare/månad
Best forKorta intervjuer och 1-på-1-möten där inspelningen har 2-3 röster och finns i ett kalenderarbetsflöde.

Priser exakta från maj 2026. Noggrannhetsintervall kommer från vår interna sampling av kundlfokusgruppsfiler, inte syntetiska benchmark.

Specifikt för fokusgrupper

Tre saker som skadar forskare på generisk AI-verktyg.

Ställ in rätt inställningar från början och transkriptet går in i NVivo utan en redigeringsvecka.

Vad som går fel

  1. 1Överlappning försvinner. De flesta verktyg väljer en talare vid överlappning och kastar bort resten. Du förlorar exakt de moment där konsensus eller motsättningar sker.
  2. 2Talare kollapsar till 3. Verktyg antar mötesrumsstorlek och maxar talaridentifiering lågt. Dina åtta deltagare kommer tillbaka som 'Talare 1' / 'Talare 2' / 'Talare 3'.
  3. 3Export är en textvall. Inga styckebrytningar per talarturn, ingen DOCX-struktur som NVivo kan auto-koda vid import.

Vad du kan välja här

  1. 1Slå på Märk överlappande tal i jobbformuläret. Överlappning får inline `[överlappning]`-märken och båda talarna behåller sina uttryck.
  2. 2Ställ Förväntade talare: 8-12 explicit. Vi storleksanpassar talaridentifieringsklustret istället för att gissa lågt.
  3. 3Välj DOCX (QDA-klar) export. Talarturer blir stycken med talaretikett framför — NVivo, ATLAS.ti och Dedoose auto-detekterar detta format vid import.

Rekommenderade jobbinställningar för fokusgrupper

Ladda upp en fokusgruppfil med 'research'-mallen och dessa är på som standard. Åsidosätt per jobb från formuläret.

Talaridentifiering
Akustisk · förväntade 6-10 talare
Ordagrant läge
Full — felökningar behållna
Överlappningshantering
Märk inline [överlappning]
Eget ordförråd
Produkt- / märkesnamn från screener
Talarbeteckningar
Redigerbar efter jobb, sprida-alla
Export
DOCX (QDA-klar) · tidsstämplad TXT

Accuracy · real-world numbers

94% med lavaliermikrofon per deltagare. Håller på 82% med en enda gränsmikrofon.

Fokusgruppnoggranhet begränsas av mikrofontopologi, inte modellen. En lavaliermikrofon på varje deltagare ger oss rena per-talarekanaler — talaridentifiering blir trivial. En gränsmikrofon på ett konferensbord med 8 röster är det svåra fallet. Siffror nedan kommer från riktiga forskningsmaterial i vår pipeline.

94%
Lavaliermikrofon per deltagare

Varje deltagare på sitt eget spår, blandat till flerspårs WAV. Talaridentifiering hoppas över — bara textfel. Bästa fallet för avhandlingsarbete.

91%
Konferensmikrofon, 4-6 deltagare

Gränsmikrofon centrerad på bordet, måttlig rumsakustik. Röster är skilda, ibland förvirring mellan samma-kön deltagare av liknande ålder.

86%
En gränsmikrofon, 7-10 deltagare

Överlappning är vanlig, likande röster smälter samman i talaridentifiering. Räkna med 10-minut ombenämning av talarchip innan analys.

82%
Fjärrgruppmöte på mono Zoom

Komprimerad mono mix, ingen per-kanal-split tillgänglig. Ord fortfarande användbara för tematisk kodning, men verbatim-anspråk försvagar här.

Vanliga frågor

8 saker som folk frågar om fokusgrupptranskription.

01Kan jag döpa om Talare 1 till en deltagers riktiga namn eller ID?+
Ja. Klicka på någon talarmarör i redigeraren, skriv namnet eller screener-ID:t (t.ex. 'P04_F_34'), och det sprids till varje turn från den talaren i transkriptet. DOCX-exporten använder de omkallade beteckningarna.
02Hur hanterar ni överlappning och överlappande tal?+
Vi märker det inline med `[överlappning]`-markörer och behåller båda talarnas yttranden i transkriptet. Generiska verktyg väljer vanligtvis en röst och kastar bort den andra — vi gör det inte, för överlappningsmomenten är ofta där fokusgruppsdynamiken faktiskt lever.
03Importeras DOCX:en verkligen clean in i NVivo och ATLAS.ti?+
Ja. Vi exporterar med talarbeteckningar som styckenformat-rubriker, som NVivo auto-kodar vid import och ATLAS.ti känner igen som talarturer. Dedoose accepterar samma DOCX via sin transkriptimportväg.
04Hur många talare kan ni identifiera i en fil?+
Mjuk gräns omkring 12. Efter det börjar akustisk klustring slå samman likande röster — vilket vanligtvis betyder 10-15 minuters ombenämning från din sida. Ställ in 'Förväntade talare' explicit i jobbformuläret för bästa resultat.
05Ordagrant eller rensat — kan jag välja?+
Båda. Ordagrant läge behåller varje 'um', felstart och upprepad ord för diskursanalys. Rensat tar bort felökningar för läsbarhet. Du väljer per jobb; standardvalet för research-mallen är ordagrant.
06Vad sägs om IRB-krav och deltagarnas sekretess?+
Filer behandlas i vår infrastruktur, inte skickad till tredjepartsAPI:er. Vi erbjuder en per-jobb auto-delete-after-N-days flagga för IRB-protokoll. Vi är SOC 2 Type II och GDPR-kompatibla; DPA:n finns på juridikesidan om din IRB behöver den.
07Bör jag spela in video eller bara ljud?+
Bara ljud är fint — vi använder inte video för talaridentifiering. Om du har video för deltagaridentifiering, behåll den lokalt för din egen kodning; att ladda upp bara ljudspåret är snabbare och billigare.
08Hur jämför kostnaden med Rev mänsklig ordagrant?+
En 90-minuters fokusgrupp kostar omkring $2,70 här jämfört med ungefär $135 på Rev mänsklig. Trade-off är noggrannhet: vi landar på 86-94% beroende på mikrofonuppsättning, Revs mänskliga transkriptörer når ~99%. De flesta forskare använder oss för första passet och eskalerar bara specifika grupper till mänsklig om de behöver det.

Ladda upp en fokusgruppinspelning. Se transkriptet i NVivo imorgon.

30 gratis minuter varje månad. Inget kort. Talarbeteckningar, överlappningsmärkning, QDA-klar DOCX-export ingår på alla planer.

Börja gratis