Fokusgrupptranskription.Alle talere mærket, hvert ord.

Slip en fokusgruppe-optagelse med 6, 8, eller helt 10 stemmer. Få et ordret transkribet med hver deltager mærket, tale-overlap markeret, og en DOCX der går direkte ind i NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Se hvad der kommer ud

8 deltagere ind. Mærket ordret ud.

Fokusgrupper er det sværeste talergenkendelsestilfælde i vores kø — ens demografi, ens stemmer, hyppigt tale-overlap. Vi markerer overlapningen inline i stedet for at droppe den, og så omdøber du Taler 3 → 'Participant_F2' en gang og det propagerer.

Fokusgruppe-optagelseREC Moderator + 7 deltagere · 1:23:14
auto-detekteret en-US44 kHz boundary mic · WAV
~90s
Transkribet · streaming91% nøjagtighed · 8 talere
S1

Så da du først åbnede emballagen — gå mig gennem hvad du bemærkede.

S2

Ærligt? Det første var lugten. Som et hospital, ret klinisk —

S3

Ja, det samme. Jeg troede det skulle være den lavendelduftende.

S2

Ja, og etiketten siger lavendel, men det er det virkelig ikke —

91% på 8-taler-rummicDOCX (QDA-klar) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre rigtige muligheder · ærlig sammenligning

Rev-menneske. Generisk AI. Eller os.

Forskere vælger typisk mellem at betale en menneskelig transkribar (langsom, præcis, dyr) eller at køre filen gennem et generisk AI-værktøj der ikke var bygget til 8-stemmede rum. Vi sidder midt i mellem — AI-hastighed, talergenkendelse afstemt til forskningsoptagelser, og en DOCX der går ind i NVivo uden operation.

Option 01

Rev menneskeligt ordret

En menneske skriver det. Høj nøjagtighed, men 24-timers omløb og prisen skaleres lineært med timer.

Nøjagtighed~99% (menneske)
Omløb12–24 timer typisk
Tale-overlapMarkeret [crosstalk]
QDA-eksportDOCX, manuel oprydning
Omkostning · pr. minut$1.50 ordret
90-min gruppe~$135
Best forAfhandlingsarbejde eller reguleret forskning hvor hver disfluens skal menneske-verificeres.
Option 02

Transcription.Solutions

Talergenkendelse justeret til 6-10 stemmer, tale-overlap markeret inline, DOCX-eksport konstrueret til NVivo, ATLAS.ti og Dedoose.

Nøjagtighed88–94% på gruppelyd
Omløb~1× realtid
Tale-overlapMarkeret, ikke droppet
QDA-eksportDOCX med talerfølger
Omkostning · pr. minut$0.03
90-min gruppe~$2.70
Best forForskere der kører flere grupper og har brug for et første-pass-transkribet i NVivo i morgen, ikke næste uge.
Option 03

Otter / Sonix

Generisk AI bygget til møder. Ikke dårligt på 2-3 talere, falder efter 5 — og eksporter forudser ikke QDA-software.

NøjagtighedFalder efter 5 talere
OmløbHurtigt
Tale-overlapOfte droppet
QDA-eksportIntet indbygget NVivo-format
TalerloftBlødt loft ~6
Omkostning$17–22/bruger/md
Best forSmå interviews og 1-til-1'ere hvor optagelsen har 2-3 stemmer og ligger i et kalenderarbejdsflow.

Prissætning nøjagtig fra maj 2026. Nøjagtighdsintervaller kommer fra vores interne stikprøve af kunders fokusgruppefiler, ikke syntetiske benchmarks.

Specifikt for fokusgrupper

Tre ting der bider forskere med generisk AI-værktøjer.

Flip de rigtige indstillinger fra starten og transkribet går direkte ind i NVivo uden en oprydningsweekend.

Hvad der går galt

  1. 1Tale-overlap bliver droppet. De fleste consumer-værktøjer vælger en taler under overlap og discarderer resten. Du mister præcis de øjeblikke hvor konsensus eller tilbagegang opstår.
  2. 2Talere kollapserer til 3. Værktøjer antager møde-størrelse rum og begrænser talergenkendelse-klynger lavt. Dine otte deltagere kommer tilbage som 'Taler 1' / 'Taler 2' / 'Taler 3'.
  3. 3Eksport er en tekstmur. Ingen afsnitsbrudd per talerfølge, ingen DOCX-struktur NVivo kan auto-kode ved import.

Hvad der skal flippes her

  1. 1Tænd Markér overlappende tale i job-formularen. Tale-overlap får inline `[overlap]` markører og begge talere beholder deres ytringer.
  2. 2Sæt Forventede talere: 8-12 eksplicit. Vi tilpasser talergenkendelse-klyngetal til det matcher i stedet for at gætte lavt.
  3. 3Vælg DOCX (QDA-klar) eksport. Talerfølger bliver afsnit præfikset med etiketten — NVivo, ATLAS.ti og Dedoose alle auto-detekterer dette format ved import.

Anbefalet jobindstillinger for fokusgrupper

Slip en fokusgruppe-fil med 'research' skabelonen og disse flip tændes som standard. Overrid per-job fra formularen.

Talergenkendelse
Akustisk · forventet 6-10 talere
Ordret tilstand
Fuld — disfluenser bevaret
Overlap-håndtering
Markér inline [overlap]
Brugerdefineret ordforråd
Produkt / mærkenavne fra screener
Talerlabels
Redigerbare efter-job, propagér-alle
Eksport
DOCX (QDA-klar) · tidsmarkeret TXT

Accuracy · real-world numbers

94% på lavaliermikrofon per deltager. Holder ved 82% på en enkelt rummic.

Fokusgruppers nøjagtighed er afgrænset af mikrofontopologi, ikke modellen. En lavalier på hver deltager giver os rene per-taler-kanaler — talergenkendelse bliver triviel. En grænseflademikrofon på et konferencebord med 8 stemmer er det vanskelige tilfælde. Tal nedenfor kommer fra rigtige forsøgsoptagelser i vores pipeline.

94%
Lavalier per deltager

Hver deltager på deres eget spor, blandet til multitrack WAV. Talergenkendelse sprunget over — kun tekst-fejl. Bedste tilfælde til afhandlingsklasse arbejde.

91%
Konferencemc, 4-6 deltagere

Grænseflademikrofon centreret på bordet, moderat rumbehandling. Stemmer skelbare, lejlighedsvis forvirring mellem samme-køn deltagere af lignende alder.

86%
Enkelt rummic, 7-10 deltagere

Tale-overlap hyppigt, ens stemmer blander under akustisk talergenkendelse. Forventes en 10-minutters omdøb- og flettepas på talerkortene inden analyse.

82%
Fjerngruppe på mono Zoom

Komprimeret mono-blanding, ingen per-kanal split tilgængelig. Ord stadig brugbare til tematisk kodning, men disfluens-niveau ordret-påstande svækkes her.

Hyppige spørgsmål

8 ting folk spørger om fokusgrupptranskription.

01Kan jeg omdøbe Taler 1 til en deltagers rigtige navn eller ID?+
Ja. Klik på ethvert talerkort i editoren, skriv navn eller screener ID (f.eks. 'P04_F_34'), og det propagerer til hver tur fra den taler i transkribet. DOCX-eksport bruger de omdøbte labels.
02Hvordan håndterer du tale-overlap og overlappende tale?+
Vi markerer det inline med `[overlap]` markører og holder begge talers ytringer i transkribet. Generiske værktøjer vælger typisk en stemme og dropper den anden — vi gør det ikke, fordi overlap-øjeblikke ofte er hvor det egentlige fokusgruppe-dynamik lever.
03Importeres DOCX'en virkeligt rent ind i NVivo og ATLAS.ti?+
Ja. Vi eksporterer med talerlabels som afsnit-stil-overskrifter, som NVivo auto-koder ved import og ATLAS.ti erkender som talerfølger. Dedoose tager samme DOCX via dens transkribet-import-sti.
04Hvor mange talere kan du talergenkende i en fil?+
Blødt loft omkring 12. Derudover løber akustisk klyngning sammen med ens stemmer — som regel betyder det et 10-15 minutters omdøb-pas på din side. Sæt 'Forventede talere' eksplicit i job-formularen for bedste resultater.
05Ordret eller opryddet — kan jeg vælge?+
Begge. Ordret tilstand holder hvert 'um', falsk start og gentaget ord til diskursanalyse. Opryddet fjerner disfluenser for læsbarhed. Du vælger per-job; standardvalg for research-skabelonen er ordret.
06Hvad med IRB-krav og deltager-fortrolighed?+
Filer processeres i vores infrastruktur, ikke sendt til tredjepartsAPI'er. Vi tilbyder et per-job auto-slet-efter-N-dage flag til IRB-protokoller. Vi er SOC 2 Type II og GDPR-kompatibel; DPA'en er på den juridiske side hvis din IRB har brug for det.
07Skal jeg optage video eller kun lyd?+
Kun lyd er fint — vi bruger ikke video til talergenkendelse. Hvis du har video til deltager-identification, hold den lokalt til din egen kodning; upload af bare lydspor er hurtigere og billigere.
08Hvordan sammenligner omkostningen med Rev menneskeligt ordret?+
En 90-minutters fokusgruppe løber omkring $2.70 her mod cirka $135 på Rev ordret. Afvejning er nøjagtighed: vi lander på 86-94% afhængig af mic-opsætning, Rev's menneske-talere rammer ~99%. De fleste forskere bruger os til første-pass og trapezerer kun specifikke grupper til menneske hvis nødvendigt.

Slip en fokusgruppe-optagelse. Se transkribet i NVivo i morgen.

30 gratis minutter hver måned. Intet kort. Talerlabels, tale-overlap-markering, QDA-klar DOCX-eksport inkluderet på alle planer.

Start gratis