Transcription ng focus group.Bawat nagsasalita may label, bawat salita.

I-upload ang focus group recording na may 6, 8, o kahit 10 na boses. Makakuha ng verbatim transcript na may label para sa bawat participant, cross-talk na may tag, at DOCX na direktang papasok sa NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Tingnan kung ano ang lalabas

Walong participants papasok. Labelled verbatim ang lumabas.

Focus groups ang pinakamahirap na diarization case sa aming queue — pareho ang demographics, pareho ang boses, madalas ang cross-talk overlap. Tina-tag namin ang overlap inline sa halip na i-discard ito, tapos iyong baguhin ang Speaker 3 → 'Participant_F2' minsan lang at ito ay mag-perpektuate sa lahat.

Focus group recordingREC Moderator + 7 participants · 1:23:14
auto-detected en-US44 kHz boundary mic · WAV
~90s
Transcript · streaming91% accuracy · 8 speakers
S1

So kapag binuksan mo muna ang packaging — ikuwento mo sa akin kung ano ang napansin mo.

S2

Tama? Ang unang bagay ay ang amoy. Parang ospital, clinical —

S3

Oo, pareho. Akala ko ang lavender one ito.

S2

Tama, at ang label ay lavender pero talaga nang hindi —

91% sa 8-speaker room micDOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tatlong tunay na option · honest na comparison

Rev human. Generic AI. O kami.

Researchers ay kadalasang mamimili ng human transcriber (mabagal, accurate, mahal) o tatakbo ng file sa generic AI tool na hindi ginawa para sa 8-voice rooms. Kami ay nasa gitna — AI speed, diarization na tuned para sa research recordings, at DOCX na papasok sa NVivo nang walang surgery.

Option 01

Rev human verbatim

Nag-type ang human. Mataas ang accuracy, pero 24-hour turnaround at ang presyo ay tumataas linear sa hours.

Accuracy~99% (human)
Turnaround12–24 hours typical
Cross-talkMarked [crosstalk]
QDA exportDOCX, manual cleanup
Cost · per min$1.50 verbatim
90-min group~$135
Best forDissertation work o regulated research kung saan bawat disfluency ay dapat human-verified.
Option 02

Transcription.Solutions

Diarization tuned para sa 6-10 voices, cross-talk tagged inline, DOCX export sized para sa NVivo, ATLAS.ti, at Dedoose.

Accuracy88–94% sa group audio
Turnaround~1× realtime
Cross-talkTagged, hindi na-drop
QDA exportDOCX na may speaker turns
Cost · per min$0.03
90-min group~$2.70
Best forResearchers na gumagawa ng multiple groups na kailangan ng first-pass transcript sa NVivo bukas umaga, hindi susunod na linggo.
Option 03

Otter / Sonix

Generic AI ginawa para sa meetings. Decent sa 2-3 speakers, bumabagay ang performance— at exports ay hindi counting ang QDA software.

AccuracyBumabagay sa lagpas 5 speakers
TurnaroundMabilis
Cross-talkMadalas na na-drop
QDA exportWalang native NVivo format
Speaker capSoft limit ~6
Cost$17–22/user/mo
Best forMaliit na interviews at 1-on-1s kung saan ang recording ay may 2-3 voices at naroroon sa calendar workflow.

Pricing accurate as of May 2026. Accuracy ranges ay galing sa aming internal sample ng customer focus group files, hindi synthetic benchmarks.

Specific sa focus groups

Tatlong bagay ang nakaka-bite sa researchers sa generic AI tools.

I-flip ang tamang settings sa simula at ang transcript ay papasok sa NVivo nang walang cleanup weekend.

Ano ang napapahiya

  1. 1Cross-talk ay na-drop. Karamihan ng consumer tools ay pumipili ng isang speaker sa overlap at dina-discard ang iba. Mawawalan ka ng eksaktong moments kung saan ang consensus o pushback ay nangyayari.
  2. 2Speakers ay nagsasama sa 3. Tools ay inaasume ang meeting-sized rooms at nag-cap ng diarization clusters nang mababa. Ang walong participants mo ay bumabalik bilang 'Speaker 1' / 'Speaker 2' / 'Speaker 3'.
  3. 3Export ay isang dinding ng teksto. Walang paragraph breaks per speaker turn, walang DOCX structure na NVivo ay maaaring auto-code sa import.

Anong i-flip dito

  1. 1I-turn on ang Tag overlapping speech sa job form. Cross-talk ay nakakakuha ng inline `[overlap]` markers at pareho ang speakers ay nananatiling may utterances.
  2. 2I-set ang Expected speakers: 8-12 explicitly. Kami ay nag-size ng diarization cluster count upang tumugma sa halip na mag-guess nang mababa.
  3. 3Piliin ang DOCX (QDA-ready) export. Speaker turns ay nagiging paragraphs na may prefix sa label — NVivo, ATLAS.ti, at Dedoose ay lahat ay auto-detect ng format na ito sa import.

Recommended job settings para sa focus groups

I-drop ang focus group file na may 'research' template at ang mga ito ay naka-flip na by default. Override per-job mula sa form.

Diarization
Acoustic · expected 6-10 speakers
Verbatim mode
Full — disfluencies kept
Overlap handling
Tag inline [overlap]
Custom vocabulary
Product / brand names mula sa screener
Speaker labels
Editable post-job, propagate-all
Export
DOCX (QDA-ready) · timestamped TXT

Accuracy · real-world numbers

94% sa lavalier-per-participant. Tumatatag sa 82% sa isang room mic.

Focus group accuracy ay bounded ng microphone topology, hindi ang model. Lavalier sa bawat participant ay nagbibigay sa amin ng clean per-speaker channels — diarization ay nagiging trivial. Isang boundary mic sa conference table na may 8 voices ang hard case. Ang numbers sa ibaba ay nagmula sa tunay na research recordings sa aming pipeline.

94%
Lavalier per participant

Bawat participant sa kanilang sariling track, mixed sa multitrack WAV. Diarization skipped — text-only error. Best case para sa dissertation-grade work.

91%
Conference mic, 4-6 participants

Boundary mic centered sa table, moderate room treatment. Voices ay makikita, occasional confusion sa pagitan ng same-gender participants na magkakaedad.

86%
Isang room mic, 7-10 participants

Cross-talk ay madalas, pareho ang boses ay nagsasama sa acoustic diarization. Expect ng 10-minute rename at merge pass sa speaker chips bago ang analysis.

82%
Remote group sa mono Zoom

Compressed mono mix, walang per-channel split available. Words ay still usable para sa thematic coding, pero disfluency-level verbatim claims ay nag-weaken dito.

Mga common na tanong

8 bagay na itatanong ng tao tungkol sa focus group transcription.

01Maaari ba akong magbigay ng pangalan sa Speaker 1 sa actual na pangalan ng participant o ID?+
Oo. I-click ang anumang speaker chip sa editor, i-type ang pangalan o screener ID (ex. 'P04_F_34'), at ito ay perpektuado sa bawat turn mula sa speaker na yan sa transcript. Ang DOCX export ay gumagamit ng renamed labels.
02Paano ninyo hina-handle ang cross-talk at overlapping speech?+
Tina-tag namin ito inline na may `[overlap]` markers at tinatapos ang utterances ng dalawang speakers sa transcript. Generic tools ay kadalasang pumipili ng isang boses at nag-discard ng iba — kami ay hindi, dahil ang overlap moments ay madalas kung saan ang actual na focus group dynamics ay naroroon.
03Talagang clean ba ang DOCX import sa NVivo at ATLAS.ti?+
Oo. Nag-export kami na may speaker labels bilang paragraph-style headings, na auto-code ng NVivo sa import at ATLAS.ti ay nakikilala bilang speaker turns. Tinatanggap ng Dedoose ang parehong DOCX sa pamamagitan ng transcript import path nito.
04Ilang speakers ang maaari ninyong i-diarize sa isang file?+
Soft ceiling na tungkol 12. Lampas doon, ang acoustic clustering ay nagsisimulang nagsasama ng pareho ang boses — na kadalasang nangangahulugan ng 10-15 minutong rename pass sa iyong dulo. I-set ang 'Expected speakers' explicitly sa job form para sa best results.
05Verbatim o cleaned-up — maaari ba akong pumili?+
Pareho. Verbatim mode ay nagpapanatili ng bawat 'um', false start, at repeated word para sa discourse analysis. Cleaned ay nag-strip ng disfluencies para sa readability. Ikaw ang pumipili per-job; ang default para sa research template ay verbatim.
06Paano tungkol sa IRB requirements at participant confidentiality?+
Ang files ay napoproseso sa aming infrastructure, hindi ipinapadala sa third-party APIs. Nag-aalok kami ng per-job auto-delete-after-N-days flag para sa IRB protocols. Kami ay SOC 2 Type II at GDPR-compliant; ang DPA ay nasa legal page kung kinakailangan ito ng iyong IRB.
07Dapat ba akong mag-record ng video o audio-only?+
Audio-only ay fine — hindi namin ginagamit ang video para sa diarization. Kung mayroon kang video para sa participant identification, panatilihin ito locally para sa iyong sariling coding; ang pag-upload ng audio track lang ay mas mabilis at mas murang-mura.
08Paano ang cost compare sa Rev human verbatim?+
Ang 90-minute focus group ay tumatakbo ng tungkol $2.70 dito laban sa halos $135 sa Rev verbatim. Trade-off ay accuracy: kami ay nakaland sa 86-94% depende sa mic setup, ang Rev's human transcribers ay umabot ng ~99%. Karamihan ng researchers ay gumagamit sa amin para sa first pass at lang i-escalate ang specific groups sa human kung kailangan.

I-drop ang focus group recording. Tingnan ang transcript sa NVivo bukas.

30 libre na minuto bawat buwan. Walang card. Speaker labels, cross-talk tagging, QDA-ready DOCX export ay kasama sa bawat plan.

Magsimula ng libre