Focus group ଟ୍ରାନ୍ସକ୍ରିପ୍ସନ୍।ପ୍ରତ୍ୟେକ speaker labelled, ପ୍ରତ୍ୟେକ ଶବ୍ଦ।

6, 8, ଏପରିକି 10 ସ୍ୱର ଥିବା ଏକ focus group ରେକର୍ଡିଂ drop କରନ୍ତୁ। ପ୍ରତ୍ୟେକ ଅଂଶଗ୍ରହଣକାରୀ labelled, cross-talk tagged ଥିବା ଏକ verbatim ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ପାଆନ୍ତୁ — ଆଉ ଏକ DOCX ଯାହା ସିଧାସଳଖ NVivo ରେ load ହୁଏ।

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ ଦେଖନ୍ତୁ କଣ ବାହାରୁଛି

ଆଠ ଅଂଶଗ୍ରହଣକାରୀ ଭିତରେ। Labelled verbatim ବାହାରେ।

ଆମ queue ରେ focus group ସବୁଠାରୁ କଠିନ diarization case — ସମାନ demographic, ସମାନ ସ୍ୱର, ବାରମ୍ବାର cross-talk overlap। ଆମେ overlap କୁ ବାଦ ଦେବା ବଦଳରେ inline tag କରୁ, ତାପରେ ଆପଣ Speaker 3 → 'Participant_F2' ଥରେ rename କଲେ ତାହା ସବୁଆଡେ propagate ହୋଇଯାଏ।

Focus group ରେକର୍ଡିଂREC Moderator + 7 ଅଂଶଗ୍ରହଣକାରୀ · 1:23:14
auto-detected en-US44 kHz boundary mic · WAV
~90s
ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ · streaming91% accuracy · 8 speakers
S1

ତ ଯେତେବେଳେ ଆପଣ ପ୍ରଥମେ packaging ଖୋଲିଲେ — ମୋତେ କୁହନ୍ତୁ ଆପଣ କଣ ଲକ୍ଷ୍ୟ କଲେ।

S2

ସତ କହିଲେ? ପ୍ରଥମ ଜିନିଷ ଥିଲା ଗନ୍ଧ। ହସପିଟାଲ ପରି, ଟିକେ clinical —

S3

ହଁ, ସେୟା। ମୁଁ ଭାବିଥିଲି ଏହା lavender ଟି ହୋଇଥିବ।

S2

ଠିକ୍, label ରେ lavender ଲେଖାଅଛି କିନ୍ତୁ ଏହା ତ ସତରେ —

8-speaker room mic ରେ 91%DOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

ତିନୋଟି ବାସ୍ତବ ବିକଳ୍ପ · ସତ୍ୟ ତୁଳନା

Rev human। Generic AI। କିମ୍ବା ଆମେ।

ଗବେଷକମାନେ ସାଧାରଣତଃ ଜଣେ human transcriber କୁ ଟଙ୍କା ଦେବା (ଧୀର, ସଠିକ, ମହଙ୍ଗା) କିମ୍ବା 8-ସ୍ୱର ରୁମ୍ ପାଇଁ ତିଆରି ହୋଇନଥିବା ଏକ generic AI tool ରେ file ଚଲାଇବା ମଧ୍ୟରେ ବାଛନ୍ତି। ଆମେ ମଝିରେ ଅଛୁ — AI ର ବେଗ, ଗବେଷଣା ରେକର୍ଡିଂ ପାଇଁ tuned diarization, ଏବଂ ଏକ DOCX ଯାହା surgery ବିନା NVivo କୁ drop ହୁଏ।

Option 01

Rev human verbatim

ଜଣେ ମଣିଷ ଏହାକୁ type କରନ୍ତି। ଉଚ୍ଚ accuracy, କିନ୍ତୁ 24-ଘଣ୍ଟା turnaround ଏବଂ ଘଣ୍ଟା ସହିତ ଦର linear ଭାବେ ବଢ଼େ।

Accuracy~99% (human)
Turnaround12–24 ଘଣ୍ଟା ସାଧାରଣ
Cross-talk[crosstalk] ଚିହ୍ନିତ
QDA exportDOCX, manual cleanup
ଦର · ପ୍ରତି min$1.50 verbatim
90-min group~$135
Best forDissertation କାମ କିମ୍ବା regulated ଗବେଷଣା ଯେଉଁଠି ପ୍ରତ୍ୟେକ disfluency human-verified ହେବା ଆବଶ୍ୟକ।
Option 02

Transcription.Solutions

6-10 ସ୍ୱର ପାଇଁ tuned diarization, cross-talk inline tagged, NVivo, ATLAS.ti, ଏବଂ Dedoose ପାଇଁ ତିଆରି DOCX export।

AccuracyGroup audio ରେ 88–94%
Turnaround~1× realtime
Cross-talkTagged, ବାଦ ଦିଆଯାଏନାହିଁ
QDA exportSpeaker turn ସହିତ DOCX
ଦର · ପ୍ରତି min$0.03
90-min group~$2.70
Best forଯେଉଁ ଗବେଷକମାନେ ଏକାଧିକ group ଚଲାଉଛନ୍ତି ଏବଂ ଆସନ୍ତାକାଲି ସକାଳ ସୁଦ୍ଧା (ପରବର୍ତ୍ତୀ ସପ୍ତାହ ନୁହେଁ) NVivo ରେ ଏକ first-pass ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ଚାହାଁନ୍ତି।
Option 03

Otter / Sonix

Meeting ପାଇଁ ତିଆରି generic AI। 2-3 speaker ରେ ଠିକ୍, 5 ପରେ ଭାଙ୍ଗି ଯାଏ — ଏବଂ export QDA software କୁ ଆଶା କରନ୍ତି ନାହିଁ।

Accuracy5 speaker ପରେ ଖସେ
Turnaroundଶୀଘ୍ର
Cross-talkବାରମ୍ବାର ବାଦ
QDA exportNative NVivo format ନାହିଁ
Speaker capSoft limit ~6
ଦର$17–22/user/mo
Best forଛୋଟ interview ଏବଂ 1-on-1 ଯେଉଁଠି ରେକର୍ଡିଂରେ 2-3 ସ୍ୱର ଅଛି ଏବଂ ତାହା calendar workflow ରେ ରହେ।

ଦର May 2026 ସୁଦ୍ଧା ସଠିକ। Accuracy ସୀମା ଆମ ଗ୍ରାହକ focus group file ର internal sample ରୁ ଆସିଛି, synthetic benchmark ରୁ ନୁହେଁ।

Focus group ପାଇଁ ନିର୍ଦ୍ଦିଷ୍ଟ

ଗବେଷକଙ୍କୁ କାମୁଡୁଥିବା ତିନୋଟି ଜିନିଷ। Generic AI tool ରେ

ସଠିକ୍ setting ପ୍ରଥମରୁ flip କରନ୍ତୁ, ଆଉ cleanup weekend ବିନା ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ NVivo ରେ drop ହୋଇଯିବ।

କଣ ଭୁଲ୍ ହୁଏ

  1. 1Cross-talk ବାଦ ପଡ଼ିଯାଏ। ଅଧିକାଂଶ consumer tool overlap ସମୟରେ ଗୋଟିଏ speaker ବାଛନ୍ତି ���ବଂ ବାକି ସବୁ ଫିଙ୍ଗି ଦିଅନ୍ତି। ଠିକ୍ ସେହି ମୁହୂର୍ତ୍ତ ହଜିଯାଏ ଯେଉଁଠି consensus କିମ୍ବା pushback ହୁଏ।
  2. 2Speaker 3 କୁ collapse ହୁଅନ୍ତି। Tool meeting-size ରୁମ୍ ଅନୁମାନ କରନ୍ତି ଏବଂ diarization cluster କୁ କମ୍ ସୀମା ଦିଅନ୍ତି। ଆପଣଙ୍କ ଆଠ ଅଂଶଗ୍ରହଣକାରୀ 'Speaker 1' / 'Speaker 2' / 'Speaker 3' ଭାବେ ଫେରନ୍ତି।
  3. 3Export ଗୋଟିଏ ଟେକ୍ସଟ୍ ର ପାଚେରୀ। Speaker turn ପ୍ରତି paragraph break ନାହିଁ, NVivo import ସମୟରେ auto-code କରିପାରୁଥିବା DOCX structure ନାହିଁ।

ଏଠାରେ କଣ flip କରିବେ

  1. 1Job form ରେ Tag overlapping speech on କରନ୍ତୁ। Cross-talk inline `[overlap]` marker ପାଏ ଏବଂ ଉଭୟ speaker ସେମାନଙ୍କ ବକ୍ତବ୍ୟ ବଜାୟ ରଖନ୍ତି।
  2. 2Expected speakers: 8-12 ସ୍ପଷ୍ଟ ଭାବେ ସେଟ୍ କରନ୍ତୁ। ଆମେ କମ୍ ଅନୁମାନ କରିବା ବଦଳରେ diarization cluster count ତଦନୁରୂପ size କରୁ।
  3. 3DOCX (QDA-ready) export ବାଛନ୍ତୁ। Speaker turn label-prefixed paragraph ହୁଅନ୍ତି — NVivo, ATLAS.ti, ଏବଂ Dedoose ଏହି format କୁ import ସମୟରେ auto-detect କରନ୍ତି।

Focus group ପାଇଁ ସୁପାରିଶ ହୋଇଥିବା job setting

'research' template ସହିତ ଏକ focus group file drop କରନ୍ତୁ ଏବଂ ଏଗୁଡ଼ିକ default ଭାବେ flip on ହୁଅନ୍ତି। Form ରୁ per-job override କରନ୍ତୁ।

Diarization
Acoustic · expected 6-10 speaker
Verbatim mode
Full — disfluency ରଖାଯାଏ
Overlap handling
Inline [overlap] tag
Custom vocabulary
Screener ରୁ product / brand ନାମ
Speaker label
Post-job editable, propagate-all
Export
DOCX (QDA-ready) · timestamped TXT

Accuracy · real-world numbers

Lavalier-per-participant ରେ 94%। ଗୋଟିଏ room mic ରେ 82% ସ୍ଥିର।

Focus group accuracy microphone topology ଦ୍ୱାରା bottleneck ହୁଏ, model ଦ୍ୱାରା ନୁହେଁ। ପ୍ରତ୍ୟେକ ଅଂଶଗ୍ରହଣକାରୀଙ୍କ ଉପରେ ଏକ lavalier ଆମକୁ ସ୍ୱଚ୍ଛ per-speaker channel ଦେଇଥାଏ — diarization ସରଳ ହୋଇଯାଏ। 8 ସ୍ୱର ସହିତ ଗୋଟିଏ conference table ରେ ଗୋଟିଏ boundary mic କଠିନ case। ତଳ ସଂଖ୍ୟାଗୁଡ଼ିକ ଆମ pipeline ର ବାସ୍ତବ ଗବେଷଣା ରେକର୍ଡିଂରୁ ଆସିଛି।

94%
Lavalier per participant

ପ୍ରତ୍ୟେକ ଅଂଶଗ୍ରହଣକାରୀ ନିଜ track ରେ, multitrack WAV କୁ mixed। Diarization ବାଦ ଦିଆଯାଏ — କେବଳ text-only error। Dissertation-grade କାମ ପାଇଁ ସର୍ବୋତ୍ତମ case।

91%
Conference mic, 4-6 ଅଂଶଗ୍ରହଣକାରୀ

Table ର କେନ୍ଦ୍ରରେ boundary mic, ମଧ୍ୟମ room treatment। ସ୍ୱର ଭିନ୍ନ ଭିନ୍ନ ଭାବେ ଚିହ୍ନା ଯାଏ, ସମାନ ବୟସର ସମ-ଲିଙ୍ଗ ଅଂଶଗ୍ରହଣକାରୀଙ୍କ ମଧ୍ୟରେ ବେଳେ ବେଳେ confusion ହୁଏ।

86%
Single room mic, 7-10 ଅଂଶଗ୍ରହଣକାରୀ

Cross-talk ବାରମ୍ବାର, acoustic diarization ଅଧୀନରେ ସମାନ ସ୍ୱର merge ହୁଅନ୍ତି। Analysis ପୂର୍ବରୁ speaker chip ଉପରେ 10-ମିନିଟ rename ଓ merge pass ଆଶା କରନ୍ତୁ।

82%
Mono Zoom ରେ remote group

Compressed mono mix, per-channel split ଉପଲବ୍ଧ ନୁହେଁ। Thematic coding ପାଇଁ ଶବ୍ଦ ବ୍ୟବହାରଯୋଗ୍ୟ, କିନ୍ତୁ disfluency-level verbatim ଦାବି ଏଠାରେ ଦୁର୍ବଳ ହୋଇଯାଏ।

ସାଧାରଣ ପ୍ରଶ୍ନ

ଲୋକେ ପଚାରୁଥିବା 8 ଜିନିଷ। Focus group ଟ୍ରାନ୍ସକ୍ରିପ୍ସନ୍ ବିଷୟରେ

01ମୁଁ Speaker 1 କୁ ଅଂଶଗ୍ରହଣକାରୀଙ୍କ ବାସ୍ତବ ନାମ କିମ୍ବା ID ସହିତ rename କରିପାରିବି କି?+
ହଁ। Editor ରେ ଯେକୌଣସି speaker chip କୁ click କରନ୍ତୁ, ନାମ କିମ୍ବା screener ID type କରନ୍ତୁ (ଯଥା 'P04_F_34'), ଏବଂ ତାହା ଟ୍ରାନ୍ସକ୍ରିପ୍ଟରେ ସେହି speaker ର ପ୍ରତ୍ୟେକ turn ରେ propagate ହୁଏ। DOCX export rename ହୋଇଥିବା label ବ୍ୟବହାର କରେ।
02ଆପଣ cross-talk ଏବଂ overlapping speech କୁ କିପରି ସମ୍ଭାଳନ୍ତି?+
ଆମେ ଏହାକୁ `[overlap]` marker ସହିତ inline tag କରୁ ଏବଂ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟରେ ଉଭୟ speaker ର ବକ୍ତବ୍ୟ ରଖୁ। Generic tool ସାଧାରଣତଃ ଗୋଟିଏ ସ୍ୱର ବାଛନ୍ତି ଏବଂ ଅନ୍ୟଟି ବାଦ ଦିଅନ୍ତି — ଆମେ କରୁ ନାହିଁ, କାରଣ overlap ର ମୁହୂର୍ତ୍ତଗୁଡ଼ିକରେ ସାଧାରଣତଃ ବାସ୍ତବ focus group dynamics ରହିଥାଏ।
03DOCX ସତରେ NVivo ଏବଂ ATLAS.ti ରେ ସ୍ୱଚ୍ଛଭାବେ import ହୁଏ କି?+
ହଁ। ଆମେ speaker label କୁ paragraph-style heading ଭାବେ export କରୁ, ଯାହାକୁ NVivo import ସମୟରେ auto-code କରେ ଏବଂ ATLAS.ti speaker turn ଭାବେ ଚିହ୍ନେ। Dedoose ସେହି DOCX କୁ ତାହାର transcript import path ମାଧ୍ୟମରେ ଗ୍ରହଣ କରେ।
04ଗୋଟିଏ file ରେ ଆପଣ କେତେ speaker କୁ diarize କରିପାରିବେ?+
ସୀମା ପ୍ରାୟ 12 ପର୍ଯ୍ୟନ୍ତ। ତାହାଠାରୁ ଅଧିକ ହେଲେ, acoustic clustering ସମାନ ସ୍ୱର merge କରିବାକୁ ଆରମ୍ଭ କରେ — ଯାହାର ଅର୍ଥ ସାଧାରଣତଃ ଆପଣଙ୍କ ପକ୍ଷରୁ 10-15 ମିନିଟର rename pass। ସର୍ବୋତ୍ତମ ଫଳାଫଳ ପାଇଁ job form ରେ 'Expected speakers' ସ୍ପଷ୍ଟ ଭାବେ ସେଟ୍ କରନ୍ତୁ।
05Verbatim କିମ୍ବା cleaned-up — ମୁଁ ବାଛିପାରିବି କି?+
ଉଭୟ। Verbatim mode discourse analysis ପାଇଁ ପ୍ରତ���ୟେକ 'um', false start, ଓ ପୁନରାବୃତ୍ତି ଶବ୍ଦ ରଖେ। Cleaned readability ପାଇଁ disfluency ବାଦ ଦିଏ। ଆପଣ per-job ବାଛନ୍ତି; research template ର default verbatim।
06IRB ଆବଶ୍ୟକତା ଓ ଅଂଶଗ୍ରହଣକାରୀ ଗୋପନୀୟତା ବିଷୟରେ କଣ?+
File ଆମ infrastructure ରେ process ହୁଏ, third-party API କୁ ପଠାଯାଏ ନାହିଁ। IRB protocol ପାଇଁ ଆମେ per-job auto-delete-after-N-days flag ଦେଉ। ଆମେ SOC 2 Type II ଏବଂ GDPR-compliant; ଯଦି ଆପଣଙ୍କ IRB ର ଆବଶ୍ୟକତା ଅଛି, DPA legal page ରେ ଅଛି।
07ମୁଁ video record କରିବି ନା audio-only?+
Audio-only ଠିକ୍ — ଆମେ diarization ପାଇଁ video ବ୍ୟବହାର କରୁ ନାହିଁ। ଯଦି ଅଂଶଗ୍ରହଣକାରୀ ଚିହ୍ନଟ ପ��ଇଁ video ଅଛି, ତାହାକୁ ନିଜ coding ପାଇଁ ସ୍ଥାନୀୟ ଭାବେ ରଖନ୍ତୁ; କେବଳ audio track upload କରିବା ଶୀଘ୍ର ଏବଂ ସୁବିଧାଜନକ।
08Rev human verbatim ତୁଳନାରେ ଦର କେମିତି?+
ଏକ 90-ମିନିଟର focus group ଏଠାରେ ପ୍ରାୟ $2.70 ପଡ଼େ, Rev verbatim ରେ ପ୍ରାୟ $135। Trade-off ହେଉଛି accuracy: mic setup ଅନୁଯାୟୀ ଆମେ 86-94% ରେ ଅଛୁ, Rev ର human transcriber ~99% ରେ ପହଞ୍ଚନ୍ତି। ଅଧିକାଂଶ ଗବେଷକ first pass ପାଇଁ ଆମକୁ ବ୍ୟବହାର କରନ୍ତି ଏବଂ ଆବଶ୍ୟକ ହେଲେ ହିଁ ନିର୍ଦ୍ଦିଷ୍ଟ group କୁ human ପର୍ଯ୍ୟନ୍ତ escalate କରନ୍ତି।

ଏକ focus group ରେକର୍ଡିଂ drop କରନ୍ତୁ। ଆସନ୍ତାକାଲି ସୁଦ୍ଧା NVivo ରେ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ଦେଖନ୍ତୁ।

ପ୍ରତି ମାସ 30 ମିନିଟ୍ ମାଗଣା। Card ନାହିଁ। Speaker label, cross-talk tagging, QDA-ready DOCX export ପ୍ରତ୍ୟେକ plan ରେ ଅନ୍ତର୍ଭୁକ୍ତ।

ମାଗଣା ଆରମ୍ଭ କରନ୍ତୁ