Focus group ٹرانسکریپشن۔ہر اسپیکر لیبل شدہ، ہر لفظ۔

ایک focus group ریکارڈنگ ڈراپ کریں جس میں 6، 8، یا 10 آوازیں ہوں۔ ہر شرکاء لیبل شدہ، cross-talk ٹیگ شدہ، اور ایک DOCX حاصل کریں جو سیدھے NVivo میں لوڈ ہو۔

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ دیکھیں کہ کیا نکلتا ہے

آٹھ شرکاء میں۔ لیبل شدہ لفظی متن باہر۔

فوکس گروپز ہماری کیو میں سب سے مشکل diarization کیس ہیں — ملتی جلتی demographics، ملتی جلتی آوازیں، اکثر cross-talk overlap۔ ہم overlap کو اسے چھوڑنے کی بجائے inline میں ٹیگ کرتے ہیں، پھر آپ Speaker 3 → 'Participant_F2' کا نام ایک بار تبدیل کرتے ہیں اور یہ پھیل جاتا ہے۔

Focus group ریکارڈنگREC Moderator + 7 شرکاء · 1:23:14
خود بخود پہچانا گیا en-US44 kHz boundary mic · WAV
~90s
ٹرانسکریپٹ · streaming91% درستگی · 8 اسپیکرز
S1

تو جب آپ نے پہلے packaging کھولی — مجھے بتائیں کہ آپ نے کیا دیکھا۔

S2

سچ کہوں؟ پہلی چیز بو تھی۔ ہسپتال جیسی، کچھ clinical —

S3

ہاں، میں نے بھی۔ میں نے سوچا تھا کہ یہ لیونڈر والی ہو۔

S2

ہاں، اور label میں لیونڈر لکھا ہے لیکن واقعی —

8-اسپیکر روم mic پر 91%DOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

تین اختیارات · ایماندارانہ موازنہ

Rev انسانی۔ عام AI۔ یا ہم۔

محققیں عام طور پر ایک انسانی ٹرانسکرائبر (سست، درست، مہنگا) یا ایک عام AI ٹول (جو 8-آواز والے کمروں کے لیے بنایا نہیں گیا) کے درمیان انتخاب کرتے ہیں۔ ہم درمیان میں بیٹھے ہیں — AI رفتار، ریسرچ ریکارڈنگز کے لیے tuned دارزیشن، اور ایک DOCX جو NVivo میں بغیر سرجری کے جاتا ہے۔

Option 01

Rev انسانی لفظی

ایک انسان اسے ٹائپ کرتا ہے۔ بہترین درستگی، لیکن 24 گھنٹے کی turnaround اور قیمت گھنٹوں کے ساتھ خطی ہے۔

درستگی~99% (انسانی)
Turnaroundعام طور پر 12–24 گھنٹے
Cross-talk[crosstalk] نشان زد
QDA ایکسپورٹDOCX، دستی صفائی
قیمت · فی منٹ$1.50 لفظی
90 منٹ گروپ~$135
Best forڈسرٹیشن کا کام یا ریگولیٹڈ ریسرچ جہاں ہر disfluency کو انسانی تصدیق کی ضرورت ہو۔
Option 02

Transcription.Solutions

6-10 آوازوں کے لیے tuned دارزیشن، inline میں ٹیگ شدہ cross-talk، NVivo، ATLAS.ti، اور Dedoose کے لیے سائز شدہ DOCX ایکسپورٹ۔

درستگیگروپ آڈیو پر 88–94%
Turnaround~1× realtime
Cross-talkٹیگ شدہ، نہ کہ چھوڑا گیا
QDA ایکسپورٹاسپیکر ٹرنز کے ساتھ DOCX
قیمت · فی منٹ$0.03
90 منٹ گروپ~$2.70
Best forمحققیں جو متعدد گروپز چلا رہے ہوں اور کو اگلے ہفتے نہیں، کل صبح NVivo میں ایک پہلا ٹرانسکریپٹ چاہیے۔
Option 03

Otter / Sonix

میٹنگز کے لیے بنایا گیا عام AI۔ 2-3 اسپیکرز پر ٹھیک ہے، 5 کے بعد ٹوٹتا ہے — اور ایکسپورٹس QDA سافٹویئر کا توقع نہیں رکھتے۔

درستگی5 اسپیکرز سے زیادہ ڈراپ
Turnaroundتیز
Cross-talkاکثر چھوڑا جاتا ہے
QDA ایکسپورٹکوئی NVivo format نہیں
اسپیکر حدنرم حد ~6
قیمت$17–22/یوزر/ماہ
Best forچھوٹی انٹرویوز اور 1-پر-1 جہاں ریکارڈنگ میں 2-3 آوازیں ہوں اور calendar workflow میں رہتی ہوں۔

قیمت درست ہے جیسا کہ مئی 2026۔ درستگی کی حدود ہماری مصنوعی آڈیٹ سے نہیں، بلکہ مصنوعی بینچ مارکس سے نہیں۔

فوکس گروپز کے لیے مخصوص

تین چیزیں جو محققین کو پر مسائل دیتی ہیں۔ generic AI tools

رفتہ شروع میں صحیح سیٹنگز flip کریں اور ٹرانسکریپٹ NVivo میں بغیر صفائی کے ہفتے کے جاتا ہے۔

کیا غلط ہوتا ہے

  1. 1Cross-talk چھوڑ دیا جاتا ہے۔ زیادہ تر consumer ٹولز overlap کے دوران ایک اسپیکر کو منتخب کرتے ہیں اور باقی چھوڑ دیتے ہیں۔ آپ بالکل وہ لمحہ کھوتے ہیں جہاں consensus یا pushback ہوتا ہے۔
  2. 2اسپیکرز 3 میں کولاپس۔ ٹولز meeting-sized کمرے فرض کرتے ہیں اور diarization clusters کو کم رکھتے ہیں۔ آپ کے آٹھ شرکاء 'Speaker 1' / 'Speaker 2' / 'Speaker 3' واپس آتے ہیں۔
  3. 3ایکسپورٹ ایک متن کی دیوار ہے۔ کوئی اسپیکر ٹرن کے فی پیراگراف breaks نہیں، کوئی DOCX structure NVivo import پر خود کو code کر سکتا ہے۔

یہاں کیا flip کریں

  1. 1Tag overlapping speech کو job form میں flip کریں۔ Cross-talk inline `[overlap]` markers حاصل کرتا ہے اور دونوں اسپیکرز اپنی utterances برقرار رکھتے ہیں۔
  2. 2Expected speakers: 8-12 واضح طور پر سیٹ کریں۔ ہم diarization cluster count کو پڑھتے ہیں کی بجائے مماثل کرنے کے لیے۔
  3. 3DOCX (QDA-ready) ایکسپورٹ منتخب کریں۔ اسپیکر ٹرنز پیراگراف بن جاتے ہیں جو label کے ساتھ پریفکسڈ ہوتے ہیں — NVivo، ATLAS.ti، اور Dedoose سب import پر یہ format خود بخود detect کرتے ہیں۔

��وکس گروپز کے لیے سفارش کردہ job سیٹنگز

'Research' template کے ساتھ ایک focus group file ڈراپ کریں اور یہ ڈیفالٹ سے flip ہو جاتے ہیں۔ Form سے فی job override کریں۔

Diarization
Acoustic · متوقع 6-10 اسپیکرز
Verbatim mode
مکمل — disfluencies رکھے گئے
Overlap handling
Tag inline [overlap]
Custom vocabulary
Screener سے Product / brand names
اسپیکر labels
اردیبل post-job، propagate-all
ایکسپورٹ
DOCX (QDA-ready) · timestamped TXT

Accuracy · real-world numbers

Lavalier فی شرکاء میں 94%۔ سنگل روم mic میں 82% میں برقرار رہتا ہے۔

فوکس گروپ درستگی مائیکروفون topology سے، ماڈل سے نہیں بوتل بند ہے۔ ہر شرکاء پر lavalier ہمیں صاف per-speaker چینلز دیتا ہے — diarization trivial ہو جاتا ہے۔ ایک boundary mic کنفرنس ٹیبل پر 8 آوازوں کے ساتھ مشکل کیس ہے۔ نمبریں ہماری pipeline میں اصل ریسرچ ریکارڈنگز سے آتے ہیں۔

94%
ہر شرکاء پر Lavalier

ہر شرکاء اپنے track پر، multitrack WAV میں ملایا گیا۔ Diarization چھوڑا گیا — صرف متن کی غلطی۔ ڈسرٹیشن درجے کی کام کے لیے بہترین۔

91%
کنفرنس mic، 4-6 شرکاء

ٹیبل پر boundary mic، اعتدال سے روم ٹریٹمنٹ۔ آوازیں ممیز ہیں، کبھی کبھار ایک جیسے صنف کے شرکاء کے درمیان الجھن۔

86%
سنگل روم mic، 7-10 شرکاء

Cross-talk اکثر، ملتی جلتی آوازیں acoustic diarization میں ملتی ہیں۔ تجزیہ سے پہلے اسپیکر chips پر 10 منٹ کے نام تبدیل کریں۔

82%
Mono Zoom پر دور کا گروپ

کمپریسڈ mono mix، کوئی per-channel split دستیاب نہیں۔ الفاظ ابھی بھی thematic coding کے لیے استعمال ہیں، لیکن disfluency-level لفظی دعویٰ یہاں کمزور ہوتے ہیں۔

عام سوالات

8 چیزیں جو لوگ پوچھتے ہیں۔ فوکس گروپ ٹرانسکریپشن کے بارے میں

01کیا میں Speaker 1 کو شرکاء کے اصل نام یا ID پر تبدیل کر سکتا ہوں؟+
ہاں۔ editor میں کوئی اسپیکر chip click کریں، نام یا screener ID ٹائپ کریں (مثلاً 'P04_F_34')، اور یہ اس اسپیکر سے ٹرانسکریپٹ میں ہر ٹرن تک پھیل جاتا ہے۔ DOCX ایکسپورٹ نام تبدیل شدہ labels استعمال کرتا ہے۔
02آپ cross-talk اور overlapping speech کو کیسے ہنڈل کرتے ہیں؟+
ہم اسے `[overlap]` markers کے ساتھ inline ٹیگ کرتے ہیں اور دونوں اسپیکرز کی utterances ٹرانسکریپٹ میں رکھتے ہیں۔ Generic ٹولز عام طور پر ایک آواز کو منتخب کرتے ہیں اور دوسری کو چھوڑ دیتے ہیں — ہم نہیں، کیونکہ overlap کے لمحے اکثر وہی ہوتے ہیں جہاں اصل focus group dynamics رہتے ہیں۔
03کیا DOCX واقعی NVivo اور ATLAS.ti میں صفائی سے import ہو جاتا ہے؟+
ہاں۔ ہم اسپیکر labels کے ساتھ paragraph-style headings کے طور پر ایکسپورٹ کرتے ہیں، جو NVivo import کے دوران خود کو code کرتا ہے اور ATLAS.ti اسپیکر ٹرنز کے طور پر پہچانتا ہے۔ Dedoose اسی DOCX کو اپنے ٹرانسکریپٹ import path کے ذریعے قبول کرتا ہے۔
04آپ ایک فائل میں کتنے اسپیکرز کو diarize کر سکتے ہیں؟+
نرم سقف تقریباً 12۔ اس کے بعد، acoustic clustering ملتی جلتی آوازوں کو ملانا شروع کرتی ہے — جس کا مطلب عام طور پر آپ کی طرف سے 10-15 منٹ کے نام تبدیل کرنا ہے۔ job form میں 'Expected speakers' واضح طور پر سیٹ کریں بہترین نتائج کے لیے۔
05Verbatim یا صاف — کیا میں منتخب کر سکتا ہوں؟+
دونوں۔ Verbatim mode ہر 'um'، false start، اور دوبارہ شدہ لفظ رکھتا ہے discourse تجزیہ کے لیے۔ Cleaned readability کے لیے disfluencies چھوڑتا ہے۔ آپ فی job منتخب کرتے ہیں؛ research template کے لیے default verbatim ہے۔
06IRB requirements اور شرکاء کی رازداری کے بارے میں؟+
فائلیں ہماری infrastructure میں process ہوتی ہیں، تیسری فریق APIs میں نہیں بھیجی جاتیں۔ ہم IRB protocols کے لیے ایک فی job auto-delete-after-N-days flag پیش کرتے ہیں۔ ہم SOC 2 Type II اور GDPR-compliant ہیں؛ DPA قانونی صفحہ پر ہے اگر آپ کی IRB نے اسے درکار ہو۔
07کیا مجھے ویڈیو یا صرف آڈیو ریکارڈ کرنا چاہیے؟+
صرف آڈیو ٹھیک ہے — ہم diarization کے لیے ویڈیو استعمال نہیں کرتے۔ اگر آپ کے پاس شرکاء کی شناخت کے لیے ویڈیو ہے، اسے مقامی طور پر اپنی coding کے لیے رکھیں؛ صرف آڈیو track upload کرنا تیز اور سستا ہے۔
08Rev انسانی verbatim کے مقابلے قیمت کیسے ہے؟+
ایک 90 منٹ کا focus group یہاں تقریباً $2.70 چلتا ہے Rev verbatim پر تقریباً $135 کے مقابلے۔ Trade-off درستگی ہے: ہم mic setup پر منحصر 86-94% پر آتے ہیں، Rev کے انسانی ٹرانسکرائبر ~99% ہٹاتے ہیں۔ زیادہ تر محققیں ہمیں پہلے pass کے لیے استعمال کرتے ہیں اور صرف specific گروپز کو human میں escalate کرتے ہیں اگر ضروری ہو۔

ایک focus group ریکارڈنگ ڈراپ کریں۔ کل NVivo میں ٹرانسکریپٹ دیکھیں۔

ہر ماہ 30 مفت منٹ۔ کوئی کارڈ نہیں۔ اسپیکر labels، cross-talk tagging، QDA-ready DOCX ایکسپورٹ ہر منصوبے میں شامل۔

مفت شروع کریں