Focus group ٹرانسکریپشن — فوکس گروپ ریکارڈنگ کو ہر شرکاء کے لیے اسپیکر لیبلز کے ساتھ ٹرانسکرائب کریں

Focus group ٹرانسکریپشن۔ہر اسپیکر لیبل شدہ، ہر لفظ۔

ایک focus group ریکارڈنگ ڈراپ کریں جس میں 6، 8، یا 10 آوازیں ہوں۔ ہر شرکاء لیبل شدہ، cross-talk ٹیگ شدہ، اور ایک DOCX حاصل کریں جو سیدھے NVivo میں لوڈ ہو۔

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

آٹھ شرکاء میں۔ لیبل شدہ لفظی متن باہر۔

فوکس گروپز ہماری کیو میں سب سے مشکل diarization کیس ہیں — ملتی جلتی demographics، ملتی جلتی آوازیں، اکثر cross-talk overlap۔ ہم overlap کو اسے چھوڑنے کی بجائے inline میں ٹیگ کرتے ہیں، پھر آپ Speaker 3 → 'Participant_F2' کا نام ایک بار تبدیل کرتے ہیں اور یہ پھیل جاتا ہے۔

Focus group ریکارڈنگREC Moderator + 7 شرکاء · 1:23:14

خود بخود پہچانا گیا en-US44 kHz boundary mic · WAV

~90s

ٹرانسکریپٹ · streaming91% درستگی · 8 اسپیکرز

تو جب آپ نے پہلے packaging کھولی — مجھے بتائیں کہ آپ نے کیا دیکھا۔

سچ کہوں؟ پہلی چیز بو تھی۔ ہسپتال جیسی، کچھ clinical —

ہاں، میں نے بھی۔ میں نے سوچا تھا کہ یہ لیونڈر والی ہو۔

ہاں، اور label میں لیونڈر لکھا ہے لیکن واقعی —

8-اسپیکر روم mic پر 91%DOCX (QDA-ready) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev انسانی۔ عام AI۔ یا ہم۔

محققیں عام طور پر ایک انسانی ٹرانسکرائبر (سست، درست، مہنگا) یا ایک عام AI ٹول (جو 8-آواز والے کمروں کے لیے بنایا نہیں گیا) کے درمیان انتخاب کرتے ہیں۔ ہم درمیان میں بیٹھے ہیں — AI رفتار، ریسرچ ریکارڈنگز کے لیے tuned دارزیشن، اور ایک DOCX جو NVivo میں بغیر سرجری کے جاتا ہے۔

Option 01

Rev انسانی لفظی

ایک انسان اسے ٹائپ کرتا ہے۔ بہترین درستگی، لیکن 24 گھنٹے کی turnaround اور قیمت گھنٹوں کے ساتھ خطی ہے۔

درستگی~99% (انسانی)

Turnaroundعام طور پر 12–24 گھنٹے

Cross-talk[crosstalk] نشان زد

QDA ایکسپورٹDOCX، دستی صفائی

قیمت · فی منٹ$1.50 لفظی

90 منٹ گروپ~$135

Best forڈسرٹیشن کا کام یا ریگولیٹڈ ریسرچ جہاں ہر disfluency کو انسانی تصدیق کی ضرورت ہو۔

Option 02

Transcription.Solutions

6-10 آوازوں کے لیے tuned دارزیشن، inline میں ٹیگ شدہ cross-talk، NVivo، ATLAS.ti، اور Dedoose کے لیے سائز شدہ DOCX ایکسپورٹ۔

درستگیگروپ آڈیو پر 88–94%

Turnaround~1× realtime

Cross-talkٹیگ شدہ، نہ کہ چھوڑا گیا

QDA ایکسپورٹاسپیکر ٹرنز کے ساتھ DOCX

قیمت · فی منٹ$0.03

90 منٹ گروپ~$2.70

Best forمحققیں جو متعدد گروپز چلا رہے ہوں اور کو اگلے ہفتے نہیں، کل صبح NVivo میں ایک پہلا ٹرانسکریپٹ چاہیے۔

Option 03

Otter / Sonix

میٹنگز کے لیے بنایا گیا عام AI۔ 2-3 اسپیکرز پر ٹھیک ہے، 5 کے بعد ٹوٹتا ہے — اور ایکسپورٹس QDA سافٹویئر کا توقع نہیں رکھتے۔

درستگی5 اسپیکرز سے زیادہ ڈراپ

Turnaroundتیز

Cross-talkاکثر چھوڑا جاتا ہے

QDA ایکسپورٹکوئی NVivo format نہیں

اسپیکر حدنرم حد ~6

قیمت$17–22/یوزر/ماہ

Best forچھوٹی انٹرویوز اور 1-پر-1 جہاں ریکارڈنگ میں 2-3 آوازیں ہوں اور calendar workflow میں رہتی ہوں۔

قیمت درست ہے جیسا کہ مئی 2026۔ درستگی کی حدود ہماری مصنوعی آڈیٹ سے نہیں، بلکہ مصنوعی بینچ مارکس سے نہیں۔

Lavalier فی شرکاء میں 94%۔ سنگل روم mic میں 82% میں برقرار رہتا ہے۔

فوکس گروپ درستگی مائیکروفون topology سے، ماڈل سے نہیں بوتل بند ہے۔ ہر شرکاء پر lavalier ہمیں صاف per-speaker چینلز دیتا ہے — diarization trivial ہو جاتا ہے۔ ایک boundary mic کنفرنس ٹیبل پر 8 آوازوں کے ساتھ مشکل کیس ہے۔ نمبریں ہماری pipeline میں اصل ریسرچ ریکارڈنگز سے آتے ہیں۔

8 چیزیں جو لوگ پوچھتے ہیں۔ فوکس گروپ ٹرانسکریپشن کے بارے میں

01کیا میں Speaker 1 کو شرکاء کے اصل نام یا ID پر تبدیل کر سکتا ہوں؟+

ہاں۔ editor میں کوئی اسپیکر chip click کریں، نام یا screener ID ٹائپ کریں (مثلاً 'P04_F_34')، اور یہ اس اسپیکر سے ٹرانسکریپٹ میں ہر ٹرن تک پھیل جاتا ہے۔ DOCX ایکسپورٹ نام تبدیل شدہ labels استعمال کرتا ہے۔

02آپ cross-talk اور overlapping speech کو کیسے ہنڈل کرتے ہیں؟+

ہم اسے `[overlap]` markers کے ساتھ inline ٹیگ کرتے ہیں اور دونوں اسپیکرز کی utterances ٹرانسکریپٹ میں رکھتے ہیں۔ Generic ٹولز عام طور پر ایک آواز کو منتخب کرتے ہیں اور دوسری کو چھوڑ دیتے ہیں — ہم نہیں، کیونکہ overlap کے لمحے اکثر وہی ہوتے ہیں جہاں اصل focus group dynamics رہتے ہیں۔

03کیا DOCX واقعی NVivo اور ATLAS.ti میں صفائی سے import ہو جاتا ہے؟+

ہاں۔ ہم اسپیکر labels کے ساتھ paragraph-style headings کے طور پر ایکسپورٹ کرتے ہیں، جو NVivo import کے دوران خود کو code کرتا ہے اور ATLAS.ti اسپیکر ٹرنز کے طور پر پہچانتا ہے۔ Dedoose اسی DOCX کو اپنے ٹرانسکریپٹ import path کے ذریعے قبول کرتا ہے۔

04آپ ایک فائل میں کتنے اسپیکرز کو diarize کر سکتے ہیں؟+

نرم سقف تقریباً 12۔ اس کے بعد، acoustic clustering ملتی جلتی آوازوں کو ملانا شروع کرتی ہے — جس کا مطلب عام طور پر آپ کی طرف سے 10-15 منٹ کے نام تبدیل کرنا ہے۔ job form میں 'Expected speakers' واضح طور پر سیٹ کریں بہترین نتائج کے لیے۔

05Verbatim یا صاف — کیا میں منتخب کر سکتا ہوں؟+

دونوں۔ Verbatim mode ہر 'um'، false start، اور دوبارہ شدہ لفظ رکھتا ہے discourse تجزیہ کے لیے۔ Cleaned readability کے لیے disfluencies چھوڑتا ہے۔ آپ فی job منتخب کرتے ہیں؛ research template کے لیے default verbatim ہے۔

06IRB requirements اور شرکاء کی رازداری کے بارے میں؟+

فائلیں ہماری infrastructure میں process ہوتی ہیں، تیسری فریق APIs میں نہیں بھیجی جاتیں۔ ہم IRB protocols کے لیے ایک فی job auto-delete-after-N-days flag پیش کرتے ہیں۔ ہم SOC 2 Type II اور GDPR-compliant ہیں؛ DPA قانونی صفحہ پر ہے اگر آپ کی IRB نے اسے درکار ہو۔

07کیا مجھے ویڈیو یا صرف آڈیو ریکارڈ کرنا چاہیے؟+

صرف آڈیو ٹھیک ہے — ہم diarization کے لیے ویڈیو استعمال نہیں کرتے۔ اگر آپ کے پاس شرکاء کی شناخت کے لیے ویڈیو ہے، اسے مقامی طور پر اپنی coding کے لیے رکھیں؛ صرف آڈیو track upload کرنا تیز اور سستا ہے۔

08Rev انسانی verbatim کے مقابلے قیمت کیسے ہے؟+

ایک 90 منٹ کا focus group یہاں تقریباً $2.70 چلتا ہے Rev verbatim پر تقریباً $135 کے مقابلے۔ Trade-off درستگی ہے: ہم mic setup پر منحصر 86-94% پر آتے ہیں، Rev کے انسانی ٹرانسکرائبر ~99% ہٹاتے ہیں۔ زیادہ تر محققیں ہمیں پہلے pass کے لیے استعمال کرتے ہیں اور صرف specific گروپز کو human میں escalate کرتے ہیں اگر ضروری ہو۔