انٹرویو ٹرانسکرپشن۔مختلف recording، ایک جیسا نتیجہ۔

Phone memo، Zoom call، lavalier rig، یا handheld field recorder — انٹرویو recording ڈراپ کریں اور speaker-labeled، timestamped ٹیکسٹ حاصل کریں جس کا آپ حوالہ دے سکیں۔

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ دیکھیں کیا نکلتا ہے

دو voices اندر جاتے ہیں۔ دو voices باہر نکلتی ہیں، labeled۔

زیادہ تر انٹرویوز ایک device پر دو لوگ ہوتے ہیں — ایک phone ٹیبل پر، ایک recorder آپ کے درمیان۔ ہم انٹرویو audio کو ایک mono channel سے بھی reporter اور source میں الگ کرتے ہیں، پھر citation کے لیے ہر turn کو timestamp کرتے ہیں۔

Field recorder · WAVREC 2 speakers · 38:42
auto-detected en-US48 kHz mono · 1411 kbps
~90s
Transcript · streaming94% درستگی
S1

کیا آپ مجھے بتا سکتے ہیں کہ اٹھارہویں کی صبح کیا دیکھا؟

S2

میں چھے بجے پہنچا۔ loading bay کا دروازہ پہلے سے کھلا تھا، جو ہونا نہیں چاہیے تھا۔

S1

اور آپ نے دروازے کے مسئلے کی پہلے بھی رپورٹ کی تھی — کس سے؟

S2

Diane Okafor سے facilities میں، مارچ میں دو بار۔ میرے پاس emails ہیں۔

94% field WAV پرDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

تین حقیقی آپشنز · ایمانداری سے موازنہ

Rev human۔ Otter یا Trint۔ یا ہم۔

Rev آپ کی audio کو human transcribers کے پاس بھیجتا ہے — سست اور مہنگا لیکن سخت audio پر high fidelity۔ Otter اور Trint ہماری طرح AI-first ہیں، journalists اور researchers کے لیے تیار۔ یہاں ہر ایک کے لیے kya fit کرتا ہے۔

Option 01

Rev human transcription

اصل لوگ آپ کے انٹرویو کو ٹائپ کرتے ہیں۔ سخت audio پر بہترین، لیکن آپ انتظار کرتے ہیں اور ادا کرتے ہیں۔

Turnaround12–24 گھنٹے عام طور پر
صاف audio پر درستگی99% (دعویٰ)
Speaker labelsManual، شامل
زبانیںEN human · 30+ AI
Cost · فی منٹ$1.50 human · $0.25 AI
رازداریAudio contractors کو بھیجی جاتی ہے
Best forCourt-bound یا publication-critical انٹرویوز سخت audio پر جہاں آپ کو انسانی کان چاہیے اور انتظار کرنے کا وقت ہو۔
Option 02

Transcription.Solutions

AI transcript، speaker-split، منٹوں میں تیار۔ phone memo، Zoom، یا field recorder کے لیے ایک جیسا engine۔

Turnaround~3 منٹ فی گھنٹہ audio
صاف audio پر درستگی94–96%
Speaker labelsAuto · editor میں rename کریں
زبانیں99، auto-detected
Cost · فی منٹ$0.03
رازداریAudio 24h میں حذف · کوئی تربیت نہیں
Best forصحافی، محققین، اور پروڈیوسرز ہفتہ وار متعدد انٹرویو کرتے ہیں جنہیں تیزی سے، قابل حوالہ ٹیکسٹ چاہیے بغیر contractor کو upload کیے۔
Option 03

Otter / Trint

AI transcription research-oriented editor کے ساتھ۔ English-strong، monthly plans پر بند۔

TurnaroundReal-time سے ~5 منٹ
صاف audio پر درستگی~90–93%
Speaker labelsہاں · EN-tuned
زبانیںOtter EN-only · Trint 30+
Cost$17–80/user/ماہ (subscription)
رازداریڈیفالٹ account میں محفوظ
Best forTeams جو ہر انٹرویو کی ہوسٹ شدہ لائبریری چاہتے ہیں اور ہر user کے لیے monthly seat fee سے قطع نظر ہیں۔

Pricing اور feature flags 2026 کے طور پر درست۔ Human Rev turnaround queue depth اور audio length کے لحاظ سے مختلف ہوتا ہے۔

انٹرویوز کے لیے مخصوص

تین چیزیں جو سے لوگوں کو پریشان کرتی ہیں۔ عام ٹرانسکرپشن ٹولز

انٹرویو audio شاذ و نادر clear ہوتا ہے۔ یہ settings پلٹائیں اور transcript quoting کے تحت مضبوط رہتا ہے۔

کیا غلط ہوتا ہے

  1. 1ایک ہی channel پر cross-talk۔ جب آپ کا source زور سے بول رہا ہے اور آپ کے سوال کے اوپر بول رہا ہے، generic diarization دونوں کو ایک speaker block میں merge کر دیتا ہے۔
  2. 2Source names اور places (Okafor, Tigray, Maranello) phonetic واپس آتے ہیں۔ Transcript کے خلاف fact-checking کے لیے بیکار۔
  3. 3Off-the-record moments quotable material کے جیسے ہی transcript میں آتے ہیں — ایک region کو redacted کے طور پر mark کرنے کا کوئی طریقہ نہیں۔

یہاں کیا پلٹائیں

  1. 1اگر آپ کا field recorder ایک two-channel WAV لکھتا ہے (ایک mic فی track)، وہ فائل صرف upload کریں۔ ہم per-channel detect کرتے ہیں اور diarization کو بالکل skip کرتے ہیں۔
  2. 2اپنے prep notes — source names، organizations، place names — کو job form پر Custom vocabulary میں paste کریں۔ Recognizer انہیں known proper nouns کے طور پر ٹریٹ کرتا ہے۔
  3. 3جب transcript آتا ہے، editor میں ایک region کو off-record کے طور پر mark کریں۔ یہ DOCX اور TXT میں `[REDACTED 14:22–15:08]` کے طور پر export ہوتا ہے، source audio 24 گھنٹوں میں خیر مقدم ہوتی ہے قطع نظر۔

انٹرویوز کے لیے تجویز کردہ job settings

ایک انٹرویو فائل ڈراپ کریں اور یہ ڈیفالٹ کے طور پر on ہوں۔ form سے فی-job override کریں۔

Diarization
Per-channel اگر stereo · acoustic ورنہ
Speaker model
Interview · 2–4 speakers
زبان
Auto-detect · code-switch on
Filler words
Kept (verbatim mode)
خلاصہ
Key quotes + topic index
Export
DOCX timestamps کے ساتھ · plain TXT · JSON

Accuracy · real-world numbers

96% ایک اچھے lav پر۔ Cafe recording پر بھی قابل فہم۔

انٹرویو accuracy اس سے محدود ہے جو mic نے حقیقی طور پر سنا۔ ہر speaker پر close-mic stereo سب سے اوپر ہے؛ ایک phone noisy table پر سب سے نیچے۔ نیچے کے نمبرز production انٹرویو فائلوں سے آتے ہیں، synthetic benchmarks سے نہیں۔

96%
Dual lavalier · studio quiet

ایک mic فی speaker، الگ channels (Zoom H5/H6، Tascam DR-40)۔ Diarization trivial ہے — غلطی صرف ٹیکسٹ میں۔

94%
Handheld recorder ٹیبل پر

دو speakers کے درمیان single condenser، quiet room۔ Acoustic diarization 4 ft سے کم میں voices کو قابل اعتماد طریقے سے الگ کرتا ہے۔

90%
Phone voice memo · قریب

iPhone یا Pixel voice memo ٹیبل پر۔ نام اور نمبر کبھی کبھی miss ہوتے ہیں؛ cadence quoting کے لیے ٹھیک ہے۔

84%
Field recording · cafe یا street

Espresso machines، traffic، قریب تیسری voices۔ ہمارے data میں worst case — navigation کے لیے قابل استعمال، audio کے خلاف quotes کی تصدیق کریں۔

عام سوالات

8 چیزیں جو لوگ پوچھتے ہیں۔ انٹرویو ٹرانسکرپشن کے بارے میں

01کیا میں شائع شدہ آرٹیکل میں audio کے خلاف تصدیق کیے بغیر یہ transcripts استعمال کر سکتا ہوں؟+
سیدھے quotes کے لیے — نہیں، ہمیشہ audio کے خلاف تصدیق کریں۔ 94% accuracy پر AI transcripts اب بھی اوستاً 17 میں سے ایک لفظ کو غلط پڑھتے ہیں، اور ایک quote میں غلط لفظ ایک correction ہے۔ Transcript navigation اور drafting کے لیے ہے؛ audio سچائی کا ذریعہ ہے۔
02میرا recorder نے ایک stereo WAV save کیا جس میں ایک mic فی speaker ہے۔ مجھے کیا کرنا چاہیے؟+
وہ فائل سیدھے upload کریں — پہلے mono میں تبدیل نہ کریں۔ ہم دونوں channels detect کرتے ہیں اور ہر ایک کو اپنی diarization track میں route کرتے ہیں، جو ہمارے پاس highest-accuracy راستہ ہے۔ Quiet room پر 96%+ کی توقع رکھیں۔
03Phone call کے ذریعے ریکارڈ کیے گئے انٹرویوز کے بارے میں کیا؟+
Phone audio 8 kHz narrow-band ہے، جو clean line پر بھی 88% کے آس پاس accuracy کو محدود کرتا ہے۔ ہم اب بھی دونوں parties کو channel separation استعمال کرتے ہوئے split کرتے ہیں اگر آپ کی recorder app نے انہیں الگ capture کیا (زیادہ تر کرتے ہیں)۔ VoIP calls WhatsApp یا Signal پر PSTN سے تھوڑا بہتر سنائی دیتے ہیں۔
04کیا میں sharing سے پہلے off-the-record sections کو redact کر سکتا ہوں؟+
ہاں۔ Editor میں، timestamp range کو select کریں اور اسے `[REDACTED]` کے طور پر mark کریں۔ Export redaction marker کے ساتھ ٹیکسٹ کو تبدیل کرتا ہے لیکن timestamps رکھتا ہے تاکہ document اب بھی audio کو ٹریک کرے۔
05کیا آپ میرے انٹرویو recordings پر models کو train کرتے ہیں؟+
نہیں۔ Source audio مکمل ہونے کے 24 گھنٹوں میں ہماری infrastructure سے حذف ہوتا ہے، اور ہم کسی بھی plan کے تحت model training کے لیے customer recordings استعمال نہیں کرتے۔ Transcript ٹیکسٹ آپ کے account میں آپ کے حذف کرنے تک رہتا ہے۔
06Panel interview میں تین یا چار لوگ — کیا diarization اب بھی کام کرتا ہے؟+
تقریباً چھے distinct voices تک، ہاں، لیکن ہر شخص کے ساتھ speaker assignment پر accuracy گرتی ہے اور دو speakers جیسے سنائی دینے والے وقت بدتر ہوتی ہے۔ Transcript آنے کے بعد speaker chips پر 2–3 منٹ کا rename pass منصوبہ بنائیں۔
07کیا آپ انگریزی کے علاوہ دوسری زبانوں میں انٹرویوز ٹرانسکرائب کر سکتے ہیں؟+
99 زبانیں، auto-detected۔ Code-switching (انگریزی source درمیان میں ہسپانوی میں پھسل جانا) 12 language pairs میں handled ہے۔ Accuracy زبان کے لحاظ سے مختلف ہوتی ہے — European زبانیں انگریزی سے match کرتی ہیں؛ low-resource African اور Central Asian زبانیں 5–10 نقاط کم ہوتی ہیں۔
08میں Zoom call پر record کرتا ہوں — کیا مجھے بجائے اپنے Zoom page کو استعمال کرنا چاہیے؟+
ایک جیسا engine، ایک جیسا نتیجہ۔ Zoom page cloud-recording specifics (per-participant audio، dial-in degradation) کو cover کرتا ہے۔ اگر آپ ایک وقت میں ایک انٹرویو Zoom کے ذریعے کر رہے ہیں، دونوں paths کام کرتے ہیں — MP4 یہاں ڈراپ کریں اور speaker labels ایک جیسے نکلتے ہیں۔

اپنی انٹرویو recording ڈراپ کریں۔ دیکھیں کیا نکلتا ہے۔

ہر ماہ 30 منٹ مفت۔ کوئی card نہیں۔ Speaker labels، 99 زبانیں، تمام exports شامل۔

مفت شروع کریں