تفريغ المقابلات — نقل مقابلة إلى نص مع أسماء المتحدثين والطوابع الزمنية

تفريغ المقابلات.تسجيل مختلف، نتيجة واحدة.

رسالة صوتية من الهاتف أو مكالمة Zoom أو ميكروفون يقيني أو جهاز تسجيل ميداني محمول — ألقِ تسجيل المقابلة واحصل على نص مع أسماء المتحدثين والطوابع الزمنية يمكنك الاستشهاد به.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

صوتان يدخلان. صوتان يخرجان، موسومان.

معظم المقابلات تضم شخصين على جهاز واحد — هاتف على الطاولة أو ميكروفون بينكما. نفصل الصوت الخاص بالمقابلة إلى الصحفي والمصدر حتى من قناة أحادية واحدة، ثم نضع طابع زمني لكل دور للاستشهاد.

جهاز تسجيل ميداني · WAVREC متحدثان · 38:42

auto-detected en-US48 kHz أحادي · 1411 kbps

~90s

النص · بث مستمردقة 94%

هل يمكنك أن تخبرني بما رأيته في صباح الثامن عشر؟

وصلت حوالي الساعة السادسة. باب منطقة التحميل كان مفتوحاً بالفعل، وهذا لم يكن يجب أن يحدث.

وكنت قد أبلغت عن مشكلة الباب من قبل — لمن؟

لـ Diane Okafor في الصيانة، مرتين في مارس. لدي رسائل البريد الإلكتروني.

94% على WAV ميدانيDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev بشري. Otter أو Trint. أم نحن.

Rev ترسل صوتك إلى مفرغين بشريين — بطيء وغالي لكن بدقة عالية على الصوت الصعب. Otter و Trint تركزان على الذكاء الاصطناعي مثلنا، مضبوطتان للصحفيين والباحثين. إليك أين يناسب كل واحد.

Option 01

تفريغ بشري من Rev

أشخاص حقيقيون يكتبون مقابلتك. الأفضل على الصوت الصعب، لكن تنتظر وتدفع أكثر.

وقت الانتظار12–24 ساعة عادة

الدقة على صوت نظيف99% (مزعوم)

أسماء المتحدثينيدوي، مضمن

اللغاتEN بشري · 30+ ذكاء اصطناعي

التكلفة · لكل دقيقة$1.50 بشري · $0.25 ذكاء اصطناعي

الخصوصيةالصوت يُرسل للمقاولين

Best forالمقابلات المرتبطة بالمحكمة أو الحرجة للنشر على صوت سيء حيث تحتاج أذن بشرية وعندك يوم للانتظار.

Option 02

Transcription.Solutions

نص ذكاء اصطناعي، منفصل المتحدثون، جاهز في دقائق. محرك واحد لرسالة هاتفية أو Zoom أو جهاز تسجيل ميداني.

وقت الانتظار~3 دقائق لكل ساعة صوت

الدقة على صوت نظيف94–96%

أسماء المتحدثينتلقائي · أعِد الأسماء في المحرر

اللغات99، كشف تلقائي

التكلفة · لكل دقيقة$0.03

الخصوصيةالصوت يُحذف في 24 ساعة · لا تدريب

Best forالصحفيون والباحثون والمنتجون الذين يفرغون عدة مقابلات أسبوعياً ويحتاجون نصاً سريعاً قابلاً للاستشهاد به دون رفع إلى مقاول.

Option 03

Otter / Trint

تفريغ ذكاء اصطناعي مع محرر موجه للبحث. قوي في اللغة الإنجليزية، مقيد بخطط شهرية.

وقت الانتظارفوري إلى ~5 دقائق

الدقة على صوت نظيف~90–93%

أسماء المتحدثيننعم · معايرة إنجليزية

اللغاتOtter إنجليزي فقط · Trint 30+

التكلفة$17–80/مستخدم/شهر (اشتراك)

الخصوصيةمخزن في الحساب بشكل افتراضي

Best forالفرق التي تريد مكتبة استضافة لكل مقابلة تُسجل وليست مانعة من رسم اشتراك شهري لكل مستخدم.

الأسعار والميزات دقيقة اعتباراً من 2026. وقت التسليم البشري من Rev يختلف حسب عمق طابور الانتظار وطول الصوت.

96% على ميكروفون جيد. لا يزال قابلاً للقراءة في تسجيل من مقهى.

دقة المقابلة محددة بما سمعته الميكروفون فعلاً. ميكروفون قريب ستيريو على كل متحدث هو السقف؛ هاتف على طاولة صاخبة هو الأرضية. الأرقام أدناه من ملفات مقابلات فعلية، وليس معايير اصطناعية.

8 أشياء يسأل عنها الناس حول تفريغ المقابلات.

01هل يمكنني استخدام هذه النصوص في مقال منشور دون التحقق من الصوت؟+

للاقتباسات المباشرة — لا، تحقق دائماً من الصوت. نصوص الذكاء الاصطناعي بدقة 94% لا تزال تخطئ في كلمة واحدة من بين 17 في المتوسط، والكلمة الخاطئة في الاقتباس هي تصحيح. النص للملاحة والصياغة؛ الصوت هو مصدر الحقيقة.

02سجل الجهاز ملف WAV ستيريو مع ميكروفون واحد لكل متحدث. ماذا أفعل؟+

حمّل الملف مباشرة — لا تحوّل إلى أحادي أولاً. نكتشف القنوات الاثنتين وندير كل واحدة إلى مسار تقسيم خاص بها، وهو أعلى مسار دقة لدينا. توقع 96%+ في غرفة هادئة.

03ماذا عن المقابلات المسجلة عبر مكالمة هاتفية؟+

الصوت الهاتفي 8 kHz نطاق ضيق، الذي يحدد الدقة حول 88% حتى على خط نظيف. نفصل الطرفين باستخدام فصل القناة إن التقط تطبيق التسجيل منفصلة (معظم يفعل). مكالمات VoIP عبر WhatsApp أو Signal تبدو أفضل قليلاً من PSTN.

04هل يمكنني حذف الأقسام السرية قبل مشاركة النص؟+

نعم. في المحرر، اختر نطاق الطابع الزمني وحدده كـ `[REDACTED]`. التصدير يستبدل النص بعلامة حذف لكن يحافظ على الطوابع الزمنية لذا الوثيقة لا تزال تتتبع الصوت.

05هل تدربون نماذج على تسجيلات المقابلات الخاصة بي؟+

لا. الصوت الأصلي يُحذف من بنيتنا خلال 24 ساعة من الانتهاء، ولا نستخدم تسجيلات العملاء لتدريب النماذج تحت أي خطة. نص الحساب يبقى في حسابك حتى تحذفه.

06ثلاثة أو أربعة أشخاص في مقابلة حوار — هل التقسيم لا يزال يعمل؟+

حتى حوالي ستة أصوات متميزة، نعم، لكن الدقة على تخصيص المتحدث تنخفض مع كل شخص مضاف وتسوء عندما يبدو متحدثان متشابهين. خطط لمرور 2–3 دقائق على رقاقات المتحدث بعد وصول النص.

07هل يمكنكم تفريغ مقابلات بلغات أخرى غير الإنجليزية؟+

99 لغة، كشف تلقائي. تبديل الرموز (مصدر إنجليزي ينزلق إلى إسباني في منتصف الجملة) يُتعامل معه في 12 زوج لغة. تختلف الدقة حسب اللغة — اللغات الأوروبية تطابق الإنجليزية؛ اللغات الأفريقية والآسيوية الوسطى ذات الموارد المحدودة تقل 5–10 نقاط.

08أسجل على مكالمة Zoom — هل يجب استخدام صفحة Zoom الخاصة بك؟+

محرك واحد، نتيجة واحدة. صفحة Zoom تغطي تفاصيل التسجيل السحابي (صوت لكل مشارك، انحطاط الاتصال). إذا كنت تجري مقابلة واحدة في المرة عبر Zoom، أي مسار يعمل — اسقط MP4 هنا وأسماء المتحدثين تخرج بنفس الطريقة.