تفريغ المقابلات.تسجيل مختلف، نتيجة واحدة.

رسالة صوتية من الهاتف أو مكالمة Zoom أو ميكروفون يقيني أو جهاز تسجيل ميداني محمول — ألقِ تسجيل المقابلة واحصل على نص مع أسماء المتحدثين والطوابع الزمنية يمكنك الاستشهاد به.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ شاهد ما يخرج

صوتان يدخلان. صوتان يخرجان، موسومان.

معظم المقابلات تضم شخصين على جهاز واحد — هاتف على الطاولة أو ميكروفون بينكما. نفصل الصوت الخاص بالمقابلة إلى الصحفي والمصدر حتى من قناة أحادية واحدة، ثم نضع طابع زمني لكل دور للاستشهاد.

جهاز تسجيل ميداني · WAVREC متحدثان · 38:42
auto-detected en-US48 kHz أحادي · 1411 kbps
~90s
النص · بث مستمردقة 94%
S1

هل يمكنك أن تخبرني بما رأيته في صباح الثامن عشر؟

S2

وصلت حوالي الساعة السادسة. باب منطقة التحميل كان مفتوحاً بالفعل، وهذا لم يكن يجب أن يحدث.

S1

وكنت قد أبلغت عن مشكلة الباب من قبل — لمن؟

S2

لـ Diane Okafor في الصيانة، مرتين في مارس. لدي رسائل البريد الإلكتروني.

94% على WAV ميدانيDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

ثلاثة خيارات حقيقية · مقارنة صادقة

Rev بشري. Otter أو Trint. أم نحن.

Rev ترسل صوتك إلى مفرغين بشريين — بطيء وغالي لكن بدقة عالية على الصوت الصعب. Otter و Trint تركزان على الذكاء الاصطناعي مثلنا، مضبوطتان للصحفيين والباحثين. إليك أين يناسب كل واحد.

Option 01

تفريغ بشري من Rev

أشخاص حقيقيون يكتبون مقابلتك. الأفضل على الصوت الصعب، لكن تنتظر وتدفع أكثر.

وقت الانتظار12–24 ساعة عادة
الدقة على صوت نظيف99% (مزعوم)
أسماء المتحدثينيدوي، مضمن
اللغاتEN بشري · 30+ ذكاء اصطناعي
التكلفة · لكل دقيقة$1.50 بشري · $0.25 ذكاء اصطناعي
الخصوصيةالصوت يُرسل للمقاولين
Best forالمقابلات المرتبطة بالمحكمة أو الحرجة للنشر على صوت سيء حيث تحتاج أذن بشرية وعندك يوم للانتظار.
Option 02

Transcription.Solutions

نص ذكاء اصطناعي، منفصل المتحدثون، جاهز في دقائق. محرك واحد لرسالة هاتفية أو Zoom أو جهاز تسجيل ميداني.

وقت الانتظار~3 دقائق لكل ساعة صوت
الدقة على صوت نظيف94–96%
أسماء المتحدثينتلقائي · أعِد الأسماء في المحرر
اللغات99، كشف تلقائي
التكلفة · لكل دقيقة$0.03
الخصوصيةالصوت يُحذف في 24 ساعة · لا تدريب
Best forالصحفيون والباحثون والمنتجون الذين يفرغون عدة مقابلات أسبوعياً ويحتاجون نصاً سريعاً قابلاً للاستشهاد به دون رفع إلى مقاول.
Option 03

Otter / Trint

تفريغ ذكاء اصطناعي مع محرر موجه للبحث. قوي في اللغة الإنجليزية، مقيد بخطط شهرية.

وقت الانتظارفوري إلى ~5 دقائق
الدقة على صوت نظيف~90–93%
أسماء المتحدثيننعم · معايرة إنجليزية
اللغاتOtter إنجليزي فقط · Trint 30+
التكلفة$17–80/مستخدم/شهر (اشتراك)
الخصوصيةمخزن في الحساب بشكل افتراضي
Best forالفرق التي تريد مكتبة استضافة لكل مقابلة تُسجل وليست مانعة من رسم اشتراك شهري لكل مستخدم.

الأسعار والميزات دقيقة اعتباراً من 2026. وقت التسليم البشري من Rev يختلف حسب عمق طابور الانتظار وطول الصوت.

مخصص للمقابلات

ثلاثة أشياء تزعج الناس بشأن أدوات التفريغ العامة.

صوت المقابلة نادراً ما يكون نظيفاً. غيّر هذه الإعدادات والنص يصمد أمام الاستشهاد.

ما الذي يحدث بشكل خاطئ

  1. 1تحدث متزامن على قناة واحدة. عندما يصبح مصدرك متحمساً ويتحدث فوق سؤالك، التقسيم العام يدمج كليهما في كتلة متحدث واحدة.
  2. 2أسماء المصادر والأماكن (Okafor، Tigray، Maranello) تعود صوتية. عديمة الفائدة للتحقق من الحقائق مقابل نص.
  3. 3اللحظات السرية تنتهي في نفس النص مثل المادة القابلة للاستشهاد — لا توجد طريقة لتحديد منطقة كمحذوفة.

ما تغيره هنا

  1. 1إذا كتب جهاز التسجيل الميداني ملف WAV ثنائي القناة (ميكروفون واحد لكل مسار)، حمّل الملف مباشرة. نكتشف لكل قناة ونتخطى التقسيم بالكامل.
  2. 2الصق ملاحظات التحضير — أسماء المصادر، المنظمات، أسماء الأماكن — في المفردات المخصصة على نموذج المهمة. يتعامل المعترف مثلها كأسماء علم معروفة.
  3. 3بعد وصول النص، حدد منطقة كسرية في المحرر. تُصدّر كـ `[REDACTED 14:22–15:08]` في DOCX و TXT، مع حذف الصوت الأصلي في 24 ساعة على أي حال.

إعدادات مهمة موصى بها للمقابلات

ألقِ ملف مقابلة وهذه تبدأ بشكل افتراضي. تجاوز لكل مهمة من النموذج.

التقسيم
لكل قناة إن كان ستيريو · صوتي وإلا
نموذج المتحدث
مقابلة · 2–4 متحدثين
اللغة
كشف تلقائي · تبديل رمز مفعّل
كلمات حشو
محفوظة (نمط حرفي)
ملخص
اقتباسات مفتاحية + فهرس الموضوع
تصدير
DOCX مع طوابع زمنية · TXT عادي · JSON

Accuracy · real-world numbers

96% على ميكروفون جيد. لا يزال قابلاً للقراءة في تسجيل من مقهى.

دقة المقابلة محددة بما سمعته الميكروفون فعلاً. ميكروفون قريب ستيريو على كل متحدث هو السقف؛ هاتف على طاولة صاخبة هو الأرضية. الأرقام أدناه من ملفات مقابلات فعلية، وليس معايير اصطناعية.

96%
ميكروفونا يقينيان · صمت دراسة

ميكروفون واحد لكل متحدث، قنوات منفصلة (Zoom H5/H6، Tascam DR-40). التقسيم تافه — الخطأ في النص فقط.

94%
جهاز تسجيل محمول على طاولة

ميكروفون كهربائي واحد بين متحدثين، غرفة هادئة. التقسيم الصوتي ينفصل الأصوات بموثوقية تحت 4 أقدام.

90%
رسالة صوتية من هاتف · قريب

رسالة صوتية iPhone أو Pixel على الطاولة. الأسماء والأرقام تفوتها أحياناً؛ الإيقاع حسن للاستشهاد.

84%
تسجيل ميداني · مقهى أو شارع

آلات إسبريسو، حركة مرور، أصوات أخرى قريبة. الحالة الأسوأ في بياناتنا — صالح للملاحة، تحقق من الاقتباسات م��ابل الصوت.

أسئلة شائعة

8 أشياء يسأل عنها الناس حول تفريغ المقابلات.

01هل يمكنني استخدام هذه النصوص في مقال منشور دون التحقق من الصوت؟+
للاقتباسات المباشرة — لا، تحقق دائماً من الصوت. نصوص الذكاء الاصطناعي بدقة 94% لا تزال تخطئ في كلمة واحدة من بين 17 في المتوسط، والكلمة الخاطئة في الاقتباس هي تصحيح. النص للملاحة والصياغة؛ الصوت هو مصدر الحقيقة.
02سجل الجهاز ملف WAV ستيريو مع ميكروفون واحد لكل متحدث. ماذا أفعل؟+
حمّل الملف مباشرة — لا تحوّل إلى أحادي أولاً. نكتشف القنوات الاثنتين وندير كل واحدة إلى مسار تقسيم خاص بها، وهو أعلى مسار دقة لدينا. توقع 96%+ في غرفة هادئة.
03ماذا عن المقابلات المسجلة عبر مكالمة هاتفية؟+
الصوت الهاتفي 8 kHz نطاق ضيق، الذي يحدد الدقة حول 88% حتى على خط نظيف. نفصل الطرفين باستخدام فصل القناة إن التقط تطبيق التسجيل منفصلة (معظم يفعل). مكالمات VoIP عبر WhatsApp أو Signal تبدو أفضل قليلاً من PSTN.
04هل يمكنني حذف الأقسام السرية قبل مشاركة النص؟+
نعم. في المحرر، اختر نطاق الطابع الزمني وحدده كـ `[REDACTED]`. التصدير يستبدل النص بعلامة حذف لكن يحافظ على الطوابع الزمنية لذا الوثيقة لا تزال تتتبع الصوت.
05هل تدربون نماذج على تسجيلات المقابلات الخاصة بي؟+
لا. الصوت الأصلي يُحذف من بنيتنا خلال 24 ساعة من الانتهاء، ولا نستخدم تسجيلات العملاء لتدريب النماذج تحت أي خطة. نص الحساب يبقى في حسابك حتى تحذفه.
06ثلاثة أو أربعة أشخاص في مقابلة حوار — هل التقسيم لا يزال يعمل؟+
حتى حوالي ستة أصوات متميزة، نعم، لكن الدقة على تخصيص المتحدث تنخفض مع كل شخص مضاف وتسوء عندما يبدو متحدثان متشابهين. خطط لمرور 2–3 دقائق على رقاقات المتحدث بعد وصول النص.
07هل يمكنكم تفريغ مقابلات بلغات أخرى غير الإنجليزية؟+
99 لغة، كشف تلقائي. تبديل الرموز (مصدر إنجليزي ينزلق إلى إسباني في منتصف الجملة) يُتعامل معه في 12 زوج لغة. تختلف الدقة حسب اللغة — اللغات الأوروبية تطابق الإنجليزية؛ اللغات الأفريقية والآسيوية الوسطى ذات الموارد المحدودة تقل 5–10 نقاط.
08أسجل على مكالمة Zoom — هل يجب استخدام صفحة Zoom الخاصة بك؟+
محرك واحد، نتيجة واحدة. صفحة Zoom تغطي تفاصيل التسجيل السحابي (صوت لكل مشارك، انحطاط الاتصال). إذا كنت تجري مقابلة واحدة في المرة عبر Zoom، أي مسار يعمل — اسقط MP4 هنا وأسماء المتحدثين تخرج بنفس الطريقة.

اسقط تسجيل المقابلة. شاهد ما يخرج.

30 دقيقة مجانية كل شهر. بدون بطاقة. أسماء المتحدثين، 99 لغة، كل التصديرات مضمونة.

ابدأ مجاناً