MP3 إلى نص — حوّل MP3 إلى نصوص أو اكتب نص ملفات صوتية MP3، بسرعة

اكتب نص MP3.تسميات المتحدثين، 100+ لغة.

أسقط ملف MP3 عند أي معدل نقل من 64 إلى 320 kbps. احصل على نص مع طوابع زمنية وتسميات متحدثين في 99 لغة — بدون تحويل صيغة، بدون إعادة ترميز، بدون انتظار في الطابور.

أفلِت الصوت أو الفيديو هنا

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

سجّل مباشرة من متصفحك

التسجيل يستغرق 30 ثانية — التسجيل الصوتي يفتح فورًا بعدها، داخل لوحة التحكم.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTالملفات تُحذف تلقائيًا خلال 24 ساعة

MP3 يدخل. نص مع تحديد المتحدثين يخرج.

نقرأ رؤوس إطارات MP3 مباشرة — VBR و CBR و joint-stereo و أي محرّر ترميز (LAME و Fraunhofer و FFmpeg). إذا كان الملف ستيريو حقيقي مع متحدثين على قنوات منفصلة، نستخدم ذلك لفصل الأصوات. الخليط أحادي يعود إلى تحديد المتحدثين الصوتي.

interview-tape-04.mp3REC 192 kbps · stereo · 38:42

تم الكشف تلقائياً en-GB44.1 kHz · LAME 3.100

~90s

النص · البث المباشردقة 95%

فمتى أدركت للمرة الأولى أن الأرشيف غير مكتمل؟

ربما حول عام 2019، عندما بدأنا رقمنة الملفات الشريطية.

والأشرطة المفقودة — هل تم فهرستها في أي مكان على الإطلاق؟

يوجد فهرس ورقي من سنة 78، لكن نصفه تضرر من الماء.

دقة 95% على 192 kbps stereoSRT · DOCX · TXT · JSON · VTT

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

ملخص 5النص 1,420المتحدثون 2تصديرات

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

الأفكار الرئيسية

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

ما يجب فعله

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Whisper المحلي المجاني. Otter أو Sonix. أو نحن.

يمكنك تشغيل Whisper على جهاز الكمبيوتر المحمول الخاص بك مجاناً إذا كنت تقنياً. Otter و Sonix يقبلان رفع MP3 داخل لوحات التحكم. نحن نأخذ الملف، نُرجع النص، ولا نجعلك تعيش داخل واجهة مستخدم.

Option 01

Whisper محلي / مفتوح المصدر

مجاني إذا كان لديك GPU و ساعة من الوقت. بدون تحديد متحدثين من الصندوق.

الإعدادPython + CUDA + 10 GB من النماذج

تحديد المتحدثينغير مضمن (add-on pyannote)

السرعة · ملف MP3 مدته ساعة5–40 دقيقة على GPU استهلاكية

اللغات99، لكن النموذج الصغير يهبط تحت 80%

التصديرTXT / SRT / VTT / JSON

التكلفةمجاني + كهربائك

Best forالمهندسون الذين يملكون بالفعل GPU، لا يحتاجون إلى تسميات متحدثين، ويريدون خصوصية محلية كاملة.

Option 02

Transcription.Solutions

أسقط MP3. احصل على نص مع تسميات متحدثين بسرعة تقريباً حقيقية × 0.025.

الإعدادالسحب والإفلات، لا تحتاج حساب للتجربة

تحديد المتحدثينمضمّن (خطط Pro و Business)

السرعة · ملف MP3 مدته ساعة~90 ثانية

اللغات99، مكتشفة تلقائياً

التصديرSRT · VTT · DOCX · TXT · JSON

التكلفة · لكل دقيقة$0.03

Best forأي شخص لديه MP3 — شريط صحفي، تصدير بودكاست، مذكرة صوتية، نسخة أرشيفية — يريد فقط نصاً دقيقاً في النهاية.

Option 03

Otter / Sonix

لوحة تحكم مصقولة، حد أقصى لدقائق شهرية، مضبوط على الإنجليزية. رفع الملف يبدو كميزة جانبية.

الإعدادحساب + خطة مدفوعة

تحديد المتحدثينصوتي، يميل نحو EN

السرعة · ملف MP3 مدته ساعة5–10 دقائق في الطابور

اللغاتOtter EN فقط؛ Sonix ~40

التصديرمُقفل خلف المستويات المدفوعة

التكلفة$17+/شهر أو $10+/ساعة (Sonix)

Best forالفريق الذي يريد محرر نصوص وواجهة تعاون أكثر من تدفق نمط API نظيف ملف→نص.

التسعير وتوفر الميزات دقيقة اعتباراً من مايو 2026. أداء Whisper تختلف حسب حجم النموذج والأجهزة.

95%+ على 192 kbps stereo. يمكن الاستخدام حتى 64 kbps أحادي.

دقة MP3 محدودة بـ ما احتفظ به المشفّر، وليس بنا. الضغط الإدراكي فوق ~96 kbps يحافظ على وضوح الكلام بشكل جيد جداً؛ تحت 64 kbps، تبدأ الأصوات والحروف الساكنة في الاختفاء. الأرقام أدناه من ملفات MP3 حقيقية للعملاء في الإنتاج.

8 أشياء يسأل الناس عنها حول نسخ MP3.

01ما هو الحد الأدنى من معدل نقل MP3 الذي ما يزال يعطي نصاً قابلاً للاستخدام؟+

64 kbps هو الحد العملي. تحت ذلك، تنضغط الأصوات (s، sh، f) إلى ضوضاء ومعدل الخطأ يتسلق فوق 20%. إذا كنت تسجل جديد، استهدف 128 kbps mono أو 192 kbps stereo — أي شيء أعلى هو فائض على الكلام.

02هل أحتاج إلى تحويل MP3 إلى WAV أولاً؟+

لا. إعادة ترميز MP3 → WAV تضيف دقة صفر لأن البيانات التي رفضها المشفّر اختفت للأبد. حمّل MP3 مباشرة. نفك تشفير الإطارات في الذاكرة والعلف PCM للمعترف.

03هل س��عطيني MP3 ستيريو تسميات متحدثين أفضل من mono؟+

فقط إذا تم تسجيل المتحدثين فعلاً على قنوات منفصلة — معظم ملفات MP3 ستيريو لها نفس الصوت على كلا الجانبين ('dual mono') ولا تكسب شيء. فصل القناة الحقيقية (مثل تصديرات Riverside، أجهزة ميكروفون منفصلة) يسمح لنا بتخطي تحديد المتحدثين الصوتي وتسمية المتحدثين بدقة تقريباً مثالية.

04ما هو حجم ملف MP3 الأقصى الذي تقبله؟+

5 GB لكل تحميل، وهو تقريباً 60 ساعة عند 192 kbps أو 90 ساعة عند 128 kbps. إذا كان ملفك أكبر، سنعرض تحميل مقسم — لا حاجة لفصله بنفسك.

05كم من الوقت يستغرق نسخ MP3 مدته 60 دقيقة؟+

عادة 90 ثانية من اكتمال التحميل إلى جاهزية النص، بغض النظر عن معدل النقل. فك تشفير إطارات MP3 سريع؛ الوقت موجود في المعترف. يضيف تحديد المتحدثين 5-10 ثواني على ملفات متعددة المتحدثين.

06MP3 الخاص بي يحتوي على موسيقى خلفية — هل سيتم إفساد النص؟+

موسيقى السرير الهادئة تحت الكلام صحيحة. الموسيقى العالية التي تنافس الصوت (لواحق المقدمة، التسجيل تحت المقابلات) تحفز أحياناً على الاعترافات الخاطئة على المقاطع المتداخلة. قلّب قمع الموسيقى على نموذج الوظيفة للتصفية المسبقة.

07هل يمكنك التعامل مع ملفات MP3 المشفرة من بريد صوتي الهاتف أو أجهزة الرد الآلي؟+

نعم، على الرغم من أن هذه غالباً ما تكون 8 kHz ضيقة النطاق معاد ترميزها كـ MP3 — سقف جودة الصوت محدد بقبض PSTN الأصلي، وليس غلاف MP3. توقع دقة 78-85% على هذا النوع من المصدر، وهي نفس ما ستحصل عليه على الاتصال الأساسي.

08هل تحتفظون بـ MP3 بعد انتهاء النص؟+

يتم حذف الملفات بعد 30 يوماً افتراضياً، أو فوراً عند الطلب عبر ��وحة التحكم. يبقى النص في حسابك حتى تحذفه. لا نستخدم صوت العميل لتدريب أي نموذج — أبداً.