MP3 metne — MP3'ü metne dönüştürün veya MP3 ses dosyalarını hızla transkribe edin

MP3'ü metne transkribe edin.Konuşmacı etiketleri, 100+ dil.

64 ile 320 kbps arasında herhangi bir bit hızındaki MP3 dosyasını bırakın. 99 dilde zaman damgalı, konuşmacı etiketli bir transkript alın — format dönüşümü yok, yeniden kodlama yok, sıra beklemek yok.

Sesini veya videonu bırak

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Doğrudan tarayıcından kaydet

Kayıt 30 saniye sürer — hemen ardından panelde kayıt ekranı açılır.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTDosyalar 24 saatte otomatik silinir

MP3 girer. Diyarize transkript çıkar.

MP3 çerçeve başlıklarını doğrudan okuyoruz — VBR, CBR, joint-stereo, her kodlayıcı (LAME, Fraunhofer, FFmpeg). Dosya gerçekten stereo ise ve konuşmacılar ayrı kanallarda kayıtlıysa, sesleri ayırmak için bunu kullanırız. Mono karışım için akustik diyarizasyona düşeriz.

interview-tape-04.mp3REC 192 kbps · stereo · 38:42

otomatik algılandı en-GB44.1 kHz · LAME 3.100

~90s

Transkript · akış halinde%95 doğruluk

Peki arşivin eksik olduğunu ilk ne zaman fark ettiniz?

Sanırım 2019 civarında, makaralı bantları dijitalleştirmeye başladığımızda.

Peki kayıp bantlar — herhangi bir yerde kataloglanmış mıydı?

78 yılından kalma kağıt bir indeks var ama yarısı su hasarlı.

192 kbps stereoda %95SRT · DOCX · TXT · JSON · VTT

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Özet 5Transkript 1,420Konuşmacılar 2Dışa aktarmalar

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Ana tezler

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Yapılacaklar

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Whisper yerel / açık kaynak

GPU'nuz ve bir öğleden sonranız varsa ücretsiz. Kutudan çıktığı haliyle konuşmacı diyarizasyonu yok.

KurulumPython + CUDA + 10 GB model

Konuşmacı diyarizasyonuDahil değil (pyannote eklentisi)

Hız · 1 sa MP3Tüketici GPU'sunda 5–40 dk

Diller99, ama küçük model %80'in altına düşer

Dışa aktarımTXT / SRT / VTT / JSON

MaliyetÜcretsiz + elektriğiniz

Best forHalihazırda GPU'su olan, konuşmacı etiketine ihtiyaç duymayan ve tam yerel gizlilik isteyen mühendisler.

Option 02

Transcription.Solutions

MP3'ü bırakın. Yaklaşık gerçek zamanın × 0.025'i kadar sürede konuşmacı etiketli metni geri alın.

KurulumSürükle-bırak, denemek için hesap gerekmez

Konuşmacı diyarizasyonuYerleşik (Pro ve Business planları)

Hız · 1 sa MP3~90 saniye

Diller99, otomatik algılanır

Dışa aktarımSRT · VTT · DOCX · TXT · JSON

Maliyet · dk başına$0.03

Best forElinde MP3 olan herkes — gazeteci kaydı, podcast dışa aktarımı, ses notu, arşiv dublajı — yalnızca diğer uçtan doğru metin almak isteyenler.

Option 03

Otter / Sonix

Cilalı pano, aylık dakika sınırı, İngilizceye optimize. Dosya yüklemesi yan özellik gibi hissettiriyor.

KurulumHesap + ücretli plan

Konuşmacı diyarizasyonuAkustik, EN ağırlıklı

Hız · 1 sa MP3Sırada 5–10 dk

DillerOtter yalnızca EN; Sonix ~40

Dışa aktarımÜcretli kademelerin arkasında

Maliyet$17+/ay veya $10+/sa (Sonix)

Best forTemiz API tarzı dosya→metin akışından çok transkript düzenleyici ve iş birliği arayüzü isteyen ekipler.

Fiyatlandırma ve özellik mevcudiyeti Mayıs 2026 itibarıyla geçerlidir. Whisper performansı model boyutuna ve donanıma göre değişir.

192 kbps stereoda %95+. 64 kbps monoya kadar kullanılabilir.

MP3 doğruluğu bizim değil, kodlayıcının neyi sakladığıyla sınırlıdır. ~96 kbps üzerindeki algısal sıkıştırma konuşma anlaşılırlığını oldukça iyi korur; 64 kbps altında sızıltılı ve ünsüz sesler erimeye başlar. Aşağıdaki rakamlar üretimdeki gerçek müşteri MP3'lerinden alınmıştır.

insanların sorduğu 8 şey. MP3 transkripsiyonu hakkında

01Hâlâ kullanılabilir bir transkript veren minimum MP3 bit hızı nedir?+

64 kbps pratik tabandır. Bunun altında sızıltılı sesler (s, ş, f) gürültüye sıkışır ve kelime hata oranı %20'yi aşar. Yeni kayıt yapıyorsanız 128 kbps mono veya 192 kbps stereo hedefleyin — daha yüksek her şey konuşma için fazlasıyla yeterli.

02MP3'ümü önce WAV'a dönüştürmem gerekiyor mu?+

Hayır. MP3 → WAV yeniden kodlaması sıfır doğruluk ekler çünkü kodlayıcının attığı veri kalıcı olarak kaybolmuştur. MP3'ü doğrudan yükleyin. Çerçeveleri bellekte çözer ve PCM'i tanıyıcıya besleriz.

03Stereo MP3 bana monodan daha iyi konuşmacı etiketleri verir mi?+

Yalnızca konuşmacılar gerçekten ayrı kanallarda kaydedildiyse — çoğu stereo MP3'te aynı ses her iki tarafta da bulunur ('çift mono') ve hiçbir kazanç sağlamaz. Gerçek kanal ayrımı (örneğin Riverside dışa aktarımları, iki mikrofonlu saha kurulumları) akustik diyarizasyonu atlamamızı ve konuşmacıları neredeyse kusursuz etiketlememizi sağlar.

04Kabul ettiğiniz maksimum MP3 dosya boyutu nedir?+

Yükleme başına 5 GB; bu da 192 kbps'de yaklaşık 60 saat veya 128 kbps'de 90 saat eder. Dosyanız daha büyükse parçalı yükleme göstereceğiz — kendiniz bölmenize gerek yok.

0560 dakikalık bir MP3'ün transkribe edilmesi ne kadar sürer?+

Bit hızından bağımsız olarak, yüklemenin tamamlanmasından transkriptin hazır olmasına kadar genellikle 90 saniye. MP3 çerçevelerini çözmek hızlıdır; süre tanıyıcıdadır. Çok konuşmacılı dosyalarda diyarizasyon 5-10 saniye ekler.

06MP3'ümde fon müziği var — transkript mahvolur mu?+

Konuşmanın altında sessiz yatak müziği sorun değil. Sesle yarışan yüksek müzik (intro vurguları, röportajlar altındaki müzik) bazen örtüşen hecelerde tanıma hatalarını tetikler. İş formunda müzik bastırmayı açarak önceden filtreleyin.

07Telefon sesli mesajından veya telesekreterden aktarılan MP3'leri işleyebilir misiniz?+

Evet, ancak bunlar genellikle MP3 olarak yeniden kodlanmış 8 kHz dar bantlıdır — ses kalitesi tavanı MP3 sarmalayıcısı tarafından değil, orijinal PSTN kaydı tarafından belirlenir. Bu tür kaynaklarda %78-85 doğruluk bekleyin; bu zaten temel çağrıda alacağımız doğrulukla aynıdır.

08Transkript bittikten sonra MP3'ümü saklıyor musunuz?+

Dosyalar varsayılan olarak 30 gün sonra ya da pano üzerinden istenirse anında silinir. Transkript siz silene kadar hesabınızda kalır. Müşteri sesini hiçbir modeli eğitmek için asla kullanmayız — hiçbir zaman.

MP3'ü metne transkribe edin.Konuşmacı etiketleri, 100+ dil.

Sesini veya videonu bırak

Paste a link, we’ll fetch the audio

Doğrudan tarayıcından kaydet

MP3 girer. Diyarize transkript çıkar.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Ücretsiz yerel Whisper. Otter veya Sonix. Ya da biz.

Whisper yerel / açık kaynak

Transcription.Solutions

Otter / Sonix

insanları ısıran üç şey. Genel transkripsiyon araçlarında

Nerede ters gidiyor

Biz onun yerine ne yapıyoruz

MP3 yüklemeleri için önerilen iş ayarları

192 kbps stereoda %95+. 64 kbps monoya kadar kullanılabilir.

insanların sorduğu 8 şey. MP3 transkripsiyonu hakkında

MP3'ünüzü bırakın. 90 saniyede metni geri alın.