Uzun ses dosyalarını yazıya çevirin.10 saate kadar. Zaman aşımı yok.

Uzun ses dosyası — Business'ta 10 saate, 5 GB'ye kadar bırakın. Paralel olarak parçalarız, konuşmacı kimliklerini uçtan uca tutarlı tutarız ve numaralı bir klasör yerine tek bir transkript sunabiliriz.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 5 saatlik bir dosya, transkript ortası

Saatler içinde. Bir temiz dosya dışarı.

Çoğu araç 90 dakika civarında zaman aşımına uğrar veya uzun ses kaydınızı kendi başınıza diktmeniz gereken numaralı parçalara böler. Biz 12 dakikalık çakışan pencerelere ayırırız, paralel olarak işler ve küresel bir konuşmacı geçişiyle yeniden birleştiririz.

Yönetim kurulu strateji oturumuREC 3 konuşmacı · 5:14:22 · 3.1 GB
otomatik olarak algılanan en-GB44.1 kHz stereo · 192 kbps
~90s
Transkript · tek dosya92% doğruluk · t=3:14:08
S1

Üç saattir içindeyiz — sabah oturumundan tedarik zinciri noktasına geri dönelim.

S2

Evet, Vietnam üretim pivotu. Bence öncü zaman riski konusunda çok hızlı geçtik.

S1

Tedarik süreleri tarife değişikliğinden sonra 14 günden 31 güne çıktı.

S3

Ve bunu Long Beach'te liman tıkanıklığı dikkate almadan söylüyorum.

5 saatlik dosyanın tamamında 92%DOCX · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Üç gerçek seçenek · dürüst karşılaştırma

Otter Pro. DIY Whisper parçalama. Ya da biz.

Tüketici araçları dosya uzunluğunu sınırlar ve metin içinde keser. Whisper API'nin istek başına 25 MB tavanı vardır, bu yüzden parçalayıcıyı kendi başınız oluşturursunuz. Biz 10 saatlik dosyayı kabul eder ve bir transkript döndürürüz.

Option 01

Otter Pro

Uzun dosyaları kayıt başına 4 saatinize sınırlar. Konuşmacı etiketleri 2 saatlik sonrasında kayar.

Maksimum dosya uzunluğu4 saat (Pro katmanı)
Maksimum dosya boyutu~1.5 GB yükleme
Konuşmacı kimlikleri uçtan uca2 saatlik sonrasında kayar
Uzun dosya çıktısıTek belge, sınıra kadar kesilmiş
Maliyet$16.99/kullanıcı/ay
Yeniden başlatılabilir yüklemeHayır
Best for2 saat altında kısa toplantılar. Günlük uzunluktaki kayıtlarda başarısız.
Option 02

Transcription.Solutions

Dosya başına 10 saat. Paralel parçalama, küresel konuşmacı geçişi, bir DOCX dışarı.

Maksimum dosya uzunluğu10 saat (Pro & Business)
Maksimum dosya boyutuPro 2 GB · Business 5 GB
Konuşmacı kimlikleri uçtan ucaKüresel gömme geçişi
Uzun dosya çıktısıTek dosya · DOCX/SRT/TXT
Maliyet · dakika başınaUzunluktan bağımsız $0.03 sabit
Yeniden başlatılabilir yüklemeÇok parçalı, düşüşleri dayanır
Best forGünlük çalıştaylar, ifadelendirmeler, yönetim kurulu toplantıları, sözlü tarihler — 90 dakikalık duvarı geçen herhangi bir şey.
Option 03

Whisper API + DIY parçalama

Dakika başına en ucuz. Parçalayıcıyı, konuşmacı dikişini ve yeniden deneme mantığını siz oluşturursunuz.

Maksimum dosya uzunluğuİstek başına 25 MB (~25 dakika)
Maksimum dosya boyutu25 MB sabit sınır
Konuşmacı kimlikleri uçtan ucaYok — diarization yok
Uzun dosya çıktısıNumaralı parçalar, siz diktik
Maliyet · dakika başına$0.006 (OpenAI Whisper)
Mühendislik zamanıİşlem hattı başına saatler veya günler
Best forKonuşmacılar, özetler veya tek çıktı gerektirmeyen ve parça başına ham metin isteyen mühendisler.

Fiyatlandırma ve sınırlar Mayıs 2026 itibariyle doğru. Otter Pro uzunluk sınırı, halka açık fiyatlandırma sayfasında son kez doğrulandı.

Uzun dosyalara özel

Genel araçların 90 dakikalık mark'ın ötesinde öldüğü üç yol.

Çoğu işlem hattı tek saatlik toplantılar için inşa edilmiştir. Uzun ses onları öngörülebilir şekillerde kırar — işte farklı yaptığımız şey.

Yanlış giden şey

  1. 190 dakikada sessiz zaman aşımı. İş bir saat döndükten sonra yararlı bir hata olmadan ölür. Yeniden denemek için hiçbir şey kalmaz.
  2. 2Konuşmacı kimlikleri parçalar arasında kayar. 1. saatteki Konuşmacı 1, 3. saatteki Konuşmacı 4 olur çünkü her parça yalıtımda diarize edilir.
  3. 3Çıktı numaralı bir klasördür. `transcript_part_01.txt` aracılığıyla `transcript_part_24.txt` her parça sınırında zaman damgası sıfırlanmıştır. Sizin diktik.

Burada neyi çevir

  1. 1Yeniden başlatılabilir çok parçalı yükleme. Bağlantı yüklemenin 2. saatinde kesilir? Son tamamlanan parçadan yeniden başlar. 4 GB'nin yeniden yüklenmesi yok.
  2. 2Küresel konuşmacı gömme geçişi. Parça başına diarization sonrasında, tüm dosya arasında sesleri kümelriz, böylece Konuşmacı 3 dakika 12'de ve dakika 487'de aynı kişi olur.
  3. 3Saat işaretçileriyle tek DOCX. Bir dosya, sürekli zaman damgaları, her 60 dakikada isteğe bağlı bölüm sonu. Dikteme yok.

Uzun dosyalar için önerilen iş ayarları

90 dakikayı aşan her şeyi bırakın ve bunlar otomatik olarak açılır. Formdan iş başına geçersiz kılın.

Parçalama stratejisi
12 dakikalık pencere · 10 saniye örtüşme
Diarization
Tüm parçalarda küresel geçiş
Konuşmacı modeli
Uzun form · 2-20 konuşmacı
Yükleme
Yeniden başlatılabilir çok parçalı
Kuyruk
Öncelik (Business planı)
Dışa aktarım
Tek DOCX · saat işaretçileri açık

Accuracy · real-world numbers

92% 5 saatlik dosya boyunca kalır. Kalite saat başına düz kalır.

Uzun ses ile zor olan şey model değil — dakika 1'den dakika 600'e kadar doğruluğu düz tutmaktır. Konuşmacı kayması ve parça sınırı hataları çoğu işlem hattını öldüren şeydir. Aşağıdaki sayılar ilk 10 dakika değil, tam uzunluktaki müşteri dosyaları arasında ölçülür.

95%
Stüdyo uzun form, tek konuşmacı

Sesli kitap seslendirmesi, solo podcast, yazılan el yazması. Oda gürültüsü olmayan 6-10 saatlik temiz ses. Diarization gerekli değil.

92%
Yönetim kurulu, 2-6 konuşmacı

Konferans masası, yanıklı mikrofon, 3-5 saat. Küresel konuşmacı geçişi kimlikleri dosyasının tamamında sabit tutacak.

88%
Günlük çalıştay, yakalama mikrofon

Mikrofon devri ve izleyici Soru-Cevap ile 7-9 saatlik eğitim günü. Adlar konuşmacı çiplerine 5 dakikalık geçiş gerektirir.

82%
Saha yuvarlak masa, 8+ konuşmacı

Uzun sözlü tarih, odak grubu veya çakışan sesler ve ortam gürültüsüne sahip panel. Kullanılabilir, ama temizleme bekleyin.

Sık sorulan sorular

Uzun ses yazıya çevirimi hakkında 8 şey insanlar sorar.

01Gerçek dosya uzunluğu ve boyut sınırı nedir?+
Pro ve Business'ta dosya başına 10 saat. Pro dosya boyutunu 2 GB'ye, Business'ı 5 GB'ye kapatır. 10 saatinden daha uzun bir şeyiniz varsa, doğal bir mola noktasında bir kez bölün — arka arkaya aynı projede yüklerseniz konuşmacı kimlikleri tutarlı tutacağız.
02Bir transkript mi yoksa numaralı parçaların bir klasörü mü alırım?+
Bir dosya. Her zaman. DOCX, SRT, TXT veya JSON — seçiminiz. Zaman damgaları her parça sınırında sıfırlanmaz, her parça sınırında değil, kaydın sonuna 00:00:00'dan başlayarak çalışır.
036 saatlik bir dosyanın geri dönmesi ne kadar sürer?+
Pro kuyruğunda kabaca 18-25 dakika, Business önceliğinde 8-12. 12 dakikalık parçaları paralel olarak işleriz, bu nedenle wall-clock zamanı dosya uzunluğuyla doğrusal olmayan şekilde ölçeğini değil, dakika başına ölçekler.
04Konuşmacı kimlikleri uçtan uca tutarlı mı kalır?+
Evet. Parça başına diarization'dan sonra, küresel bir gömme geçişi tüm dosya arasında sesleri kümelriz. Dakika 12'deki Konuşmacı 3, dakika 487'deki aynı Konuşmacı 3'tür. Bu DIY Whisper işlem hattının yanlış yaptığı ana şeydir.
054 GB dosyanın 3. saatinde yükleme düşerse ne olur?+
Yeniden başlatılabilir çok parçalı yükleme, son tamamlanan parçadan devam eder. İlk 3 GB'yi yeniden yüklemezsiniz. Saçaklı otel Wi-Fi'de ve hücresel bağlantı kuruyunuz — her ikisini de test ettik.
06Neden Whisper API uzun dosyaları boğar?+
OpenAI'nin Whisper uç noktası, istek başına 25 MB sabit tavanı — kabaca 25 dakikalık sıkıştırılmış ses. Daha uzun herhangi bir şey parçalanması, paralel olarak yazıya çevrilmesi ve kendiniz transkript ve hizalama konuşmacılarını diktemeniz gerekir. Biz bunu sunucu tarafında yaparız.
07Dakika başına fiyat 10 dakikalık dosya ile aynı mı?+
Evet. Uzunluktan bağımsız olarak dakika başına $0.03 sabit. 10 saatlik bir dosya 18 dolar tutacak. Biz Rev'in yaptığı gibi uzun dosyaları surcharge yapmıyoruz ($1.50/dakika insan × 10 saat = $900).
08Bölüm işaretçileri veya her saat zaman damgaları alabilir miyim?+
İş formundaki 'Saat işaretçileri' açısını seçin ve DOCX, 60 dakikada bir başlık molası ile dışa aktarılır. SRT sürekli zaman kodunu korur. JSON her ikisini de — bölüm dizisi artı kelime seviyesi zaman damgaları.

Uzun dosyanızı bırakın. Bir transkript geri alın.

Her ay 30 dakika ücretsiz. Kart yok. 10 saate kadar dosya, tutarlı kalan konuşmacı etiketleri, tek dosya dışa aktarımı.

Ücretsiz başla