MP4 videosunu metne transkribe edin.Ses otomatik olarak çıkarılır.

MP4 dosyasını olduğu gibi bırakın — biz ses parçasını sunucu tarafında çekeriz, zaman damgalı transkripti döndürürüz ve SRT'yi YouTube'a, Vimeo'ya veya NLE'nize doğrudan aktarılan şekilde göndeririz.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Çıkanları izleyin

MP4 girişi. Transkript + SRT çıkışı.

MP4 bir konteyner — biz ses akışını doğrudan okuruz, videoyu asla yeniden kodlamayız. Zaman damgaları orijinal zaman çizelgenize karşı çerçeve-kesin kalır, bu nedenle SRT ilk içe aktarmada hizalanır.

training-module-04.mp4REC 1080p · 22:14 · 412 MB
auto-detected en-USAAC 48 kHz stereo · 192 kbps
~90s
Transkript · yayında%95 doğruluk
S1

Tamam, bu modülde iade iş akışını uçtan uca gözden geçiriyoruz.

S2

Başlamadan önce hızlı bir soru — bu kısmi iadeler için de geçerli mi?

S1

İyi yakalaması. Kısmi iadelerde aynı ekran ama farklı bir neden kodu kullanılır.

S2

Anlaşıldı. Onay eşiği hala iki yüz dolar mı?

Temiz diyalog üzerine %95SRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Üç gerçek seçenek · dürüst karşılaştırma

ffmpeg ile kendiniz yapın. Bir video editörü. Veya biz.

Sesi kendiniz çıkarabilir ve Whisper çalıştırabilirsiniz. MP4'ü Descript veya VEED'e sürükleyebilir ve onların editöründe yaşayabilirsiniz. Veya dosyayı buraya bırakın, transkripti ve SRT'yi geri alın, editör kilidi olmadan.

Option 01

ffmpeg + Whisper

Ücretsiz, yerel, titiz. Ardışık düzeni ve içindeki her hatayı kontrol ediyorsunuz.

GerektirirCLI + 10 GB model + GPU
Konuşmacı diyarizasyonuAyrı araç (pyannote)
SRT çıkışıEvet, manuel seçenek
1 saatlik MP4'te zamanCPU'da 20–90 dakika
Çok parçalı sesAkışı siz seçersiniz
Maliyet$0 + donanımınız
Best forWhisper'ı yerel olarak çalıştıran ve diyarizasyonu üzerine dikmekten hoşlanmayan mühendisler.
Option 02

Transcription.Solutions

MP4'ü bırakın. Ses çıkarma, diyarizasyon, SRT, özet — tek bir geçiş.

GerektirirTarayıcı, başka bir şey yok
Konuşmacı diyarizasyonuYerleşik, her iş
SRT çıkışıKaynağa çerçeve-hizalı
1 saatlik MP4'te zaman~4 dakika, yayında
Çok parçalı sesTüm akışları listeliyoruz
Maliyet · dakika başına$0,03
Best forVideo editörü veya CLI öğrenmeden metni ve SRT'yi isteyen herkes.
Option 03

Descript / VEED

MP4'ü editöre yükleyin. Transkript zaman çizelgesi arayüzünün bir parçası olarak görüntülenir.

GerektirirHesap + editör öğrenme eğrisi
Konuşmacı diyarizasyonuEvet, İN-ayarlı
SRT çıkışıPlana göre dışa aktarma geçitli
Yükleme sınırı5 GB (Descript ücretsiz)
Çok parçalı sesYalnız ilk parça
Maliyet$12–24/kullanıcı/ay
Best forVideoyu ve transkripti aynı araçta kesmek isteyen editörler.

Fiyatlandırma ve özellik sınırları 2026 itibariyle yaklaşıktır. Descript ve VEED katman adları sık sık değişir — güncel sınırlar için sitelerini kontrol edin.

MP4'ye özgü

insanları ısıtan üç şey. Genel transkripsiyon araçlarında

MP4 bir konteyner, codec değil — ve çoğu transkripsiyon aracı bunu bir büyük ses blobu gibi ele alır. Orası kaçırılanların geldiği yerdir.

Ne yanlış gidiyor

  1. 1Boom + lav ile çok parçalı MP4. Genel araçlar parça 1'i alır ve geri kalanını göz ardı eder, bu nedenle temiz mikrofonu kaybedersiniz. FCP ve Premiere dışa aktarmalarında yaygın.
  2. 2Vloglar ve reklamlarda arka plan müziği hayalet kelimeleri tetikler. Tanıyıcı müzik yatağındaki vokalleri transkripsiyon yapmaya çalışır.
  3. 3SRT zaman damgaları sapıyor araç videoyu yolda yeniden kodladığında. 40. dakikada altyazılar bir saniye kapalıdır.

Burada ne çevrilecek

  1. 1Yükle — biz her ses akışını araştırırız ve hangisini transkribe etmek istediğinizi seçlemenizi sağlarız. Varsayılan en yüksek bitrate parçasıdır.
  2. 2Müzik bastırma iş formunda açın. Tanıyıcıyı konuşma VAD'sinde kapıyoruz, böylece enstrümantal bölümler boş kalır.
  3. 3Biz asla videoyu yeniden kodlamayız. Ses yerel örnekleme hızında çıkarılır, zaman damgaları konteynerın edit listesini referans alır — SRT çerçeve-kesin hizalanır.

MP4 için önerilen iş ayarları

MP4'ü bırakın ve bunlar varsayılan olarak açılır. İş başına formdan geçersiz kılın.

Ses çıkarma
Yerel örnekleme hızı, yeniden kodlama yok
Parça seçimi
En yüksek bitrate akışı
Diyarizasyon
Akustik · 1-6 konuşmacı
Müzik bastırma
Vlog/reklam ön ayarları için açık
SRT formatı
≤42 karakter/satır, 2 satır maks
Dışa aktarma
SRT · VTT · DOCX · zaman damgalı TXT

Accuracy · real-world numbers

Temiz bir çekimde %95. Ses direniş gösterdiğinde dürüst rakamlar.

MP4 doğruluğu kodek tarafından değil, mikrofon tarafından belirlenir. Sessiz bir sette bir lav mikrofonu her zaman 4K kamerayla dış sesi yenilir. Aşağıdaki rakamlar gerçek müşteri MP4'lerinden gelir, sesi ne yakalamasına göre sıralanır.

96%+
Stüdyo çekişi, lav veya shotgun mikrofon

Lapel veya boom bir kayıt cihazına, 48 kHz AAC 192+ kbps'de, muamele görmüş oda. Tavan durumu. Konuşmacı etiketleri iki kişilik bir çekimde mükemmel çalışır.

93%
DSLR kamera üzerine shotgun ile

Kamera üstü mikrofon konuşmacıdan 2-4 fit. Biraz oda tonu ama konuş anlaşılır. Çoğu YouTube yaratıcı cesetle buraya düşer.

89%
USB mikrofonla ekran kaydı

OBS, Loom, Camtasia dışa aktarımları. Mikrofon yakın ama oda işlenmemiş, genellikle sistem sesi sızıntısı ile. Öğretici transkriptleri için yeterince iyi.

84%
Telefonla çekilen vlog, dahili mikrofon

Yerleşik telefon mikrofonu, rüzgar veya tutma gürültüsü, mesafe çekimden çekime değişir. Sözcükler kullanılabilir, uygun isimleri düzeltmek için dakikada 1-2 bekleyin.

Yaygın sorular

8 şey insanlar soruyor. MP4 transkripsiyon hakkında

01Videomu yeniden kodluyorsunuz mu?+
Hayır. Ses akışını sadece MP4 konteynerinden okuyoruz. Video akışı hiçbir zaman dokunulmaz, asla yeniden kodlanmaz ve iş bittikten sonra hiçbir zaman depolanmaz — orijinal dosyasını değişmeden tutarsınız.
02MP4 içindeki hangi codec'ler desteklenir?+
Standart H.264 + AAC kolay durumdur. HEVC/H.265, ProRes-in-MP4 ve MP3, Opus, ALAC veya PCM'de sesi de yönetiyoruz. ffmpeg'in araştırabileceği her şeyi transkribe edebiliriz.
03Dosya boyutu sınırı nedir?+
Web yükleyicide yükleme başına 10 GB, yeniden başlatılabilir parçalar ile API üzerinden 50 GB. Tipik 1 saatlik 1080p MP4 1-3 GB'tır, bu nedenle çoğu dosya web yoluna sığar.
04SRT orijinal videomu ile hizalanacak mı?+
Evet — zaman damgaları MP4'ün edit listesini ve yerel örnekleme hızını referans alır. Yeniden kodlamıyoruz, bu nedenle kayma yok. SRT'yi MP4'ün yanına herhangi bir oynatıcıda veya NLE'de bırakın ve altyazılar ilk yüklemede eşitleenir.
05Altyazıları videoyu yakmasını sağlayabilir miyim?+
Tarafımızda değil — SRT'yi çıkarırız ve yakma işlemini editörünüze bırakırız. ffmpeg one-liner, HandBrake, Premiere, DaVinci, Kapwing hepsi ürettiğimiz SRT'yi kabul eder. Kodlama aracı olmak istemiyoruz.
06MOV, MKV, M4V, WebM hakkında ne?+
Hepsi aynı ardışık düzen ile desteklenir. MOV özellikle — aynı MPEG-4 ailesi, özdeş çıkarma yolu. Çok parçalı sese sahip MKV, çok parçalı MP4 ile aynı akış seçer arayüzü alır.
07Sadece bir YouTube veya Vimeo URL'si gönderebilir miyim?+
YouTube için evet — yükleme ekranında public URL yapıştırın ve biz sesi doğrudan getiririz, MP4 indirilmesine gerek yok. Vimeo, oynatıcısı akışı kapıladığı için doğrudan dosya veya imzalı bir indirme bağlantısı gerektirir.
08Konuşma diyalogu yoksa, sadece müzik veya B-roll varsa?+
VAD sessiz ve müzik gibi bölümleri algılar ve atlar, bu nedenle ortam görüntüleri için ödeme yapmazsınız. Transkript bu aralıkları `[müzik]` veya `[konuşma yok]` olarak işaretler, sözcük icat etmek yerine.

MP4'nüzü bırakın. Transkripti ve SRT'yi geri alın.

Ayda 30 ücretsiz dakika. Kart yok. Ses sunucu tarafında çıkarılır, konuşmacı etiketleri, çerçeve-kesin SRT — hepsi dahil.

Ücretsiz başla