Transkriptu MP4-videon al teksto.Sono ekstraktas aŭtomate.

Malŝutu la MP4-dosieron kiel estas — ni ekstraktas la aŭdio-trako ĉe la servilo, resendas tempmarkitan transkription, kaj liveras SRT-dosieron uza rekten kun YouTube, Vimeo, aŭ via NLE.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Vidu, kion vi akiros

MP4 ene. Transskribo + SRT fore.

MP4 estas ujo — ni legas la aŭdio-fluo rekte, neniam re-kodigos la videon. Tempmarkoj restas kadro-precizaj al via origina tempolinio, do la SRT jaro akordas ĉe unua importo.

training-module-04.mp4REC 1080p · 22:14 · 412 MB
aŭtodetektita en-USAAC 48 kHz stere · 192 kbps
~90s
Transskribo · fluanta95% precizeco
S1

Bone, en ĉi tiu modulo ni trairas la refunditan fluo de fino al fino.

S2

Rapiddemando antaŭ ni komencas — ĉu tio validas por parta refundado?

S1

Bona kapto. Partoj uzas la saman ekranon sed alia kialo-kodo.

S2

Komprenite. Kaj la aprobo-limo estas ankoraŭ ducent dolaroj?

95% pri klara dialogoSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tri veraj ebloj · honesta komparo

DIY kun ffmpeg. Video-redaktilo. Aŭ ni.

Vi povas ekstrakti la sonan mem kaj ruli Whisper. Vi povas treni la MP4 en Descript aŭ VEED kaj resti en ilia redaktilo. Aŭ vi povas malŝuti la dosieron ĉi tie kaj akiri la transkription + SRT, nenia redaktila ligiteco.

Option 01

ffmpeg + Whisper

Libera, loka, malfacila. Vi posedas la dukton kaj ĉiun eraron en ĝi.

PostulasCLI + 10 GB modelon + GPU
Parolanta diarizoApartan ilon (pyannote)
SRT-elportadoJes, mana flago
Tempo ĉe 1-horo MP420–90 min ĉe CPU
Multi-traka sonoVi elektas la fluo
Kosto$0 + via ĉapelo
Best forInĝenieroj, kiuj jam rulas Whisper loke kaj ne malaprobas glutadon de diarizo.
Option 02

Transcription.Solutions

Malŝutu la MP4. Sono-ekstrakto, diarizo, SRT, resumo — unu paŝo.

PostulasFoliumilo, jen ĉio
Parolanta diarizoKonstruita, ĉiuj laboj
SRT-elportadoKadro-jaro al fonto
Tempo ĉe 1-horo MP4~4 min, fluanta
Multi-traka sonoNi lisas ĉiujn fluidojn
Kosto · po minuto$0.03
Best forIu ajn kun MP4, kiu volas la tekston kaj SRT sen lerni video-redikilon aŭ CLI.
Option 03

Descript / VEED

Ŝarĝu MP4 en la redikilon. Transskribo aperas kiel parto de la tempolinia ŭzanto-interfaco.

PostulasKonto + redaktila lernkurbo
Parolanta diarizoJes, EN-sintona
SRT-elportadoElportado-ĝuata de plano
Ŝarĝa ĉapo5 GB (Descript libera)
Multi-traka sonoUnua trako sole
Kosto$12–24/uzanto/mon
Best forRedaktoroj, kiuj volas tranĉi la videon kaj la transkription en la sama ilo.

Prezoj kaj karakteraj limoj proksimaj je 2026. Descript kaj VEED nomatabloj ŝanĝiĝas ofte — kontrolu ilian reton por aktualaj limoj.

Specifa al MP4

Tri aferoj, kiuj morgas homojn ĉe neŭnuformaj transkriptaj iloj.

MP4 estas ujo, ne kodigo — kaj plej da transkriptaj iloj traktas ĝin kiel unu granda aŭdio-blobο. Jen kie la fumaĵo venas.

Kio iromalprave

  1. 1Multi-traka MP4 kun boomo + lavo. Neŭnuformaj iloj kaptas trako 1 kaj ignoras la reston, do vi perdas la pli klaran mikrofonon. Ofta ĉe FCP kaj Premiere-elportadoj.
  2. 2Fona muziko en vlogoj kaj reklamoj ekcigas fantoman vortojn. La rekona algoritmo provas transkripti la voĉojn sur la muzika ĉapo.
  3. 3SRT-tempmarkoj driftas kiam la ilo re-kodigas la videon je la eniro. Antaŭ minuto 40 la titoloj estas sekundo malĝusta.

Kion ĝiri ĉi-tie

  1. 1Malŝutu — ni sondas ĉiujn aŭdio-fluidojn kaj lasas vin elekti, kiun transkripti. Defaŭlto estas la plej-alta-rapideca trako.
  2. 2Ŝaltu Muzika premso ĉe la laborformo. Ni pordego la rekoniston sur parolada VAD do instrumentaj sekcioj restas malplenaj.
  3. 3Ni neniam re-kodigas videon. Sono ekstraktas ĉe indiĝena specaro, tempmarkoj referencas la ujo-redakto-liston — SRT jaro akordas kadro-precize.

Rekomendata laboraj agordoj por MP4

Malŝutu MP4 kaj tiuj ŝaltas per defaŭlto. Transpago po-laboro el la formo.

Sono-ekstrakto
Indiĝena specaro, nenia re-kodigo
Traka elekto
Plej-alta-rapideca fluo
Diarizo
Akustika · 1-6 parolantoj
Muzika premso
Por vlogo-/reklamaro-antaŭagordoj
SRT-formato
≤42 signo/vico, 2 vicoj maks
Elportado
SRT · VTT · DOCX · tempmarkita TXT

Accuracy · real-world numbers

95% ĉe klara ŝoto. Honestaj nombroj kiam la sono rezistas.

MP4-precizeco estas fiksita de la mikrofono, ne la kodigo. Lava mikrofono ĉe trankvila ĉapelo venas preter 4K-kamerao kun surtabla sona sistemo ĉe ĉiuj okazoj. Nombroj ĉi-sube venas el veraj kliento-MP4oj, ordigitaj per tio, kio kaptis la sonan.

96%+
Studiolecaj ŝoto, lava aŭ pafarko-mikrofono

Frazo aŭ boomo al registrar, 48 kHz AAC ĉe 192+ kbps, traktita ĉambro. La ĉapela kazo. Parolanta etikedoj frapis al ĝi sur du-persona ŝoto.

93%
DSLR kun surtabla pafarko-mikrofono

Kamera-supra mikrofono 2-4 futoj de parolanto. Iu ĉambra sono sed parolado estas klara. Plej da YouTube-kreistra dosiero alanĝas ĉi tie.

89%
Ekrana registrado kun USB-mikrofono

OBS, Loom, Camtasia-elportadoj. Mikrofono estas proksima sed ĉambro estas netraktita, ofte kun sistema sono-stifo. Sufiĉe bona je tuto-transkriptoj.

84%
Telefon-ŝotita vlogo, interna mikrofono

Konstruita telefona mikrofono, vento aŭ manutena bruo, distanco varias per ŝoto. Vortoj uzeblaj, atendi 1-2 ĝusigojn po minuto ĉe ĝustaj nomoj.

Oftaj demandoj

8 aferoj, kiujn demandas pri MP4-transkriptado.

01Ĉu vi re-kodigas mian videon?+
Ne. Ni nur legas la aŭdio-fluo el la MP4-ujo. La video-fluo neniam estas tuŝita, neniam re-kodigita, kaj neniam stokita post la laboro finiĝas — vi retenas vian originan dosieron neŝanĝita.
02Kiujn kodigojn en la MP4 oni subtenas?+
Norma H.264 + AAC estas la facila kazo. Ni ankaŭ kontrolas HEVC/H.265, ProRes-en-MP4, kaj sonan en MP3, Opus, ALAC, aŭ PCM. Se ffmpeg povas sonde ĝin, ni povas transkripti ĝin.
03Kio estas la dosiera granda ĉapo?+
10 GB po alŝuto ĉe la tela alŝutilo, 50 GB per la API kun reŝarĝeblaj blokoj. Tipa 1-horo 1080p MP4 estas 1-3 GB do plej da dosieroj tajpas la tela padon sen penso.
04Ĉu la SRT jaro akordos kun mia origina video?+
Jes — tempmarkoj referencas la MP4-redakto-liston kaj indiĝena specaro. Ni ne re-kodigas, do nenia drifto. Malŝutu la SRT apud la MP4 en iu ajn ludilo aŭ NLE kaj naslino sinkroniĝas ĉe unua ŝargo.
05Ĉu mi povas bruli la subtitolojn en la videon?+
Ne ĉe nia flanko — ni elportas la SRT kaj lasas la bruladon al via redaktilo. ffmpeg-unulinio, HandBrake, Premiere, DaVinci, Kapwing ĉiuj akceptas la SRT, kiun ni produktas. Ni ne volas esti la kodiga ilo ankaŭ.
06Kio pri MOV, MKV, M4V, WebM?+
Ĉiuj subtenas per la sama dukto. MOV speciale — sama MPEG-4-familio, identa ekstrakta padon. MKV kun multi-traka sono akiras la saman fluo-elektiston ŭzanton-interfacon kiel multi-traka MP4.
07Ĉu mi povas simple sendi YouTube aŭ Vimeo URL?+
Jes por YouTube — algluu publikan URL-on ĉe la alŝuta ekrano kaj ni eltiras la sonan rekte, nenia MP4-elŝuto necesa. Vimeo postulas rekte dosieron aŭ subskribitan elŝuta ligilton ĉar ilia ludilo pordego la fluo.
08Kio se estas nenia parolita dialogo, sole muziko aŭ B-rolaĵo?+
VAD detektas malplenan kaj sole-muzikan sekciojn kaj omesas ilin, do vi ne pagas por ampleksa dosieroto. La transskribo markas tiujn ĉamparojn kiel `[muziko]` aŭ `[nenia parolado]` anstataŭ invento de vortoj.

Malŝutu vian MP4. Akiru la transkription kaj SRT reen.

30 liberaj minutoj ĉiumonate. Nenia karto. Sono ekstraktas ĉe servilo, parolanta etikedoj, kadro-preciza SRT — ĉio inkludita.

Komenci libere