ffmpeg + Whisper
Libera, loka, malfacila. Vi posedas la dukton kaj ĉiun eraron en ĝi.
Malŝutu la MP4-dosieron kiel estas — ni ekstraktas la aŭdio-trako ĉe la servilo, resendas tempmarkitan transkription, kaj liveras SRT-dosieron uza rekten kun YouTube, Vimeo, aŭ via NLE.
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ Vidu, kion vi akiros
MP4 estas ujo — ni legas la aŭdio-fluo rekte, neniam re-kodigos la videon. Tempmarkoj restas kadro-precizaj al via origina tempolinio, do la SRT jaro akordas ĉe unua importo.
Bone, en ĉi tiu modulo ni trairas la refunditan fluo de fino al fino.
Rapiddemando antaŭ ni komencas — ĉu tio validas por parta refundado?
Bona kapto. Partoj uzas la saman ekranon sed alia kialo-kodo.
Komprenite. Kaj la aprobo-limo estas ankoraŭ ducent dolaroj?
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
Tri veraj ebloj · honesta komparo
Vi povas ekstrakti la sonan mem kaj ruli Whisper. Vi povas treni la MP4 en Descript aŭ VEED kaj resti en ilia redaktilo. Aŭ vi povas malŝuti la dosieron ĉi tie kaj akiri la transkription + SRT, nenia redaktila ligiteco.
Libera, loka, malfacila. Vi posedas la dukton kaj ĉiun eraron en ĝi.
Malŝutu la MP4. Sono-ekstrakto, diarizo, SRT, resumo — unu paŝo.
Ŝarĝu MP4 en la redikilon. Transskribo aperas kiel parto de la tempolinia ŭzanto-interfaco.
Prezoj kaj karakteraj limoj proksimaj je 2026. Descript kaj VEED nomatabloj ŝanĝiĝas ofte — kontrolu ilian reton por aktualaj limoj.
Specifa al MP4
MP4 estas ujo, ne kodigo — kaj plej da transkriptaj iloj traktas ĝin kiel unu granda aŭdio-blobο. Jen kie la fumaĵo venas.
Malŝutu MP4 kaj tiuj ŝaltas per defaŭlto. Transpago po-laboro el la formo.
Accuracy · real-world numbers
MP4-precizeco estas fiksita de la mikrofono, ne la kodigo. Lava mikrofono ĉe trankvila ĉapelo venas preter 4K-kamerao kun surtabla sona sistemo ĉe ĉiuj okazoj. Nombroj ĉi-sube venas el veraj kliento-MP4oj, ordigitaj per tio, kio kaptis la sonan.
Frazo aŭ boomo al registrar, 48 kHz AAC ĉe 192+ kbps, traktita ĉambro. La ĉapela kazo. Parolanta etikedoj frapis al ĝi sur du-persona ŝoto.
Kamera-supra mikrofono 2-4 futoj de parolanto. Iu ĉambra sono sed parolado estas klara. Plej da YouTube-kreistra dosiero alanĝas ĉi tie.
OBS, Loom, Camtasia-elportadoj. Mikrofono estas proksima sed ĉambro estas netraktita, ofte kun sistema sono-stifo. Sufiĉe bona je tuto-transkriptoj.
Konstruita telefona mikrofono, vento aŭ manutena bruo, distanco varias per ŝoto. Vortoj uzeblaj, atendi 1-2 ĝusigojn po minuto ĉe ĝustaj nomoj.
Oftaj demandoj
30 liberaj minutoj ĉiumonate. Nenia karto. Sono ekstraktas ĉe servilo, parolanta etikedoj, kadro-preciza SRT — ĉio inkludita.
Komenci libere