ffmpeg + Whisper
Libre, lokal, kumplikado. Ikaw ang hawak ng pipeline at bawat bug nito.
I-drop lang ang MP4 file tulad na — kuhain namin ang audio track server-side, ibalik ang timestamped transcript, at ipadala ang SRT na direktang umakyat sa YouTube, Vimeo, o sa iyong NLE.
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ Tingnan kung ano ang lalabas
Ang MP4 ay container — binabasa namin ang audio stream nang direkta, hindi na-re-encode ang video. Ang timestamps ay natitira na frame-accurate sa iyong original timeline, kaya ang SRT ay umakyat sa unang import.
Alright, sa module na ito titingin tayo sa refund workflow end-to-end.
Mabilis na tanong bago tayo magsimula — applicable na din ito sa partial refunds?
Maganda catch. Ang partials ay gumagamit ng same screen pero iba reason code.
Got it. At ang approval threshold ay dalawampung piso pa rin ba?
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
Tatlong tunay na opsyon · tapat na comparison
Pwede mong extrahin ang audio mo sarili at i-run ang Whisper. Pwede mong i-drag ang MP4 sa Descript o VEED at manatili sa kanilang editor. O pwede mong i-drop ang file dito at makakuha ng transcript + SRT, walang editor lock-in.
Libre, lokal, kumplikado. Ikaw ang hawak ng pipeline at bawat bug nito.
I-drop ang MP4. Audio extraction, diarization, SRT, summary — isang pass lang.
I-load ang MP4 sa editor. Ang transcript ay lilitaw bilang bahagi ng timeline UI.
Ang pricing at feature caps ay approximate bilang 2026. Ang Descript at VEED tier names ay madalas nagbabago — tingnan ang kanilang site para sa current limits.
Specific sa MP4
Ang MP4 ay container, hindi codec — at karamihan ng transcription tools ay tinatrato ito na isang malaking audio blob. Doon nanggagaling ang mga misses.
I-drop ang MP4 at ang mga ito ay naka-flip na by default. Override per-job mula sa form.
Accuracy · real-world numbers
Ang MP4 accuracy ay itinakda ng mic, hindi ng codec. Ang lav mic sa quiet set ay laging nanalo sa 4K camera na may on-board audio. Ang numbers sa baba ay galing sa tunay na customer MP4s, inayos ayon sa ano ang kumukuha ng audio.
Lapel o boom papunta sa recorder, 48 kHz AAC sa 192+ kbps, treated room. Ang pinakamataas na case. Ang speaker labels ay nakukuha ito sa two-person shoot.
Camera-top mic 2-4 piye mula sa speaker. May room tone pero ang salita ay maintindihan. Karamihan ng YouTube creator footage ay nandito.
OBS, Loom, Camtasia exports. Ang mic ay malapit pero ang room ay untreated, madalas may system audio bleed. Maganda na para sa tutorial transcripts.
Built-in phone mic, hangin o handling noise, distansya ay iba-iba. Ang mga salita ay magagamit, asahan 1-2 fixes per minuto sa proper nouns.
Mga karaniwang tanong
30 minuto libre bawat buwan. Walang card. Ang audio ay hinahiwalay server-side, speaker labels, frame-accurate SRT — lahat kasama.
Magsimula ng libre