MP4 a text — converteix MP4 a text o transcriu vídeo MP4 amb etiquetes d'orador

Transcriu vídeo MP4 a text.Àudio extret automàticament.

Deixa l'arxiu MP4 tal qual — extraiem la pista d'àudio al servidor, retornem una transcripció amb marques de temps, i enviem un SRT que importa directament a YouTube, Vimeo o al teu NLE.

Deixa-hi l'àudio o el vídeo

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Grava directament des del navegador

El registre triga 30 segons — la gravació s'obre just després, al dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTEls fitxers s'esborren en 24 h

MP4 dins. Transcripció + SRT enfora.

MP4 és un contenidor — llegim el flux d'àudio directament, mai no recodifiquem el vídeo. Els marcs de temps es mantenen precisos al teu cronograma original, així que l'SRT s'alinea en la primera importació.

training-module-04.mp4REC 1080p · 22:14 · 412 MB

auto-detected en-USAAC 48 kHz stereo · 192 kbps

~90s

Transcripció · streaming95% de precisió

Bé, en aquest mòdul repassem el flux de reemborsos de principi a fi.

Una ràpida pregunta abans de començar — això també s'aplica als reemborsos parcials?

Bona observació. Els parcials usen la mateixa pantalla però un codi de raó diferent.

D'acord. I el llindar d'aprovació segueix sent dos-cents dòlars?

95% en diàleg netSRT · VTT · DOCX · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Resum 5Transcripció 1,420Veus 2Exportacions

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Punts clau

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Tasques a fer

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

ffmpeg + Whisper

Gratuït, local, complicat. Tu duenyos del pipeline i de cada bug que té.

RequereixCLI + model de 10 GB + GPU

Diarització d'oradorEina separada (pyannote)

Sortida SRTSí, senyalador manual

Temps en un MP4 d'1 hora20–90 min en CPU

Àudio multi-pistaTu trieu el flux

Cost$0 + el teu maquinari

Best forEnginyers que ja executen Whisper localment i no els importa afegir diarització.

Option 02

Transcription.Solutions

Deixa l'MP4. Extracció d'àudio, diarització, SRT, resum — una sola passada.

RequereixNavegador, això és tot

Diarització d'oradorIntegrada, cada feina

Sortida SRTAlineada fotograma per fotograma amb la font

Temps en un MP4 d'1 hora~4 min, en directe

Àudio multi-pistaLlistem tots els fluxos

Cost · per min$0.03

Best forQualsevol que tingui un MP4 i vulgui el text i SRT sense aprendre un editor de vídeo o un CLI.

Option 03

Descript / VEED

Carrega l'MP4 a l'editor. La transcripció apareix com a part de la UI de cronograma.

RequereixCompte + corba d'aprenentatge de l'editor

Diarització d'oradorSí, acoratjat per EN

Sortida SRTEsportació limitada pel pla

Límit de càrrega5 GB (Descript gratuït)

Àudio multi-pistaNomés la primera pista

Cost$12–24/usuari/mes

Best forEditors que volen tallar el vídeo i la transcripció en la mateixa eina.

Els preus i els límits de funcions són aproximats a data de 2026. Els noms de nivells de Descript i VEED canvien freqüentment — consulta el seu lloc per als límits actuals.

8 coses que la gent pregunta sobre la transcripció d'MP4.

01Recodificació del vídeo?+

No. Només llegim el flux d'àudio fora del contenidor MP4. El flux de vídeo mai es toca, mai es recodifica i mai s'emmagatzema després que acabi la feina — tu guardas l'arxiu original sense canvis.

02Quins còdecs dins de l'MP4 són compatibles?+

H.264 + AAC estàndard és el cas fàcil. Tambémanegem HEVC/H.265, ProRes-in-MP4 i àudio en MP3, Opus, ALAC o PCM. Si ffmpeg pot sondejar-lo, podem transcriure'l.

03Quin és el límit de mida de l'arxiu?+

10 GB per pujada en el pujador web, 50 GB via l'API amb blocs reanudables. Un MP4 típic d'1 hora 1080p és 1-3 GB, així que la majoria d'arxius caben a la ruta web sense pensar-hi.

04L'SRT s'alinearà amb el meu vídeo original?+

Sí — els marcs de temps fan referència a la llista d'edició i la freqüència de mostreig nativa de l'MP4. No recodifiquem, així que no hi ha desfase. Deixa l'SRT al costat de l'MP4 a qualsevol reproductor o NLE i els subtítols se sincronitzen en la primera càrrega.

05Puc gravar els subtítols amb el vídeo?+

No per part nostra — extraiem l'SRT i deixem la gravació al teu editor. ffmpeg one-liner, HandBrake, Premiere, DaVinci, Kapwing accepten tots els SRT que produïm. No volem ser l'eina de codificació tampoc.

06Sobre MOV, MKV, M4V, WebM?+

Tots compatibles a través del mateix pipeline. MOV especialment — mateixa família MPEG-4, ruta d'extracció idèntica. MKV amb múltiples pistes d'àudio obté la mateixa UI de selecció de flux que un MP4 multi-pista.

07Puc enviar una URL de YouTube o Vimeo?+

Sí per a YouTube — enganxa una URL pública a la pantalla de pujada i extraiem l'àudio directament, sense necessitat de descarregar MP4. Vimeo requereix un arxiu directe o un enllaç de descàrrega signat perquè el seu reproductor controla el flux.

08Que passa si no hi ha diàleg parlat, només música o B-roll?+

VAD detecta seccions silencioses i només música i les salta, així que no pagues per a metratge ambiental. La transcripció marca aquests rangs com a `[music]` o `[no speech]` en lloc d'inventar paraules.

Transcriu vídeo MP4 a text.Àudio extret automàticament.

Deixa-hi l'àudio o el vídeo

Paste a link, we’ll fetch the audio

Grava directament des del navegador

MP4 dins. Transcripció + SRT enfora.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Fes-ho tu amb ffmpeg. Un editor de vídeo. O nosaltres.

ffmpeg + Whisper

Transcription.Solutions

Descript / VEED

Tres coses que causen problemes amb les eines de transcripció genèriques.

On cau l'error

Què canviar aquí

Configuració de feina recomanada per a MP4

95% en una gravació neta. Nombres honestos quan l'àudio s'oposa.

8 coses que la gent pregunta sobre la transcripció d'MP4.

Deixa l'MP4. Obté la transcripció i l'SRT.