Transcribe ficheiros de audio ata 10 horas — audio longo a texto, sen timeout

Transcribe ficheiros de audio longos.Ata 10 horas. Sen timeout.

Solta un ficheiro de audio longo — ata 10 horas, 5 GB en Business. Segmentamos en paralelo, mantemos os IDs de parlante consistentes de extremo a extremo e devolveches un transcripto en lugar dunha carpeta numerada.

Solta o teu audio ou vídeo

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Grava directamente desde o navegador

O rexistro lévache 30 segundos — a gravaciónel.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTOs ficheiros bórranse en 24 h

Horas dentro. Un ficheiro limpo fóra.

A maioría de ferramentas caduca arredor dos 90 minutos ou divide o teu gravación longa en parciais numeradas que tes que unir. Segmentamos en ventás sobrepostas de 12 minutos, procesamos en paralelo e reensamblamos cun paso de parlante global.

Sesión de estratexia de directivaREC 3 parlantes · 5:14:22 · 3.1 GB

en-GB detectado automaticamente44.1 kHz estéreo · 192 kbps

~90s

Transcripto · ficheiro único92% precisión · t=3:14:08

Levamos tres horas — volvamos á cuestión da cadea de subministración da sesión da mañá.

Certo, o xiro de fabricación en Vietnam. Creo que pasamos por alto o risco dos prazos de entrega.

Os prazos de entrega pasaron de 14 a 31 días despois da mudanza de aranceles.

E iso antes de contar a congestión portuaria en Long Beach.

92% en todo o ficheiro de 5hDOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Resumo 5Transcrición 1,420Interlocutores 2Exportacións

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Tese principais

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Tarefas

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

Limita ficheiros longos a 4 horas por gravación. As etiquetas de parlante quedan irregulares despois dos 2 minutos.

Duración máxima do ficheiro4 horas (nivel Pro)

Tamaño máximo do ficheiro~1.5 GB carga

IDs de parlante de extremo a extremoQuedan irregulares despois de 2 horas

Saída de ficheiro longoDocumento único, truncado no límite

Custo$16.99/usuario/mes

Carga reanudableNon

Best forReunións curtas de menos de 2 horas. Falla en gravacións de día completo.

Option 02

Transcription.Solutions

10 horas por ficheiro. Segmentación en paralelo, paso de parlante global, un DOCX de saída.

Duración máxima do ficheiro10 horas (Pro e Business)

Tamaño máximo do ficheiro2 GB Pro · 5 GB Business

IDs de parlante de extremo a extremoPaso de incorporación global

Saída de ficheiro longoFicheiro único · DOCX/SRT/TXT

Custo · por minuto$0.03 plano independentemente da duración

Carga reanudableMultiparte, resiste caídas

Best forTalleres de día completo, deposicións, reunións de directiva, historias orais — calquera cousa máis alá da barreira dos 90 minutos.

Option 03

Whisper API + segmentación manual

Máis barato por minuto. Ti constrúes o segmentador, a unión de parlantes e a lóxica de reintentos.

Duración máxima do ficheiro25 MB por solicitude (~25 min)

Tamaño máximo do ficheiroLímite fixo de 25 MB

IDs de parlante de extremo a extremoNingún — sen diarización

Saída de ficheiro longoParciais numeradas, ti unes

Custo · por minuto$0.006 (OpenAI Whisper)

Tempo de enxeñaríaHoras a días por pipeline

Best forEnxeñeiros que queren texto en bruto por fragmento e non precisan parlantes, resumos ou unha única saída.

Os precios e límites son precisos a partir de maio de 2026. O límite de duración de Otter Pro verificouse por última vez na súa páxina de prezo público.

O 92% mantense nas 5 horas. A calidade non varía hora a hora.

O difícil coa audio longa non é o modelo — é manter a precisión plana desde o minuto 1 ata o minuto 600. A desviaciónn de parlante e os erros de límite de fragmento son o que matan a maioría de pipelines. Os números seguintes mídense en ficheiros de clientes de duración completa, non só nos primeiros 10 minutos.

8 cousas que a xente pregunta sobre a transcripción de audio longo.

01Cal é o límite real de duración e tamaño do ficheiro?+

10 horas por ficheiro en Pro e Business. Pro limita o tamaño do ficheiro a 2 GB, Business a 5 GB. Se tes algo máis longo de 10 horas, divídeo dunha vez nun descanso natural — manteremos os IDs de parlante consistentes se os cargas de volta a trás no mesmo proxecto.

02Obteño un transcripto ou unha carpeta de parciais numeradas?+

Un ficheiro. Sempre. DOCX, SRT, TXT ou JSON — a túa opción. As marcas temporais corren continuamente desde 00:00:00 ata o final da gravación, non se restablecen en cada límite de fragmento.

03Canto tarda un ficheiro de 6 horas en volver?+

Aproximadamente 18-25 minutos na cola de Pro, 8-12 en prioridade de Business. Procesamos os fragmentos de 12 minutos en paralelo, así que o tempo de reloxo escálase sublinealmente coa duración do ficheiro, non minuto a minuto.

04Os IDs de parlante permanecen consistentes de extremo a extremo?+

Si. Despois da diarización por fragmento, un paso de incorporación global agrupa voces en todo o ficheiro. O parlante 3 no minuto 12 é o mesmo parlante 3 no minuto 487. Isto é o principal que os pipelines manuais con Whisper fan mal.

05Que ocorre se a miña carga cae na hora 3 dun ficheiro de 4 GB?+

A carga multiparte reanudable recupérase a partir da última parte completada. Non recarga os primeiros 3 GB. Funciona en Wi-Fi de hotel inestable e tethering por redes móbiles — probamos ambas.

06Por que Whisper API afoguea con ficheiros longos?+

O punto final Whisper de OpenAI ten un límite fixo de 25 MB por solicitude — aproximadamente 25 minutos de audio comprimido. Calquera cousa máis longa necesita que fragmentes, transcribas en paralelo e despois unas transcripcións e alinear parlantes ti mesmo. Facemos todo iso no servidor.

07O prezo por minuto é o mesmo nun ficheiro de 10 horas que nun ficheiro de 10 minutos?+

Si. $0.03 por minuto plano, independentemente da duración. Un ficheiro de 10 horas custa $18. Non cobramos de máis ficheiros longos do xeito que Rev fai ($1.50/min humano × 10 horas = $900).

08Podo obter marcadores de capítulo ou marcas temporais cada hora?+

Activa 'Marcadores de hora' no formulario de traballo e o DOCX exporta coa parada de encabezamento cada 60 minutos. SRT mantén código de tempo continuo. JSON ten ambos — matriz de capítulo máis marcas temporais de nivel de palabra.

Transcribe ficheiros de audio longos.Ata 10 horas. Sen timeout.

Solta o teu audio ou vídeo

Paste a link, we’ll fetch the audio

Grava directamente desde o navegador

Horas dentro. Un ficheiro limpo fóra.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro. Segmentación manual con Whisper. Ou nós.

Otter Pro

Transcription.Solutions

Whisper API + segmentación manual

Tres formas nas que as ferramentas xenéricas morren máis alá dos 90 minutos.

O que sae mal

O que inverter aquí

Configuración de traballo recomendada para ficheiros longos

O 92% mantense nas 5 horas. A calidade non varía hora a hora.

8 cousas que a xente pregunta sobre a transcripción de audio longo.

Solta o teu ficheiro longo. Obtén un transcripto de volta.