Otter Pro
Limita archivos largos a 4 horas por grabación. Las etiquetas de hablante se deslizan después de la marca de 2 horas.
Sube un archivo de audio largo — hasta 10 horas, 5 GB en Business. Dividimos en paralelo, mantenemos consistentes los IDs de hablante de principio a fin, y devolvemos un solo transcript en lugar de una carpeta numerada.
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ Un archivo de 5 horas, a mitad del transcript
La mayoría de herramientas expiran alrededor de los 90 minutos o dividen tu grabación larga en partes numeradas que tienes que unir. Dividimos en ventanas solapadas de 12 minutos, procesamos en paralelo, y reensamblamos con un paso global de hablante.
Tres horas dentro — volvamos al punto de la cadena de suministro de la sesión de la mañana.
Correcto, el giro de manufactura en Vietnam. Creo que pasamos rápido el riesgo de lead-time.
Los lead-times fueron de 14 a 31 días después del cambio arancelario.
Y eso es antes de que consideremos la congestión portuaria en Long Beach.
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
Tres opciones reales · comparación honesta
Las herramientas de consumo cierran la longitud de archivo y truncan silenciosamente. Whisper API tiene un techo de 25 MB por solicitud, así que tú construyes el divisor. Aceptamos todo el archivo de 10 horas y devolvemos un transcript.
Limita archivos largos a 4 horas por grabación. Las etiquetas de hablante se deslizan después de la marca de 2 horas.
10 horas por archivo. División en paralelo, paso global de hablante, un DOCX afuera.
Más barato por minuto. Tú construyes el divisor, la unión de hablantes, y la lógica de reintento.
Precios y límites precisos a partir de mayo de 2026. El límite de longitud de Otter Pro se verificó recientemente en su página de precios pública.
Específico para archivos largos
La mayoría de pipelines fueron construidos para reuniones de una hora. El audio largo los rompe de formas predecibles — aquí está cómo hacemos las cosas diferente.
Sube cualquier cosa mayor de 90 minutos y estos se activan automáticamente. Cambia por trabajo desde el formulario.
Accuracy · real-world numbers
La parte difícil con audio largo no es el modelo — es mantener la precisión plana del minuto 1 al minuto 600. El desplazamiento de hablante y errores de límite de fragmento son lo que mata la mayoría de pipelines. Los números de abajo se miden en archivos de clientes de longitud completa, no en los primeros 10 minutos.
Narración de audiolibro, podcast en solitario, manuscrito dictado. 6-10 horas de voz limpia sin ruido de sala. Sin diarización necesaria.
Mesa de conferencia, micrófono decente, 3-5 horas. El paso global de hablante mantiene los IDs estables en todo el archivo.
Día de capacitación de 7-9 horas con cambios de micrófono y preguntas de audiencia. Los nombres necesitan un paso de 5 minutos en los chips del hablante.
Historia oral larga, grupo focal, o panel con voces solapadas y ruido ambiental. Utilizable, pero espera limpieza.
Preguntas comunes
30 minutos gratis cada mes. Sin tarjeta. Archivos hasta 10 horas, etiquetas de hablante que se mantienen consistentes, exportación de archivo único.
Comenzar gratis