Transcripción para podcasters.Notas del episodio y SRT en un solo paso.

Sube tu episodio de podcast maestro — MP3, WAV o un enlace de YouTube. Obtén una transcripción con etiquetas de hablante, notas del episodio generadas por IA con puntos clave y etiquetas, más un SRT para el corte del video.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Un archivo dentro, cuatro artefactos fuera

Archivo maestro dentro. Transcripción, notas del episodio, SRT, etiquetas fuera.

La mayoría de los podcasts llegan como un MP3 estéreo de post-producción con el anfitrión e invitado ya mezclados. Los separamos acústicamente, detectamos la intro musical e iniciamos la transcripción en la primera palabra hablada.

Episodio 142 maestroREC 2 hablantes · 48:21 · MP3 192 kbps
detectado automáticamente en-US44.1 kHz estéreo · post-mix
~90s
Transcripción · streaming95% de precisión
S1

Bienvenidos de nuevo al show. Hoy estoy hablando con Priya Anand sobre su nuevo libro sobre cadenas de suministro.

S2

Gracias por invitarme, Jordan. Han sido tres años intensos desde la última vez que hablamos.

S1

Entonces el libro comienza con el bloqueo de Suez — ¿por qué comenzar ahí?

S2

Porque fue el momento en que todos los que no son de logística de repente se interesaron en los contenedores.

95% en estéreo post-mixSRT · DOCX · TXT · Notas del episodio MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Descript. Castmagic. O nosotros.

Descript es un editor en primer lugar, transcripción en segundo. Castmagic son notas del episodio primero, transcripción segundo. Nos enfocamos en el pipeline archivo → transcripción → notas del episodio y nos mantenemos fuera de tu editor.

Option 01

Descript

Editor de audio con transcripción integrada. Excelente para flujos de trabajo de edición por texto, más pesado de lo que necesitas si solo quieres una transcripción.

Uso principalDAW + edición de palabras
Diarización de hablantesAcústica, EN-fuerte
Notas del episodioComplemento de IA Underlord
ExportaciónSRT · TXT · archivo de proyecto
Plan gratis1 hora/mes de transcripción
Costo$24/usuario/mes (Creator)
Best forPodcasters en solitario que editan episodios eliminando palabras de una transcripción y quieren una app para todo.
Option 02

Transcription.Solutions

Sube el archivo maestro del episodio. Transcripción, notas del episodio, etiquetas, SRT — los cuatro de una sola vez. Sin editor, sin bloqueo.

Uso principalTranscripción + notas del episodio
Diarización de hablantesAcústica + carga por pista
Notas del episodioGratis en todos los planes
ExportaciónSRT · VTT · DOCX · MD · JSON
Plan gratis30 min/mes, sin tarjeta
Costo · por min$0.03
Best forShows que ya tienen un editor (Logic, Hindenburg, Reaper) y solo quieren texto limpio + notas después de que se mezcle el episodio.
Option 03

Castmagic

Notas-del-episodio-como-servicio. Arrastra el archivo, obtén un paquete de contenido elegante. La transcripción es más un subproducto.

Uso principalRepropósito de contenido
Diarización de hablantesSí, ajustada a EN
Notas del episodioMuchas plantillas, solo de pago
ExportaciónSRT · TXT · MD de plantilla
Plan gratisSolo prueba
Costo~$23+/mes (Starter)
Best forShows orientados al marketing que necesitan 12 posts de redes sociales, 4 borradores de newsletter y un carrusel de LinkedIn por episodio.

Precios aproximados a partir de 2026 y cambian según el proveedor. Los planes gratis y características de IA adicional rotan frecuentemente.

Específico para podcasting

Tres cosas que causan problemas a los podcasters con herramientas de transcripción genéricas.

Cuéntanos algunos detalles sobre el episodio al subir y el resultado deja de necesitar una pasada de limpieza.

Qué sale mal

  1. 1Intro musical transcrito como ruido. El reconocedor intenta leer letras o patrones de zumbidos e inserta disparates como 'la la na' en los primeros 30 segundos.
  2. 2Nombre del invitado deletreado fonéticamente. 'Priya Anand' sale como 'Pria Anan' o 'Prea Ahnand' — y está mal cada vez que aparece.
  3. 3Risa y superposición de palabras se representan como palabras relleno o se atribuyen al hablante equivocado, especialmente durante intercambios energéticos.

Qué ajustar aquí

  1. 1Activa Omitir intro/outro musical en el formulario de trabajo. Detectamos segmentos sin habla e iniciamos la transcripción en la primera palabra hablada — los desplazamientos de tiempo se ajustan automáticamente.
  2. 2Pega el nombre del invitado y menciones de marca en Vocabulario personalizado. Lo pasamos como una sugerencia al reconocedor, para que la ortografía se mantenga consistente en todo el episodio.
  3. 3Activa Notas del episodio para obtener un resumen de 2-4 oraciones, 3-7 puntos clave, elementos de acción y 3-8 etiquetas de tema renderizadas en markdown — pega directamente en tu CMS.

Configuraciones recomendadas de trabajo para podcasts

Sube un episodio y estas configuraciones predeterminadas se activan. Anula por trabajo desde el formulario.

Diarización
División estéreo si 2 hablantes
Detección de música
Omitir segmentos de intro/outro
Palabras relleno
Removidas por defecto
Notas del episodio
Resumen + puntos clave + etiquetas
Capítulos
Generados a partir de puntos clave
Exportación
SRT · DOCX · notas del episodio MD

Accuracy · real-world numbers

97% en episodios grabados con micrófono de estudio. También funciona bien en llamadas con invitados remotos.

La precisión del podcast depende principalmente de cómo se grabó al invitado, no del anfitrión. Un anfitrión de estudio emparejado con un invitado solo de Zoom se comporta como la peor opción. Los números de abajo provienen de episodios reales de clientes, no de audio de laboratorio.

97%
Carga por pista (Riverside / SquadCast)

Cada hablante en un WAV separado. Tratamos cada pista de forma independiente y omitimos la diarización. El caso más limpio posible.

95%
Estéreo post-mix, 2 hablantes

Anfitrión izquierda, invitado derecha, después del mastering. La forma más común de podcast. La diarización es esencialmente gratis por la división estéreo.

91%
Mezcla mono, 3-4 hablantes

Shows de mesa redonda o formato de panel mezclados a mono. Voces similares pueden fusionarse una o dos veces por hora — una pasada de limpieza de 2 minutos lo arregla.

86%
Invitado remoto en llamada / micrófono pobre

Invitado en AirPods a través de una llamada por wifi de hotel. Los números y nombres propios sufren más. El vocabulario personalizado recupera la mayoría.

Preguntas comunes

8 cosas que la gente pregunta sobre transcripción de podcasts.

01¿Puedo simplemente pegar mi enlace de YouTube o SoundCloud?+
Sí. Pega una URL pública de YouTube o un enlace de episodio alojado (SoundCloud, Buzzsprout, Transistor, MP3 directo de Libsyn) y nosotros extraemos el audio. Para feeds privados, descarga el archivo y súbelo.
02¿Se transcribirá la intro musical como 'la la la' sin sentido?+
No si Omitir intro/outro musical está activado (está por defecto). Detectamos audio sin habla e iniciamos la transcripción en la primera palabra hablada. Los tiempos en el SRT se ajustan para que los subtítulos de YouTube sigan sincronizados.
03¿Qué contiene exactamente el archivo de notas del episodio?+
Un resumen del episodio de 2-4 oraciones, 3-7 puntos clave como una lista con viñetas, elementos de acción si se mencionaron, y 3-8 etiquetas de tema. Renderizado como markdown para que puedas pegar directamente en WordPress, Ghost, Substack o la página de episodios de tu host de podcasts.
04¿Pueden generar marcadores de capítulos para Apple Podcasts y Spotify?+
Sí — los capítulos se generan a partir de los puntos clave con tiempos. Exporta como un archivo chapters.txt separado o incrusta en WAV/M4A. Ten en cuenta que Spotify solo reconoce capítulos en shows alojados en Anchor, así que el archivo txt es tu respaldo.
05Tengo archivos por pista de Riverside / SquadCast — ¿debería subirlos?+
Sí, por favor. Sube el WAV de cada hablante por separado y etiquétalos con nombres. Transcribimos cada pista de forma independiente y fusionamos por tiempo. La precisión se sitúa alrededor del 97% en esta configuración — el caso más limpio que vemos.
06¿Puede marcar lecturas de patrocinadores o pausas publicitarias?+
Aún no automáticamente — está en el roadmap. Por ahora, coloca un marcador en tu edición (un silencio breve o un timbre) y lo mostraremos como un tiempo en la transcripción. También puedes etiquetar segmentos de anuncios encontrando el nombre de la marca del patrocinador después.
07¿Cuánto tiempo puede durar el episodio?+
Hasta 6 horas por archivo en una carga. La mayoría de los shows duran 30-90 minutos, que terminan en 4-8 minutos de tiempo real. Para un episodio de entrevista de 3 horas, espera aproximadamente 12-15 minutos desde la carga hasta que estén listos los cuatro artefactos.
08¿Reemplazará el SRT los subtítulos automáticos de YouTube de forma limpia?+
Sí. El SRT está dividido en líneas a ~42 caracteres con puntuación adecuada y prefijos de hablante opcionales. Súbelo en YouTube Studio → Subtítulos → Añadir idioma → SRT. Reemplaza completamente la pista de subtítulos generada automáticamente.

Sube tu episodio. Obtén la transcripción, notas y SRT.

30 minutos gratis cada mes. Sin tarjeta. Etiquetas de hablante, notas del episodio, capítulos y todos los formatos de exportación incluidos.

Comienza gratis