Transcripción para podcasters.Notas de episodio y SRT en un solo paso.

Suelta el archivo master de tu episodio de podcast — MP3, WAV, o un enlace de YouTube. Obtén una transcripción con etiquetas de locutor, notas de episodio generadas por IA con puntos clave y etiquetas, más un SRT para el corte de video.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Un archivo entra, cuatro artefactos salen

Archivo master del episodio dentro. Transcripción, notas, SRT, etiquetas fuera.

La mayoría de los podcasts llegan como un MP3 estéreo post-producción con host e invitado ya mezclados. Los separamos acústicamente, detectamos la intro de música, e iniciamos la transcripción en la primera palabra hablada.

Episodio 142 masterREC 2 locutores · 48:21 · MP3 192 kbps
en-US detectado automáticamente44.1 kHz estéreo · post-mezcla
~90s
Transcripción · en streamingPrecisión del 95%
S1

Bienvenido de vuelta al programa. Hoy estoy hablando con Priya Anand sobre su nuevo libro sobre cadenas de suministro.

S2

Gracias por tenerme, Jordan. Han sido unos tres años locos desde que hablamos por última vez.

S1

Entonces el libro abre con el bloqueo de Suez — ¿por qué empezar allí?

S2

Porque fue el momento en que todos los que no son logística de repente les importaron los contenedores.

95% en estéreo post-mezclaSRT · DOCX · TXT · Notas MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Descript. Castmagic. O nosotros.

Descript es un editor primero, transcripción segundo. Castmagic es notas de episodio primero, transcripción segundo. Nos enfocamos en el pipeline archivo → transcripción → notas de episodio y nos mantenemos fuera de tu editor.

Option 01

Descript

Editor de audio con transcripción integrada. Excelente para flujos de trabajo de edición por texto, más pesado de lo que necesitas si solo quieres una transcripción.

Uso principalDAW + edición por palabras
Diarización de locutorAcústica, EN-fuerte
Notas de episodioComplemento de IA Underlord
ExportaciónSRT · TXT · archivo de proyecto
Plan gratuito1 hora/mes transcripción
Costo$24/usuario/mes (Creator)
Best forPodcasters individuales que editan episodios eliminando palabras de una transcripción y quieren una app para todo.
Option 02

Transcription.Solutions

Suelta el archivo master del episodio. Transcripción, notas, etiquetas, SRT — los cuatro en un solo paso. Sin editor, sin dependencia.

Uso principalTranscripción + notas
Diarización de locutorAcústica + carga por pista
Notas de episodioGratis en todos los planes
ExportaciónSRT · VTT · DOCX · MD · JSON
Plan gratuito30 min/mes, sin tarjeta
Costo · por minuto$0.03
Best forProgramas que ya tienen un editor (Logic, Hindenburg, Reaper) y solo quieren texto limpio + notas después de que el episodio esté mezclado.
Option 03

Castmagic

Servicio de notas de episodio. Arrastra el archivo, obtén un paquete de contenido elegante. La transcripción es más un subproducto.

Uso principalReutilización de contenido
Diarización de locutorSí, ajustada para EN
Notas de episodioMuchas plantillas, solo de pago
ExportaciónSRT · TXT · plantilla MD
Plan gratuitoSolo prueba
Costo~$23+/mes (Starter)
Best forProgramas con mucho enfoque en marketing que necesitan 12 posts de redes sociales, 4 borradores de boletín, y un carrusel de LinkedIn por episodio.

Precios aproximados a partir de 2026 y cambian por vendedor. Los planes gratuitos y las características de IA complementarias rotan frecuentemente.

Específico para podcast

Tres cosas que afectan a los podcasters con herramientas de transcripción genéricas.

Cuéntanos un par de cosas sobre el episodio al cargarlo y la salida deja de necesitar una pasada de limpieza.

Qué sale mal

  1. 1Intro de música transcrita como sinsentidos. El reconocedor intenta leer letras o patrones de tarareo e inserta tonterías como 'la la na' en los primeros 30 segundos.
  2. 2Nombre del invitado deletreado fonéticamente. 'Priya Anand' sale 'Pria Anan' o 'Prea Ahnand' — y es incorrecto cada vez que aparece.
  3. 3Risas y cruces se renderizan como palabras de relleno o se atribuyen al locutor equivocado, especialmente durante intercambios energéticos.

Qué voltear aquí

  1. 1Activa Saltar intro/outro de música en el formulario de trabajo. Detectamos segmentos sin habla e iniciamos la transcripción en la primera palabra oída — los desplazamientos de marca de tiempo se ajustan automáticamente.
  2. 2Pega el nombre del invitado y menciones de la marca en Vocabulario personalizado. Lo pasamos como pista para el reconocedor, así que la ortografía se mantiene consistente en todo el episodio.
  3. 3Activa Notas de episodio para obtener un resumen de 2-4 oraciones, 3-7 puntos clave, elementos de acción, y 3-8 etiquetas de tema renderizadas en markdown — pega directamente en tu CMS.

Configuración de trabajo recomendada para podcasts

Suelta un episodio y estos valores predeterminados se activan. Cambia por trabajo desde el formulario.

Diarización
División estéreo si 2 locutores
Detección de música
Saltar segmentos intro/outro
Palabras de relleno
Eliminadas por defecto
Notas de episodio
Resumen + puntos clave + etiquetas
Capítulos
Generados a partir de puntos clave
Exportación
SRT · DOCX · notas MD

Accuracy · real-world numbers

97% en episodios grabados en estudio. Se aguanta bien en llamadas remotas con invitados.

La precisión del podcast depende principalmente de cómo fue grabado el invitado, no del host. Un host de estudio emparejado con un invitado solo de Zoom se comporta como la pata más débil. Los números a continuación provienen de episodios de clientes reales, no de audio de laboratorio.

97%
Carga por pista (Riverside / SquadCast)

Cada locutor en un WAV separado. Transcribimos cada pista independientemente y saltamos la diarización. El caso más limpio posible.

95%
Estéreo post-mezcla, 2 locutores

Host a la izquierda, invitado a la derecha, después del masterizado. La forma de podcast más común. La diarización es esencialmente gratis desde la división estéreo.

91%
Mezcla mono, 3-4 locutores

Programas de mesa redonda o formato de panel mezclados a mono. Voces similares pueden fusionarse una o dos veces por hora — una pasada de limpieza de 2 min lo arregla.

86%
Invitado remoto por teléfono / micrófono pobre

Invitado en AirPods a través de una llamada de wifi de hotel. Los números y los nombres propios sufren más. El vocabulario personalizado recupera la mayoría.

Preguntas comunes

8 cosas que la gente pregunta sobre transcripción de podcast.

01¿Puedo simplemente pegar mi enlace de YouTube o SoundCloud?+
Sí. Pega una URL pública de YouTube o un enlace de episodio alojado (SoundCloud, Buzzsprout, Transistor, MP3 directo de Libsyn) y extrayemos el audio de nuestra parte. Para feeds privados, descarga el archivo y cárgalo.
02¿Se transcribirá la intro de música como sinsentidos 'la la la'?+
No si Saltar intro/outro de música está activado (lo está por defecto). Detectamos audio sin habla e iniciamos la transcripción en la primera palabra oída. Las marcas de tiempo en el SRT se ajustan para que los títulos de YouTube sigan sincronizados.
03¿Qué exactamente hay en el archivo de notas de episodio?+
Un resumen de episodio de 2-4 oraciones, 3-7 puntos clave como una lista con viñetas, elementos de acción si se mencionaron, y 3-8 etiquetas de tema. Renderizado como markdown para que puedas pegar directamente en WordPress, Ghost, Substack, o la página de episodio de tu host de podcast.
04¿Puedes generar marcadores de capítulos para Apple Podcasts y Spotify?+
Sí — los capítulos se generan a partir de los puntos clave con marcas de tiempo. Exporta como un chapters.txt separado o incrusta en el WAV/M4A. Ten en cuenta que Spotify solo honra los capítulos en programas alojados en Anchor, así que el archivo txt es tu alternativa.
05Tengo archivos por pista de Riverside / SquadCast — ¿debería cargarlos?+
Sí, por favor. Carga el WAV de cada locutor por separado y etiquétalos con nombres. Transcribimos cada pista independientemente y fusionamos por marca de tiempo. La precisión aterriza alrededor del 97% en esta configuración — el caso más limpio que vemos.
06¿Puede marcar lecturas de patrocinadores o pausas publicitarias?+
No automáticamente aún — eso está en la hoja de ruta. Por ahora, coloca un marcador en tu edición (un breve silencio o un timbre) y lo mostraremos como una marca de tiempo en la transcripción. También puedes etiquetar segmentos de anuncios buscando-pegando el nombre de marca del patrocinador después.
07¿Qué tan largo puede ser el episodio?+
Hasta 6 horas por archivo en una carga. La mayoría de los programas tienen de 30-90 minutos, que terminan en 4-8 minutos en tiempo real. Para un episodio de entrevista de 3 horas, espera aproximadamente 12-15 minutos desde la carga hasta los cuatro artefactos listos.
08¿Reemplazará el SRT limpiamente los títulos automáticos de YouTube?+
Sí. El SRT se divide en líneas de ~42 caracteres con puntuación adecuada y prefijos de locutor opcionales. Cárgalo en YouTube Studio → Subtítulos → Añadir idioma → SRT. Reemplaza completamente la pista de títulos generada automáticamente.

Suelta tu episodio. Obtén la transcripción, notas y SRT.

30 minutos gratis cada mes. Sin tarjeta. Etiquetas de locutor, notas de episodio, capítulos, y todos los formatos de exportación incluidos.

Comenzar gratis