Transcrición para podcasters.Notas de programa e SRT nun único paso.

Carga o episodio de podcast máster — MP3, WAV, ou unha ligazón de YouTube. Obtén unha transcrición con nomes de locutor, notas de programa con IA con puntos clave e etiquetas, máis un SRT para o corte de vídeo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Un arquivo entra, catro artefactos saen

Episodio máster entra. Transcrición, notas de programa, SRT, etiquetas saen.

A maioría dos podcasts chegan como MP3 estéreo de posprodución con host e convidado xa mesturados. Separámolos acusticamente, detectamos a introdución musical e comezamos a transcrición na primeira palabra falada.

Episodio 142 másterREC 2 locutores · 48:21 · MP3 192 kbps
en-US detectado automaticamente44.1 kHz estéreo · pós-mestura
~90s
Transcrición · transmisión95% de precisión
S1

Benvido de volta ao programa. Hoxe estou falando con Priya Anand sobre o seu novo libro sobre cadeas de subministración.

S2

Grazas por invitarme, Jordan. Foi un período louco estes tres anos dende que falamos por última vez.

S1

Entón o libro abre co bloqueo de Suez — por que comezar alí?

S2

Porque foi o momento en que todos aqueles que non son da loxística de repente se importaban polos contedores.

95% en estéreo pós-mesturaSRT · DOCX · TXT · Notas de programa MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcións reais · comparación honesta

Descript. Castmagic. Ou nós.

Descript é un editor primeiro, transcrición segunda. Castmagic é notas de programa primeiro, transcrición segunda. Nós centrámonos na liña de produción ficheiro → transcrición → notas de programa e mantémonos fóra do teu editor.

Option 01

Descript

Editor de audio con transcrición integrada. Excelente para fluxos de traballo de edición por texto, máis pesado do que necesitas se só queres unha transcrición.

Uso principalDAW + edición de palabras
Diarización de locutoresAcústica, EN-forte
Notas de programaComplemento AI Underlord
ExportaciónSRT · TXT · ficheiro de proxecto
Nivel gratuíto1 hora/mes transcrición
Custo$24/usuario/mes (Creator)
Best forPodcasters en solitario que editan episodios eliminando palabras dunha transcrición e queren unha aplicación para todo.
Option 02

Transcription.Solutions

Carga o episodio máster. Transcrición, notas de programa, etiquetas, SRT — todos catro nun único paso. Ningún editor, ningún bloqueo.

Uso principalTranscrición + notas de programa
Diarización de locutoresAcústica + carga por pista
Notas de programaGratuíto en cada plan
ExportaciónSRT · VTT · DOCX · MD · JSON
Nivel gratuíto30 min/mes, sen tarxeta
Custo · por min$0.03
Best forProgramas que xa teñen un editor (Logic, Hindenburg, Reaper) e só queren texto limpo + notas despois de que o episodio se mesture.
Option 03

Castmagic

Notas de programa como servizo. Carga o ficheiro, obtén un paquete de contido ben presentado. A transcrición é máis ben un subproduto.

Uso principalReutilización de contido
Diarización de locutoresSí, EN-afinado
Notas de programaMoitos modelos, só de pago
ExportaciónSRT · TXT · MD de modelo
Nivel gratuítoSó proba
Custo~$23+/mes (Starter)
Best forProgramas con moito márketing que precisan 12 publicacións sociais, 4 borradores de boletín e un carrusel de LinkedIn por episodio.

Prezos aproximados a partir de 2026 e cambian por vendedor. Os niveis gratuítos e as funcións AI de complemento rodan frecuentemente.

Específico para podcasting

Tres cousas que muerden os podcasters nas ferramentas de transcrición xenéricas.

Dinos algunhas cousas sobre o episodio na carga e o resultado deixa de necesitar un paso de limpeza.

O que vai mal

  1. 1Introdución de música transcrita como despropósito. O recoñecedor intenta ler letras ou patróns de zumbido e insire despropósitos como 'la la na' na primeira 30 segundos.
  2. 2Nome do convidado escrito fonéticamente. 'Priya Anand' sae 'Pria Anan' ou 'Prea Ahnand' — e está mal cada única vez que aparece.
  3. 3Risas e solapamentos se representan como palabras de recheo ou se atribúen ao locutor incorrecto, especialmente durante intercambios enerxéticos.

Que hai que cambiar aquí

  1. 1Activa Saltar intro/outro de música no formulario de traballo. Detectamos segmentos sen discurso e comezamos a transcrición na primeira palabra falada — os desplazamentos de marca de tempo axústanse automaticamente.
  2. 2Pega o nome do convidado e mencións de marca no Vocabulario personalizado. Pasámolo como pista de recoñecedor, polo que a ortografía segue sendo consistente en todo o episodio.
  3. 3Activa Notas de programa para obter un resumo de 2–4 frases, 3–7 puntos clave, elementos de acción e 3–8 etiquetas de tema renderizadas en markdown — pega directamente no teu CMS.

Configuración de traballo recomendada para podcasts

Carga un episodio e estes valores por defecto actívanse. Anula por traballo desde o formulario.

Diarización
Corte estéreo se 2 locutores
Detección de música
Saltar segmentos intro/outro
Palabras de recheo
Eliminadas por defecto
Notas de programa
Resumo + puntos clave + etiquetas
Capítulos
Xerados a partir de puntos clave
Exportación
SRT · DOCX · notas de programa MD

Accuracy · real-world numbers

97% en episodios con micrófono de estudio. Resiste ben en chamadas con convidados remotos tamén.

A precisión do podcast depende principalmente de como foi gravado o convidado, non do host. Un host de estudio emparellado cun convidado que só usa Zoom comporta como a pior pata. Os números seguintes proceden de episodios reais de clientes, non de audio de laboratorio.

97%
Carga por pista (Riverside / SquadCast)

Cada locutor nunha WAV separada. Transcribimos cada pista independentemente e saltamos a diarización. O caso máis limpo posible.

95%
Mestura estéreo pós-produción, 2 locutores

Host á esquerda, convidado á dereita, despois do mesturazo. A forma de podcast máis común. A diarización é basicamente gratis do corte estéreo.

91%
Mestura mono, 3-4 locutores

Programas de mesa redonda ou formato de panel mesturados en mono. As voces similares pódense unir unha ou dúas veces cada hora — un paso de limpeza de 2 min arranxa.

86%
Convidado remoto por teléfono / micrófono pobre

Convidado en AirPods a través dunha chamada wifi de hotel. Os números e nomes propios sofren máis. O vocabulario personalizado recupera a maioría.

Preguntas comúns

8 cousas que a xente pregunta sobre transcrición de podcasts.

01¿Podo simplemente pegar a miña ligazón de YouTube ou SoundCloud?+
Sí. Pega unha URL pública de YouTube ou unha ligazón de episodio aloxado (SoundCloud, Buzzsprout, Transistor, MP3 directo de Libsyn) e puxamos o audio do noso lado. Para feeds privados, descarga o ficheiro e cargao.
02¿Será a introdución de música transcrita como despropósito 'la la la'?+
Non se Saltar intro/outro de música está activado (está activado por defecto). Detectamos audio sen discurso e comezamos a transcrición na primeira palabra falada. As marcas de tempo do SRT cambian para que os subtítulos de YouTube seguen sincronizándose.
03¿Que hai no ficheiro de notas de programa exactamente?+
Un resumo de episodio de 2–4 frases, 3–7 puntos clave como lista viñetada, elementos de acción se se mencionaron algúns, e 3–8 etiquetas de tema. Renderizado como markdown para poder pegar directamente en WordPress, Ghost, Substack, ou a páxina de episodio do teu aloxador de podcasts.
04¿Podes xerar marcadores de capítulo para Apple Podcasts e Spotify?+
Sí — os capítulos xéranse a partir dos puntos clave con marcas de tempo. Exporta como chapters.txt separado ou incrusta en WAV/M4A. Ten en conta que Spotify só honra os capítulos nos programas aloxados en Anchor, polo que o ficheiro txt é o teu recurso de reserva.
05Teño ficheiros por pista de Riverside / SquadCast — ¿debería cargar eses?+
Sí, por favor. Carga cada WAV do locutor por separado e etiquétaos con nomes. Transcribimos cada pista independentemente e fusionamos por marca de tempo. A precisión chega a arredor do 97% nesta configuración — o caso máis limpo que vemos.
06¿Pode sinalizador lecturas de patrocinador ou roturas de anuncios?+
Non automaticamente aínda — iso está no roteiro. Por agora, deixa un marcador na túa edición (un breve silencio ou tintineo) e ó-lo superficie dunha marca de tempo na transcrición. Tamén podes etiquetar segmentos de anuncios buscando e pegando o nome de marca do patrocinador despois.
07¿Cal é a duración máxima do episodio?+
Ata 6 horas por ficheiro nunha única carga. A maioría dos programas duran 30-90 minutos, o que remata en 4-8 minutos de tempo real. Para un episodio de entrevista de 3 horas, espera aproximadamente 12-15 minutos desde a carga ata que todos os catro artefactos estean listos.
08¿Substiturá o SRT os subtítulos automáticos de YouTube limpiamente?+
Sí. O SRT está dividido en liñas en ~42 caracteres con puntuación adecuada e prefixos de locutor opcionais. Cargao en YouTube Studio → Subtítulos → Engadir idioma → SRT. Substitúe completamente a pista de subtítulos xerada automaticamente.

Carga o episodio. Obtén a transcrición, notas e SRT.

30 minutos gratuítos cada mes. Sen tarxeta. Nomes de locutor, notas de programa, capítulos e todas as exportacións incluídos.

Comeza gratis