Transcrição para podcasters.Notas do episódio e SRT em uma única passada.

Envie o seu episódio de podcast pronto — MP3, WAV ou link do YouTube. Obtenha a transcrição com identificação de palestrantes, notas do episódio geradas por IA com pontos-chave e tags, além de SRT para o vídeo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Um arquivo na entrada, quatro artefatos na saída

Episódio pronto na entrada. Transcrição, notas do episódio, SRT, tags na saída.

A maioria dos podcasts chega como um estéreo MP3 pós-produção com host e convidado já misturados. Separamos acusticamente, detectamos a intro de música e começamos a transcrição na primeira palavra falada.

Episódio 142 prontoREC 2 palestrantes · 48:21 · MP3 192 kbps
en-US detectado automaticamente44.1 kHz estéreo · pós-mix
~90s
Transcrição · streaming95% de precisão
S1

Bem-vindo de volta ao programa. Hoje estou conversando com Priya Anand sobre seu novo livro sobre cadeias de suprimento.

S2

Obrigada por me ter, Jordan. Foram três anos selvagens desde que nos falamos pela última vez.

S1

Então o livro abre com o bloqueio de Suez — por que começar aí?

S2

Porque foi o momento em que todos fora da logística de repente se importaram com contêineres.

95% em estéreo pós-mixSRT · DOCX · TXT · Notas do episódio MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Três opções reais · comparação honesta

Descript. Castmagic. Ou nós.

Descript é um editor em primeiro lugar, transcrição em segundo. Castmagic é notas do episódio em primeiro, transcrição em segundo. Focamos no pipeline arquivo → transcrição → notas do episódio e ficamos fora do seu editor.

Option 01

Descript

Editor de áudio com transcrição integrada. Ótimo para fluxos de trabalho de edição por texto, mais pesado do que você precisa se só quer uma transcrição.

Uso principalDAW + edição por texto
Diarização de palestrantesAcústica, forte em EN
Notas do episódioAdd-on de IA Underlord
ExportarSRT · TXT · arquivo de projeto
Tier gratuito1 hr/mês de transcrição
Custo$24/usuário/mês (Creator)
Best forPodcasters solo que editam episódios deletando palavras de uma transcrição e querem um app para tudo.
Option 02

Transcription.Solutions

Envie o episódio pronto. Transcrição, notas do episódio, tags, SRT — os quatro em uma única passada. Sem editor, sem lock-in.

Uso principalTranscrição + notas do episódio
Diarização de palestrantesAcústica + envio por pista
Notas do episódioGratuito em todo plano
ExportarSRT · VTT · DOCX · MD · JSON
Tier gratuito30 min/mês, sem cartão
Custo · por minuto$0.03
Best forProgramas que já têm um editor (Logic, Hindenburg, Reaper) e só querem texto limpo + notas depois que o episódio está mixado.
Option 03

Castmagic

Show-notes-como-serviço. Arraste o arquivo, obtenha um pacote de conteúdo elegante. Transcrição é mais um subproduto.

Uso principalReaproveitamento de conteúdo
Diarização de palestrantesSim, afinada para EN
Notas do episódioMuitos templates, apenas pago
ExportarSRT · TXT · MD com template
Tier gratuitoApenas trial
Custo~$23+/mês (Starter)
Best forProgramas orientados a marketing que precisam de 12 posts sociais, 4 rascunhos de newsletter e um carrossel LinkedIn por episódio.

Preços aproximados a partir de 2026 e mudam por fornecedor. Tiers gratuitos e features de IA de add-on giram frequentemente.

Específico para podcasting

Três coisas que pegam podcasters em ferramentas genéricas de transcrição.

Conte-nos algumas coisas sobre o episódio no envio e a saída para de precisar de uma passada de limpeza.

O que dá errado

  1. 1Intro de música transcrita como gibberish. O reconhecedor tenta ler letras ou padrões de humming e insere disparates como 'la la na' nos primeiros 30 segundos.
  2. 2Nome do convidado digitado foneticamente. 'Priya Anand' sai como 'Pria Anan' ou 'Prea Ahnand' — e tá errado sempre que aparece.
  3. 3Risadas e cross-talk são renderizadas como palavras de preenchimento ou atribuídas ao palestrante errado, especialmente durante trocas energéticas.

O que ativar aqui

  1. 1Ative Pular intro/outro de música no formulário de job. Detectamos segmentos sem fala e começamos a transcrição na primeira palavra — offsets de timestamp se ajustam automaticamente.
  2. 2Cole nome do convidado e menções de marca em Vocabulário personalizado. Passamos como dica ao reconhecedor, então a grafia fica consistente no episódio inteiro.
  3. 3Ative Notas do episódio para obter um resumo de 2-4 frases, 3-7 pontos-chave, itens de ação e 3-8 tags de tópicos renderizadas em markdown — cole direto no seu CMS.

Configurações de job recomendadas para podcasts

Envie um episódio e esses padrões ativam. Sobrescreva por-job no formulário.

Diarização
Divisão de estéreo se 2 palestrantes
Detecção de música
Pular segmentos intro/outro
Palavras de preenchimento
Removidas por padrão
Notas do episódio
Resumo + pontos-chave + tags
Capítulos
Gerados a partir de pontos-chave
Exportar
SRT · DOCX · notas do episódio MD

Accuracy · real-world numbers

97% em episódios com mic de estúdio. Aguenta bem em chamadas com convidado remoto também.

A precisão de um podcast depende principalmente de como o convidado foi gravado, não do host. Um host de estúdio pareado com um convidado apenas Zoom se comporta como a pior perna. Os números abaixo vêm de episódios reais de clientes, não de áudio de laboratório.

97%
Envio por pista (Riverside / SquadCast)

Cada palestrante em um WAV separado. Transcrevemos cada pista independentemente e pulamos diarização. Caso mais limpo possível.

95%
Estéreo pós-mix, 2 palestrantes

Host à esquerda, convidado à direita, depois de masterização. A forma de podcast mais comum. Diarização é essencialmente grátis pela divisão de estéreo.

91%
Mix mono, 3-4 palestrantes

Rodas de conversa ou formato de painel mixados para mono. Vozes similares podem se mesclar uma ou duas vezes por hora — uma passada de 2 min corrige.

86%
Convidado remoto no telefone / mic ruim

Convidado em AirPods através de chamada wifi de hotel. Números e nomes próprios sofrem mais. Vocabulário customizado recupera a maioria.

Perguntas comuns

8 coisas que as pessoas perguntam sobre transcrição de podcasts.

01Posso só colar meu link do YouTube ou SoundCloud?+
Sim. Cole uma URL pública do YouTube ou um link de episódio hospedado (SoundCloud, Buzzsprout, Transistor, Libsyn MP3 direto) e puxamos o áudio do nosso lado. Para feeds privados, baixe o arquivo e envie.
02A intro de música vai ser transcrita como nonsense 'la la la'?+
Não se Pular intro/outro de música estiver ativado (está por padrão). Detectamos áudio sem fala e começamos a transcrição na primeira palavra falada. Timestamps no SRT mudam para combinar então captions do YouTube ainda sincronizam.
03O que exatamente tem no arquivo de notas do episódio?+
Um resumo de 2-4 frases do episódio, 3-7 pontos-chave como lista com bullets, itens de ação se mencionados, e 3-8 tags de tópicos. Renderizado como markdown para colar direto em WordPress, Ghost, Substack ou página de episódio do seu host de podcast.
04Pode gerar marcadores de capítulo para Apple Podcasts e Spotify?+
Sim — capítulos são gerados a partir de pontos-chave com timestamps. Exporte como chapters.txt separado ou embutido em WAV/M4A. Note que Spotify só honra capítulos em shows hospedados no Anchor, então o arquivo txt é seu fallback.
05Tenho arquivos por pista do Riverside / SquadCast — devo enviar aqueles?+
Sim, por favor. Envie o WAV de cada palestrante separadamente e marque com nomes. Transcrevemos cada pista independentemente e mesclamos por timestamp. Precisão chega em torno de 97% nessa configuração — o caso mais limpo que vemos.
06Pode marcar leituras de sponsor ou ad breaks?+
Não automaticamente ainda — tá no roadmap. Por enquanto, coloque um marcador na sua edição (um silêncio breve ou chime) e surfamos ele como timestamp na transcrição. Você também pode marcar segmentos de anúncio achando e pastando o nome do sponsor depois.
07Quão longo o episódio pode ser?+
Até 6 horas por arquivo em um envio. A maioria dos shows roda 30-90 minutos, que termina em 4-8 minutos de relógio de parede. Para um episódio de entrevista de 3 horas, espere cerca de 12-15 minutos do envio até todos os quatro artefatos prontos.
08O SRT vai substituir as auto-captions do YouTube limpo?+
Sim. O SRT tem quebras de linha em ~42 caracteres com pontuação apropriada e prefixos de palestrante opcionais. Envie em YouTube Studio → Legendas → Adicionar idioma → SRT. Sobrescreve a faixa de caption auto-gerada completamente.

Envie seu episódio. Obtenha a transcrição, notas e SRT.

30 minutos gratuitos todo mês. Sem cartão. Identificação de palestrantes, notas do episódio, capítulos e toda exportação inclusos.

Começar grátis