Transcrição para podcasters.Anotações do episódio e SRT em uma passagem.

Envie seu arquivo principal de episódio de podcast — MP3, WAV ou um link do YouTube. Obtenha uma transcrição com etiquetas de locutor, anotações do episódio com pontos-chave e tags, mais um SRT para o vídeo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Um arquivo entra, quatro artefatos saem

Arquivo principal entra. Transcrição, anotações do episódio, SRT, tags saem.

A maioria dos podcasts chega como um MP3 estéreo pós-produção com apresentador e convidado já mixados. Dividimos acusticamente, detectamos a introdução musical e iniciamos a transcrição na primeira palavra falada.

Arquivo principal Episódio 142REC 2 locutores · 48:21 · MP3 192 kbps
en-US detectado automaticamente44.1 kHz estéreo · pós-mix
~90s
Transcrição · streaming95% de precisão
S1

Bem-vindo de volta ao programa. Hoje estou falando com Priya Anand sobre seu novo livro sobre cadeias de suprimentos.

S2

Obrigado por me receber, Jordan. Foram três anos loucos desde nossa última conversa.

S1

Então o livro abre com o bloqueio de Suez — por que começar aí?

S2

Porque foi o momento em que todos os não-logísticos de repente se importaram com contêineres.

95% em pós-mix estéreoSRT · DOCX · TXT · Anotações do episódio MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Três opções reais · comparação honesta

Descript. Castmagic. Ou nós.

Descript é um editor em primeiro lugar, transcrição em segundo. Castmagic é anotações do episódio em primeiro lugar, transcrição em segundo. Nos focamos no pipeline arquivo → transcrição → anotações do episódio e saímos do seu editor.

Option 01

Descript

Editor de áudio com transcrição integrada. Ótimo para fluxos de trabalho de edição por texto, mais pesado do que você precisa se apenas quer uma transcrição.

Primary useDAW + edição de palavra
Speaker diarizationAcústica, EN-forte
Show notesComplemento AI Underlord
ExportSRT · TXT · arquivo de projeto
Free tier1 hora/mês de transcrição
Cost$24/usuário/mês (Creator)
Best forPodcasters solo que editam episódios deletando palavras de uma transcrição e querem um app para tudo.
Option 02

Transcription.Solutions

Envie o arquivo principal. Transcrição, anotações do episódio, tags, SRT — todos quatro em uma passagem. Sem editor, sem amarração.

Primary useTranscrição + anotações do episódio
Speaker diarizationAcústica + upload por faixa
Show notesGrátis em todo plano
ExportSRT · VTT · DOCX · MD · JSON
Free tier30 min/mês, sem cartão
Cost · per min$0.03
Best forProgramas que já têm um editor (Logic, Hindenburg, Reaper) e apenas querem texto limpo + anotações após o episódio ser mixado.
Option 03

Castmagic

Serviço de anotações-do-episódio. Arraste o arquivo, obtenha um pacote de conteúdo elegante. A transcrição é mais um subproduto.

Primary useReutilização de conteúdo
Speaker diarizationSim, EN-ajustado
Show notesMuitos modelos, apenas pago
ExportSRT · TXT · template MD
Free tierApenas teste
Cost~$23+/m��s (Starter)
Best forProgramas pesados em marketing que precisam de 12 posts sociais, 4 rascunhos de boletim e um carrossel LinkedIn por episódio.

Preços aproximados em 2026 e mudam por fornecedor. Camadas gratuitas e recursos de IA complementares giram com frequência.

Específico para podcasting

Três coisas que prejudicam podcasters em ferramentas genéricas de transcrição.

Diga-nos algumas coisas sobre o episódio no upload e a saída para de precisar de uma passagem de limpeza.

What goes wrong

  1. 1Introdução musical transcrita como gibberish. O reconhecedor tenta ler letras ou padrões de zumbido e insere disparates como 'la la na' nos primeiros 30 segundos.
  2. 2Nome do convidado soletrado foneticamente. 'Priya Anand' sai como 'Pria Anan' ou 'Prea Ahnand' — e está errado toda vez que aparece.
  3. 3Risadas e conversas simultâneas são renderizadas como palavras de preenchimento ou atribuídas ao locutor errado, especialmente durante trocas energéticas.

What to flip here

  1. 1Alterne Pular intro/outro musical no formulário de trabalho. Detectamos segmentos não-fala e iniciamos a transcrição na primeira palavra falada — deslocamentos de timestamp ajustam automaticamente.
  2. 2Cole o nome do convidado e menções de marca em Vocabulário personalizado. Passamos como uma dica de reconhecedor, então a grafia permanece consistente em todo o episódio.
  3. 3Ative Anotações do episódio para obter um resumo de 2-4 frase, 3-7 pontos-chave, itens de ação e 3-8 tags de tópicos renderizados em markdown — cole direto no seu CMS.

Configurações de trabalho recomendadas para podcasts

Envie um episódio e esses padrões ativam. Substitua por trabalho no formulário.

Diarization
Divisão estéreo se 2 locutores
Music detection
Pular segmentos intro/outro
Filler words
Removidas por padrão
Show notes
Resumo + pontos-chave + tags
Chapters
Gerados a partir de pontos-chave
Export
SRT · DOCX · anotações do episódio MD

Accuracy · real-world numbers

97% em episódios com microfone de estúdio. Funciona bem em chamadas remotas também.

A precisão do podcast depende principalmente de como o convidado foi gravado, não do apresentador. Um apresentador de estúdio emparelhado com um convidado apenas Zoom se comporta como a pior situação. Os números abaixo vêm de episódios reais de clientes, não de áudio de laboratório.

97%
Upload por faixa (Riverside / SquadCast)

Cada locutor em um WAV separado. Tratamos cada faixa independentemente e pulamos diarização. Caso mais limpo possível.

95%
Pós-mix estéreo, 2 locutores

Apresentador esquerda, convidado direita, após masterização. O formato de podcast mais comum. A diarização é essencialmente gratuita na divisão estéreo.

91%
Mix mono, 3-4 locutores

Programas de mesa redonda ou formato painel mixado em mono. Vozes semelhantes podem se mesclar uma ou duas vezes por hora — uma passagem de limpeza de 2 min corrige.

86%
Convidado remoto no telefone / microfone ruim

Convidado em AirPods através de uma chamada de wifi do hotel. Números e nomes próprios sofrem mais. Vocabulário personalizado recupera a maioria.

Perguntas comuns

8 coisas que as pessoas perguntam sobre transcrição de podcast.

01Posso apenas colar meu link do YouTube ou SoundCloud?+
Sim. Cole uma URL pública do YouTube ou um link de episódio hospedado (SoundCloud, Buzzsprout, Transistor, MP3 direto Libsyn) e extraímos o áudio do nosso lado. Para feeds privados, baixe o arquivo e envie-o.
02A introdução musical será transcrita como disparate 'la la la'?+
Não se Pular intro/outro musical estiver ativo (está por padrão). Detectamos áudio não-fala e iniciamos a transcrição na primeira palavra falada. Timestamps no SRT mudam para sincronizar para que legenda do YouTube ainda sincronize.
03O que exatamente está no arquivo de anotações do episódio?+
Um resumo de episódio de 2-4 frases, 3-7 pontos-chave como uma lista com marcadores, itens de ação se mencionados, e 3-8 tags de tópicos. Renderizado como markdown para colar direto no WordPress, Ghost, Substack ou na página de episódio do seu host de podcast.
04Você pode gerar marcadores de capítulo para Apple Podcasts e Spotify?+
Sim — capítulos são gerados a partir dos pontos-chave com timestamps. Exporte como chapters.txt separado ou incorpore em WAV/M4A. Observe que Spotify apenas reconhece capítulos em programas hospedados no Anchor, então o arquivo txt é seu fallback.
05Tenho arquivos por faixa de Riverside / SquadCast — devo carregá-los?+
Sim, por favor. Envie o WAV de cada locutor separadamente e etiquete-os com nomes. Transcrevemos cada faixa independentemente e mesclamos por timestamp. A precisão fica em torno de 97% nesta configuração — o caso mais limpo que vemos.
06Pode sinalizar leituras de patrocinador ou quebras de anúncio?+
Ainda não automaticamente — isso está no roteiro. Por enquanto, coloque um marcador na sua edição (um silêncio breve ou sino) e o surfiremos como timestamp na transcrição. Você também pode etiquetar segmentos de anúncio procurando o nome da marca do patrocinador afterward.
07Quanto tempo o episódio pode ter?+
Até 6 horas por arquivo em um upload. A maioria dos programas executados 30-90 minutos, que termina em 4-8 minutos de relógio. Para um episódio de entrevista de 3 horas, espere aproximadamente 12-15 minutos do upload até todos os quatro artefatos prontos.
08O SRT substituirá as legendas automáticas do YouTube com limpeza?+
Sim. O SRT está dividido em linhas em ~42 caracteres com pontuação adequada e prefixos de locutor opcionais. Envie-o no YouTube Studio → Legendas → Adicionar idioma → SRT. Substitui completamente a faixa de legenda gerada automaticamente.

Envie seu episódio. Obtenha a transcrição, anotações e SRT.

30 minutos gratuitos a cada mês. Sem cartão. Etiquetas de locutor, anotações do episódio, capítulos e cada exportação incluída.

Comece grátis