Transcrição do YouTube. Melhor que legendas automáticas.Mais barato que humano.

Cole uma URL do YouTube. Receba uma transcrição com 95%+ de precisão, com identificação de speakers, timestamps de capítulos e legendas SRT/VTT que você pode re-fazer upload — sem Premium, sem extensão Chrome.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Veja o resultado

URL entra. Legendas e transcrição limpa saem.

Cole um link youtu.be ou youtube.com. Nós o resolvemos, puxamos a faixa de áudio de maior bitrate no servidor, rodamos diarização e retornamos uma transcrição com timestamp além de SRT/VTT pronto para fazer upload como legendas da comunidade.

youtu.be/dQw4w9WgXcQREC Entrevista · 2 vozes · 28:14
detectado automaticamente en-USopus 160 kbps · 48 kHz
~90s
Transcrição · streaming96% de precisão
S1

Então o canal chegou a 100k inscritos em oito meses — o que realmente fez diferença?

S2

Sinceramente, postar Shorts diariamente por seis semanas. O tempo de visualização de vídeos longos veio depois.

S1

E a reformulação da thumbnail — foi testada com A/B no YouTube Studio?

S2

Sim, a nova ferramenta Test & Compare. Dois de três vencedores não tinham rosto.

96% em áudio com apresentadorSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Três opções reais · comparação honesta

Legendas automáticas do YouTube. Rev humano. Ou a gente.

O YouTube oferece legendas automáticas em todos os vídeos gratuitamente — simplesmente não são muito precisas e não têm identificação de speakers. Rev vende transcrições digitadas por humanos a $1.50/min. Estamos no meio do caminho: IA a 95%+, identificação de speakers, resultado em três minutos.

Option 01

YouTube auto-captions

Grátis, integrada em todos os vídeos públicos. Sem correção de pontuação, sem identificação de speakers.

CustoGrátis
Precisão~80% em áudio limpo
Identificação de speakersNenhuma
PontuaçãoEsparsa, sem parágrafos
ExportaçãoCopiar-colar do painel de transcrição
Funciona emApenas vídeos públicos
Best forEscanear rapidamente um vídeo que não é seu quando a precisão não importa.
Option 02

Transcription.Solutions

Cole a URL. Três minutos depois: transcrição limpa, SRT/VTT, resumo com IA com links de capítulos.

Custo · por min$0.03 no Pro
Precisão95%+ em áudio com apresentador
Identificação de speakersSim (Pro e Business)
PontuaçãoCompleta, com parágrafos
ExportaçãoSRT · VTT · DOCX · TXT · JSON
Funciona emURLs públicas + não listadas
Best forCriadores re-enviando legendas, podcasters adaptando vídeo para blog, pesquisadores extraindo citações de entrevistas.
Option 03

Rev human transcription

Um humano digita. Maior precisão, entrega mais lenta, preço por minuto.

Custo · por min$1.50
Precisão99%+ garantido
Identificação de speakersSim
PontuaçãoCompleta, nível editorial
Entrega12-24 horas típico
Funciona emQualquer arquivo enviado
Best forConteúdo admissível em tribunal, legendas para transmissão, ou entrevistas onde uma palavra perdida destrói a citação.

Preços precisos conforme 2026. Taxas da Rev refletem seu nível de serviço padrão; tiers apenas com IA de competidores não são comparados aqui.

Específico para YouTube

Três coisas que pegam em ferramentas genéricas de transcrição.

Áudio do YouTube tem particularidades que transcritores de prateleira não lidam bem. Ative as configurações certas e a transcrição sai pronta para re-fazer upload como legendas.

O que dá errado

  1. 1Camas de música confundem o reconhecedor. Intros e música de fundo são transcritos como palavras garbled. IA genérica não sabe ignorá-los.
  2. 2Comprimentos de linha SRT não combinam com as regras do YouTube. Legendas transbordam a área segura em mobile, ou cortam no meio da palavra porque o chunker não foi ajustado para vídeo.
  3. 3Nomes específicos do canal (marcas patrocinadoras, títulos de games, handles de convidados como @MKBHD) são soletrados foneticamente. Um typo e a citação fica insearchable.

O que ligar aqui

  1. 1Ligue Segmentação ciente de música no formulário do job. Marcamos regiões de música com `[music]` em vez de alucinar letras, e retomamos a transcrição limpa quando a voz volta.
  2. 2Escolha SRT seguro para YouTube como exportação. Linhas limitadas a 42 caracteres, máximo duas linhas por cue, e quebras caem em limites de frase — solte o arquivo direto no YouTube Studio.
  3. 3Cole o vocabulário do canal (nomes de patrocinadores, convidados recorrentes, títulos de games) em Vocabulário customizado. Alimentamos isso ao reconhecedor como sugestão para que as grafias de marca fiquem corretas.

Configurações recomendadas para YouTube

Cole uma URL do YouTube e essas ligam por padrão. Cancele por job no formulário.

Fonte
Cola de URL · auto-resolve youtu.be
Diarização
Acústica · 1-4 speakers
Tratamento de música
Marca [music], pula letras
Palavras de preenchimento
Removidas por padrão
Resumo
Timestamps de capítulo + momentos-chave
Exportação
SRT seguro para YouTube · VTT · DOCX

Accuracy · real-world numbers

95%+ em vídeos com apresentador. Áudio de música e games caem mais.

Conteúdo do YouTube varia muito — um podcast de estúdio e um stream de Fortnite não são o mesmo problema. Áudio com lapela em vídeo de apresentador é o melhor caso; música de fundo e áudio de game sobreposto degradam a precisão mais rápido. Os números abaixo vêm de URLs reais de YouTube de clientes em produção.

97%
Podcast de estúdio · microfone por convidado

Setup estilo Joe Rogan: cada convidado em um microfone boom separado, tratamento leve da sala, sem música de fundo. Diarização é trivial quando as vozes não se sobrepõem.

95%
Vídeo de apresentador único · lapela/microfone USB

Tutorial padrão ou ensaio em vídeo. Um speaker, áudio interno, música de introdução baixa sob a voz. A maioria dos uploads do YouTube cai aqui.

89%
Vlog com B-roll · áudio ao ar livre

Vento, trânsito, música ambiente sob voiceover. Palavras ainda podem ser usadas; espere ocasionais escapes em nomes próprios e marcas.

84%
Stream de gaming · voz sobre áudio do game

EFX do game, música e leitura de chat em volume variável. A voz do streamer geralmente é clara; companheiros no Discord caem mais rápido. Pior caso em nossos dados.

Dúvidas comuns

8 dúvidas sobre transcrição do YouTube.

01Eu só colo a URL, ou preciso fazer download do vídeo primeiro?+
Só cole a URL. Aceitamos links youtube.com/watch, links curtos youtu.be e URLs de vídeo não listados. Nós a resolvemos no servidor, puxamos apenas a faixa de áudio (não o vídeo), e começamos a transcrever — geralmente em 10 segundos após a cola.
02Funciona com vídeos privados ou não listados?+
Não listados sim, privados não. URLs não listadas são resolvíveis publicamente se você tem o link, então conseguimos buscá-las. Vídeos privados exigem estar logado na sua conta Google — não conseguimos nos passar por você. Faça download do MP4 do YouTube Studio primeiro, depois envie o arquivo.
03Por que a sua transcrição é muito melhor que as legendas automáticas do YouTube?+
As legendas automáticas do YouTube rodam um modelo streaming ajustado para custo em escala através de bilhões de vídeos. Nós rodamos um modelo maior com decodificação em contexto completo, vocabulário customizado e uma passada de diarização separada. Resultado: ~95% vs ~80%, mais identificação de speakers e pontuação apropriada.
04Eu posso fazer upload do SRT de volta para o YouTube como legendas da comunidade?+
Sim. Exporte como SRT seguro para YouTube, abra YouTube Studio → Legendas → Adicionar → Enviar arquivo. Os comprimentos de nossa linha e timing combinam com as regras de display do YouTube, então as cues não vão transbordar no mobile ou quebrar no meio da palavra.
05E sobre copyright — é legal transcrever o vídeo de outra pessoa?+
Transcrever para uso pessoal, pesquisa, jornalismo ou comentário é geralmente fair use nos EUA. Re-publicar a transcrição completa comercialmente é mais nebuloso. Nós não hospedamos o áudio ou vídeo, você recebe o texto — o que você faz com ele é com você. Não é conselho legal.
06Vocês conseguem lidar com vídeos longos como episódios de podcast de 4 horas?+
Sim. Nosso limite duro é 8 horas por arquivo. Um episódio de 4 horas do Lex Fridman transcribe em aproximadamente 8-12 minutos de relógio e custa cerca de $7.20 no preço Pro. A diarização de speaker se mantém ao longo do comprimento completo.
07Vocês lidam com vídeos do YouTube em português?+
Sim — 99 idiomas auto-detectados. Espanhol, Hindi, Português e Japonês todos chegam a 2-3 pontos da precisão do Inglês em áudio limpo. Code-switching (Inglês + Espanhol na mesma frase) funciona mas degrada por ~5 pontos.
08Eu posso obter timestamps de capítulo como os auto-capítulos do YouTube?+
Sim. O resumo da IA inclui timestamps estilo capítulo até transições de tópicos mais links de momentos-chave. Cole-os na descrição do seu vídeo como `00:00 Intro / 03:42 Setup / …` — o YouTube os renderiza como capítulos clicáveis automaticamente.

Cole uma URL do YouTube. Veja o resultado.

30 minutos livres todo mês. Sem cartão. Identificação de speakers, SRT seguro para YouTube, resumo com IA com timestamps de capítulo — tudo incluído.

Começar grátis