Transcrição de TikTok.Cole um link, obtenha legendas.

Solte uma URL de vídeo do TikTok. Extraímos o áudio do lado do servidor e retornamos texto com timestamp mais arquivos de legenda SRT e VTT — prontos para reeditar ou incorporar ao vídeo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Veja o que sai

URL pública dentro. Legendas prontas.

Cole qualquer link de vídeo público do TikTok. Extraímos a faixa de áudio, executamos detecção de idioma e transmitimos legendas enquanto a música de fundo continua tocando sob a voz.

URL de vídeo do TikTokREC 1 voz · 0:47 · vertical 9:16
detectado automaticamente en-US44.1 kHz · faixa de música -18 dB
~90s
Legendas · transmissão94% de precisão
S1

Então segue o segredo do tofu crocante que ninguém te fala — aperte por dez minutos, não por dois.

S1

Depois, amido de milho, não farinha. Mexa, não apenas polvilhe.

S1

Air fryer a 400 por doze minutos, vire no meio.

S1

Comente 'tofu' que eu envio a receita do molho completa.

94% na voz do criadorSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Três opções reais · comparação honesta

Legendas automáticas do TikTok. CapCut ou Submagic. Ou nós.

TikTok inclui legendas automáticas no editor. CapCut e Submagic adicionam legendas estilizadas e animadas para reeditar. Nós fornecemos a transcrição bruta mais SRT/VTT limpo — traga seu próprio editor.

Option 01

Legendas automáticas do TikTok

Integrado no editor do TikTok. Ative, as legendas aparecem. Nenhum arquivo que você possa levar para outro lugar.

RequerUpload através do app TikTok
Cobertura de idioma~40 idiomas, inglês é mais forte
ExportaçãoNenhuma — apenas sobreposto
Editar antes de publicarEditor de texto no app
Manipulação de músicaPerde letras, confunde voz sobre faixas altas
CustoGrátis
Best forCriadores que só precisam de legendas dentro do TikTok e nunca repostam em Reels ou Shorts.
Option 02

Transcription.Solutions

Cole a URL pública. Obtenha um arquivo de transcrição mais SRT/VTT que você pode descartar em qualquer editor ou reeditar em qualquer lugar.

RequerURL pública do TikTok — sem login
Cobertura de idioma100+ com detecção automática
ExportaçãoSRT · VTT · DOCX · TXT · JSON
Editar antes de publicarEditor web, depois re-exporte
Manipulação de músicaIsolamento de voz em faixas com ruído
Custo · por minuto$0,03
Best forCriadores que repostam em Reels/Shorts/YouTube, agências reutilizando TikToks de clientes, pesquisadores arquivando tendências.
Option 03

CapCut / Submagic

Legendas estilizadas e animadas ajustadas para short-form. Bloqueadas ao editor deles, inglês em primeiro lugar.

RequerInstalação do app + pago para exportação
Cobertura de idioma~20 fortes, outros inconsistentes
ExportaçãoMP4 com sobreposição, SRT pago
Editar antes de publicarApenas dentro da timeline deles
Manipulação de músicaAjustado ao inglês, perde em voz com sotaque
Custo$10–24/mês (aproximado, 2026)
Best forCriadores solo que querem legendas animadas com efeito pop e nunca saem do editor CapCut/Submagic.

Preço aproximado em maio de 2026. Contagens de idioma baseadas nas páginas de suporte publicadas de cada fornecedor.

Específico para TikTok

Três coisas que pegam as pessoas em ferramentas genéricas de transcrição.

Áudio do TikTok não é áudio de podcast. Essas são as diferenças que vale ativar antes de rodar o trabalho.

O que dá errado

  1. 1A música de fundo é transcrita como fala. O ASR genérico ouve letras e as escreve ao lado da voz — seu arquivo de legenda fica inutilizável.
  2. 2Gíria e apelidos do criador (@nome de usuário, 'rizz', 'fanum tax', nomes de produtos) voltam com erros fonéticos ou autocorrigidos para a palavra errada.
  3. 3Ganchos rápidos — os primeiros três segundos onde criadores empilham 15 palavras para vencer o swipe — são cortados ou comprimidos porque o ASR ainda está aquecendo.

O que ativar aqui

  1. 1Ative o isolamento de voz no formulário de trabalho. Separamos a faixa de voz da música antes de transcrever, para que áudio em tendência não contamine as legendas.
  2. 2Cole apelidos, nomes de marca e vocabulário específico do criador em Vocabulário personalizado. Passamos como uma dica de reconhecimento — maiúsculas e ortografia voltam corretas.
  3. 3Defina o formato de legenda para short-form (máx. 3 palavras por linha, 1,2 seg por sinal). O SRT sai pré-formatado para vídeo vertical sem quebras de linha manuais.

Configurações de trabalho recomendadas para TikTok

Cole uma URL de TikTok e essas configurações ficam ativas por padrão. Sobrescreva por trabalho no formulário.

Fonte
URL pública · áudio extraído no servidor
Isolamento de voz
Ativado (faixa de música suprimida)
Idioma
Detecção automática · 100+ suportados
Formato de legenda
Short-form · 3 palavras/linha · 1,2s de sinais
Palavras de preenchimento
Mantidas (criadores dependem delas)
Exportação
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% em voz-over limpa. Clipes com muita música caem de forma previsível.

O limite é definido por quão alta é a música de fundo e quão rápido o criador fala. Voz-over gravada separadamente e colocada sobre uma pista silenciosa é o melhor caso; tendências de sincronização labial e duetos são os piores. Os números abaixo vêm de URLs reais do TikTok executadas através de nosso pipeline.

94%
Voz-over · pista de música silenciosa

Criador gravou no microfone, música fica 15-20 dB abaixo da voz. Conteúdo educacional tipo apresentação e receita fica nessa faixa.

91%
Câmera ligada · microfone do telefone · sem música

Vídeo tipo selfie falando, sem trilha sonora. Microfone do telefone e reverberação do ambiente custam alguns pontos versus voz-over.

85%
Áudio em tendência alto sobre voz

Voz e música dentro de 6 dB. Hooks rápidos e nomes de marca têm perdas — espere uma limpeza de 1 minuto.

78%
Duetos, stitches, clips lip-sync

Duas faixas de áudio sobrepostas ou letras de música sendo sincronizadas. Transcrevemos o que é falado; letras são sinalizadas, não reescritas.

Perguntas comuns

8 coisas que as pessoas perguntam sobre transcrição de TikTok.

01Preciso baixar o TikTok primeiro?+
Não. Cole a URL pública do vídeo (o link de compartilhamento do app TikTok) e extraímos o áudio do lado do servidor. Se o vídeo for privado ou bloqueado por região, você precisará baixar o MP4 e enviá-lo — não podemos contornar as regras de acesso do TikTok.
02Você transcreverá a letra da música ou apenas a voz do criador?+
Apenas a voz falada. O isolamento de voz suprime a faixa de música antes da transcrição, e letras de áudio em tendência são sinalizadas na saída JSON em vez de serem escritas na faixa de legenda. Você pode desativar o isolamento se quiser especificamente letras.
03Posso obter um SRT formatado para vídeo short-form vertical?+
Sim. A predefinição de legenda short-form divide os sinais em aproximadamente 3 palavras por linha e 1,2 segundos por sinal — o ritmo que se encaixa na zona segura 9:16 sem sobrepor a interface. SRT padrão (uma frase por sinal) também está disponível.
04E quanto a duetos e stitches com duas vozes?+
A diarização acústica separa as duas vozes e as rotula como Speaker 1 e Speaker 2. A precisão cai 5-10 pontos quando as faixas de áudio se sobrepõem bastante — esse é o pior caso em nossos dados.
05Funciona com criadores que não são de língua inglesa?+
Sim — 100+ idiomas com detecção automática. Criadores de espanhol, português, indonésio, vietnamita e árabe retornam na mesma faixa de precisão que inglês. Code-switching (misturar dois idiomas no meio de uma frase) é detectado e rotulado por segmento.
06Quanto tempo até a transcrição ficar pronta?+
Menos de cinco minutos para um TikTok padrão de 30-90 segundos, geralmente menos de dois. TikToks de forma mais longa (3-10 minutos) terminam em aproximadamente 1/10 do tempo real.
07Posso processar em massa o feed inteiro de um criador?+
Sim, via API ou colando uma lista de URLs no dashboard. Limitamos a taxa de coleta de URL educadamente para que o TikTok não nos bloqueie — espere ~30 vídeos no primeiro lote, depois throughput constante a partir daí.
08Isso é permitido nos termos do TikTok?+
Apenas buscamos vídeos públicos através de seus endpoints de compartilhamento público — da mesma forma que uma visualização do navegador faz. Não contornamos contas privadas ou muros de login. Se você está transcrevendo conteúdo de outra pessoa para uso comercial, regras de fair-use e plataforma são para você verificar.

Cole uma URL de TikTok. Veja o que sai.

30 minutos grátis por mês. Sem cartão. SRT, VTT, 100+ idiomas, todas as exportações incluídas.

Começar grátis