Transcripción de TikTok.Pega un enlace, obtén subtítulos.

Pega una URL de vídeo de TikTok. Extrae el audio del lado del servidor y devuelve texto con marca de tiempo más archivos de subtítulos SRT y VTT — listos para volver a subir o grabar.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

URL pública entra. Subtítulos salen.

Pega cualquier enlace de vídeo de TikTok público. Extraemos la pista de audio, ejecutamos detección de idioma, y transmitimos los subtítulos mientras la música de fondo sigue de fondo bajo la voz.

URL de vídeo de TikTokREC 1 voz · 0:47 · vertical 9:16
auto-detectado en-US44,1 kHz · música de fondo -18 dB
~90s
Subtítulos · transmisión94% de precisión
S1

Vale, entonces el secreto del tofu crujiente que nadie te dice — presiónalo durante diez minutos, no dos.

S1

Luego almidón de maíz, no harina. Mézcla, no empolves.

S1

Freidora de aire a 400 durante doce minutos, voltea a mitad de camino.

S1

Comenta 'tofu' y te envío la receta completa de la salsa.

94% en voz superpuesta de creadorSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Subtítulos automáticos de TikTok. CapCut o Submagic. O nosotros.

TikTok incluye subtítulos automáticos en el editor. CapCut y Submagic añaden subtítulos con estilo y animación para volver a subir. Te damos la transcripción bruta más SRT/VTT limpio — trae tu propio editor.

Option 01

Subtítulos automáticos de TikTok

Integrado en el editor de TikTok. Activa, aparecen los subtítulos. Sin archivo que llevarte a otro lugar.

RequiereSube a través de la app de TikTok
Cobertura de idiomas~40 idiomas, inglés más fuerte
ExportaciónNinguna — solo grabados
Edita antes de publicarEditor de texto en la app
Manejo de músicaPierde letras, distorsiona voz sobre pistas ruidosas
CostoGratis
Best forCreadores que solo necesitan subtítulos dentro de TikTok y nunca vuelven a publicar en Reels o Shorts.
Option 02

Transcription.Solutions

Pega la URL pública. Obtén un archivo de transcripción más SRT/VTT que puedas soltar en cualquier editor o volver a subir a cualquier lugar.

RequiereURL de TikTok pública — sin inicio de sesión
Cobertura de idiomas100+ con autodetección
ExportaciónSRT · VTT · DOCX · TXT · JSON
Edita antes de publicarEditor web, luego vuelve a exportar
Manejo de músicaAislamiento de voz en pistas ruidosas
Costo · por minuto$0.03
Best forCreadores que publican en múltiples plataformas (Reels/Shorts/YouTube), agencias que reutilizan TikToks de clientes, investigadores archivando tendencias.
Option 03

CapCut / Submagic

Subtítulos estilizados y animados ajustados para formato corto. Bloqueados en su editor, enfocados en inglés.

RequiereInstalación de app + pago por exportación
Cobertura de idiomas~20 fuertes, otros irregulares
ExportaciónMP4 con grabado, SRT de pago
Edita antes de publicarSolo dentro de su línea de tiempo
Manejo de músicaAjustado a inglés, pierde voz acentuada
Costo$10–24/mes (aproximado, 2026)
Best forCreadores individuales que quieren subtítulos con animación estilo salto de palabras y nunca salen del editor de CapCut/Submagic.

Precios aproximados a partir de mayo de 2026. Conteos de idiomas basados en páginas de soporte publicadas de cada proveedor.

Específico de TikTok

Tres cosas que perjudican a la gente con herramientas de transcripción genéricas.

El audio de TikTok no es audio de podcast. Estas son las diferencias que vale la pena revisar antes de encolar el trabajo.

Qué sale mal

  1. 1La música de fondo se transcribe como habla. El ASR genérico escucha letras y las escribe junto con la voz — tu archivo de subtítulos se vuelve inutilizable.
  2. 2Jerga de creador e identificadores (@usuario, 'rizz', 'fanum tax', nombres de productos) vuelven deletreados incorrectamente foneticamente o autocorregidos a la palabra equivocada.
  3. 3Ganchos rápidos — los primeros tres segundos donde creadores apilan 15 palabras para ganar el desliz — se recortan o comprimen porque el ASR aún se está calentando.

Qué ajustar aquí

  1. 1Activa Aislamiento de voz en el formulario de trabajo. Separamos la pista de voz de la música antes de transcribir, así el audio popular no contamina los subtítulos.
  2. 2Pega identificadores, nombres de marca y vocabulario específico del creador en Vocabulario personalizado. Lo pasamos como pista de reconocimiento — mayúsculas y ortografía vuelven correctas.
  3. 3Establece Formato de subtítulo en formato corto (máximo 3 palabras por línea, 1.2 seg por cue). El SRT sale preformateado para vídeo vertical sin saltos de línea manuales.

Configuración de trabajo recomendada para TikTok

Pega una URL de TikTok y estos se activan por defecto. Anula por trabajo desde el formulario.

Fuente
URL pública · audio extraído del lado del servidor
Aislamiento de voz
Activo (música de fondo suprimida)
Idioma
Autodetección · 100+ soportados
Formato de subtítulo
Formato corto · 3 palabras/línea · cues de 1.2s
Palabras de relleno
Conservadas (creadores dependen de ellas)
Exportación
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% en voz superpuesta limpia. Los clips con mucha música bajan predeciblemente.

El límite se establece por lo fuerte que sea la música de fondo y qué tan rápido hable el creador. Voz superpuesta grabada por separado y colocada sobre una pista tranquila es el mejor caso; las tendencias lip-sync y duetos son los peores. Los números a continuación provienen de URLs de TikTok reales procesadas a través de nuestro sistema.

94%
Voz superpuesta · música de fondo tranquila

Creador grabado en micrófono, música 15-20 dB por debajo de la voz. Contenido educativo hablado y recetas llegan aquí.

91%
En cámara · micrófono de teléfono · sin música

Cabeza parlante estilo selfie, sin pista de fondo. Micrófono de teléfono y reverberación de sala cuestan algunos puntos versus voz superpuesta.

85%
Audio popular ruidoso bajo la voz

Voz y música dentro de 6 dB. Ganchos rápidos y nombres de marca se dañan — espera una pasada de limpieza de 1 minuto.

78%
Duetos, stitches, clips lip-sync

Dos pistas de audio superpuestas o letra de canción siendo movida con los labios. Transcribimos lo que se habla; las letras de canciones se marcan, no se reescriben.

Preguntas frecuentes

8 cosas que la gente pregunta sobre transcripción de TikTok.

01¿Necesito descargar el TikTok primero?+
No. Pega la URL del vídeo público (el enlace de compartir de la app de TikTok) y extraemos el audio del lado del servidor. Si el vídeo es privado o está bloqueado por región, necesitarás descargar el MP4 tú mismo y subirlo — no podemos eludir las reglas de acceso de TikTok.
02¿Transcribirás la letra de la canción o solo la voz del creador?+
Solo la voz hablada. El aislamiento de voz suprime la música de fondo antes de la transcripción, y las letras de audio popular se marcan en la salida JSON en lugar de escribirse en la pista de subtítulos. Puedes desactivar aislamiento si específicamente quieres letras.
03¿Puedo obtener un SRT formateado para vídeo vertical de formato corto?+
Sí. El preset de subtítulos de formato corto divide cues en aproximadamente 3 palabras por línea y 1.2 segundos por cue — el ritmo que se adapta a la zona segura 9:16 sin superponer UI. El SRT estándar (una oración por cue) también está disponible.
04¿Qué hay con duetos y stitches con dos voces?+
La diarización acústica separa las dos voces y las etiqueta como Locutor 1 y Locutor 2. La precisión baja 5-10 puntos cuando las pistas de audio se superponen fuertemente — ese es el peor caso en nuestros datos.
05¿Maneja creadores que no hablan inglés?+
Sí — 100+ idiomas con autodetección. Creadores de español, portugués, indonesio, vietnamita y árabe vuelven con aproximadamente la misma banda de precisión que inglés. El cambio de código (mezclar dos idiomas a mitad de oración) se detecta y etiqueta por segmento.
06¿Cuánto tiempo hasta que la transcripción esté lista?+
Menos de cinco minutos para un TikTok estándar de 30-90 segundos, generalmente menos de dos. TikToks de formato largo (3-10 minutos) terminan en aproximadamente 1/10 del tiempo real.
07¿Puedo procesar en lote todo el feed de un creador?+
Sí, a través de la API o pegando una lista de URLs en el dashboard. Limitamos amablemente el fetcher de URL para que TikTok no nos bloquee — espera ~30 vídeos en el primer lote, luego throughput estable desde allí.
08¿Está permitido bajo los términos de TikTok?+
Solo buscamos vídeos públicos a través de sus endpoints de compartir público — la misma forma que hace una vista previa del navegador. No eludimos cuentas privadas o muros de inicio de sesión. Si transcribes contenido de otra persona para uso comercial, la fair use y las reglas de plataforma dependen de ti verificar.

Pega una URL de TikTok. Mira qué sale.

30 minutos gratis cada mes. Sin tarjeta. SRT, VTT, 100+ idiomas, todas las exportaciones incluidas.

Comienza gratis