Transcripción de TikTok.Pega un enlace, obtén subtítulos.

Suelta una URL de video de TikTok. Extraemos el audio del lado del servidor y devolvemos texto con marca de tiempo más archivos de subtítulos SRT y VTT — listos para volver a subir o grabar.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

URL pública adentro. Subtítulos afuera.

Pega cualquier enlace de video de TikTok público. Obtenemos la pista de audio, ejecutamos la detección del idioma y transmitimos subtítulos mientras la música de fondo sigue sonando bajo la voz.

URL de video de TikTokREC 1 voz · 0:47 · vertical 9:16
detectado automáticamente en-US44,1 kHz · cama de música -18 dB
~90s
Subtítulos · transmisión en tiempo real94% de precisión
S1

Bien, así que el secreto del tofu crujiente que nadie te cuenta — presiónalo durante diez minutos, no dos.

S1

Luego maicena, no harina. Revuélvelo, no lo espolvorees.

S1

Freidora de aire a 400 durante doce minutos, voltea a la mitad.

S1

Comenta 'tofu' y te enviaré la receta completa de la salsa.

94% en la voz en off del creadorSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Subtítulos automáticos de TikTok. CapCut o Submagic. O nosotros.

TikTok incluye subtítulos automáticos en el editor. CapCut y Submagic añaden subtítulos estilizados y animados para volver a subir. Te damos la transcripción cruda más SRT/VTT limpio — trae tu propio editor.

Option 01

Subtítulos automáticos de TikTok

Integrado en el editor de TikTok. Actívalo, aparecen los subtítulos. Sin archivo que puedas llevar a otro lugar.

RequiereSubir a través de la aplicación de TikTok
Cobertura de idiomas~40 idiomas, EN más fuerte
ExportaciónNinguna — solo grabada
Editar antes de publicarEditor de texto en la aplicación
Manejo de músicaPierde letras, distorsiona la voz sobre fondos fuertes
CostoGratis
Best forCreadores que solo necesitan subtítulos dentro de TikTok y nunca republican en Reels o Shorts.
Option 02

Transcription.Solutions

Pega la URL pública. Obtén un archivo de transcripción más SRT/VTT que puedes soltar en cualquier editor o volver a subir en cualquier lugar.

RequiereURL pública de TikTok — sin inicio de sesión
Cobertura de idiomas100+ con detección automática
ExportaciónSRT · VTT · DOCX · TXT · JSON
Editar antes de publicarEditor web, luego volver a exportar
Manejo de músicaAislamiento de voz en fondos ruidosos
Costo · por min$0.03
Best forCreadores que publican en Reels/Shorts/YouTube, agencias que reutilizan TikToks de clientes, investigadores que archivan tendencias.
Option 03

CapCut / Submagic

Subtítulos estilizados y animados ajustados para contenido corto. Bloqueados en su editor, inglés primero.

RequiereInstalación de aplicación + pago para exportar
Cobertura de idiomas~20 fuertes, otros inconsistentes
ExportaciónMP4 con grabación, SRT de pago
Editar antes de publicarSolo dentro de su línea de tiempo
Manejo de músicaAjustado a EN, cae en voz acentuada
Costo$10–24/mes (aproximado, 2026)
Best forCreadores individuales que quieren subtítulos de palabra-pop animados y nunca salen del editor de CapCut/Submagic.

Precio aproximado a partir de mayo de 2026. Conteos de idiomas basados en las páginas de soporte publicadas de cada proveedor.

Específico de TikTok

Tres cosas que muerde a la gente en herramientas genéricas de transcripción.

El audio de TikTok no es audio de podcast. Estas son las diferencias que vale la pena cambiar antes de encolar el trabajo.

Qué sale mal

  1. 1La música de fondo se transcribe como discurso. La ASR genérica escucha letras y las escribe junto a la voz — tu archivo de subtítulos se vuelve inutilizable.
  2. 2La jerga del creador y los identificadores (@username, 'rizz', 'fanum tax', nombres de productos) vuelven con errores ortográficos fonéticos o autocorrección a la palabra equivocada.
  3. 3Ganchos rápidos — los primeros tres segundos donde los creadores apilan 15 palabras para vencer el deslizamiento — se recortan o comprimen porque el ASR aún se está calentando.

Qué cambiar aquí

  1. 1Activa Aislamiento de voz en el formulario del trabajo. Separamos el tallo de voz de la música antes de transcribir, para que el audio de tendencia no contamine los subtítulos.
  2. 2Pega identificadores, nombres de marca y vocabulario específico del creador en Vocabulario personalizado. Lo pasamos como una sugerencia de reconocedor — las mayúsculas y la ortografía vuelven correctas.
  3. 3Establece el Formato de subtítulos en formato corto (máx 3 palabras por línea, 1,2 seg por cue). El SRT sale preformateado para video vertical sin saltos de línea manuales.

Configuración de trabajo recomendada para TikTok

Pega una URL de TikTok y estas se activan por defecto. Anula por trabajo desde el formulario.

Fuente
URL pública · audio extraído del lado del servidor
Aislamiento de voz
Activado (cama de música suprimida)
Idioma
Detección automática · más de 100 soportados
Formato de subtítulos
Formato corto · 3 palabras/línea · cues de 1,2s
Palabras de relleno
Mantenidas (los creadores confían en ellas)
Exportación
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% en voz en off limpio. Los clips pesados en música caen predeciblemente.

El techo está establecido por qué tan fuerte sea la cama de música y qué tan rápido hable el creador. La voz en off grabada por separado y caída sobre una cama tranquila es el mejor caso; las tendencias de sincronización de labios y duetos son las peores. Los números a continuación provienen de URLs reales de TikTok ejecutadas a través de nuestro pipeline.

94%
Voz en off · cama de música tranquila

Creador grabado en micrófono, la música se sitúa 15-20 dB debajo de la voz. El contenido educativo de cabeza parlante y recetas aterrizan aquí.

91%
En cámara · micrófono de teléfono · sin música

Cabeza parlante de estilo selfie, sin pista de respaldo. El micrófono del teléfono y la reverberación de la habitación cuesta algunos puntos versus voz en off.

85%
Audio de tendencia fuerte bajo la voz

Voz y música dentro de 6 dB. Los hooks rápidos y los nombres de marca reciben golpes — espera una pasada de limpieza de 1 minuto.

78%
Duetos, empalmes, clips de sincronización de labios

Dos pistas de audio superpuestas o letras de canciones siendo movidas. Transcribimos lo que se habla; las letras de canciones se marcan, no se reescriben.

Preguntas frecuentes

8 cosas que la gente pregunta sobre transcripción de TikTok.

01¿Necesito descargar el TikTok primero?+
No. Pega la URL del video público (el enlace para compartir de la aplicación de TikTok) y extraemos el audio del lado del servidor. Si el video es privado o está bloqueado por región, necesitarás descargar el MP4 tú mismo y subirlo — no podemos eludir las reglas de acceso de TikTok.
02¿Transcribirás las letras de la canción o solo la voz del creador?+
Solo la voz hablada. El aislamiento de voz suprime la cama de música antes de la transcripción, y las letras de audio de tendencia se marcan en la salida JSON en lugar de escribirse en la pista de subtítulos. Puedes desactivar el aislamiento si específicamente quieres letras.
03¿Puedo obtener un SRT formateado para video corto vertical?+
Sí. El preajuste de subtítulos de formato corto divide los cues en aproximadamente 3 palabras por línea y 1,2 segundos por cue — el ritmo que se ajusta a la zona segura de 9:16 sin superponer la interfaz de usuario. También está disponible SRT estándar (una oración por cue).
04¿Qué pasa con los duetos y empalmes con dos voces?+
La diarización acústica separa las dos voces y las etiqueta como Hablante 1 y Hablante 2. La precisión cae 5-10 puntos cuando las pistas de audio se superponen mucho — ese es el peor caso en nuestros datos.
05¿Maneja creadores que no hablan inglés?+
Sí — más de 100 idiomas con detección automática. Los creadores de español, portugués, indonesio, vietnamita y árabe vuelven en aproximadamente la misma banda de precisión que el inglés. El cambio de código (mezclar dos idiomas a mitad de oración) se detecta y etiqueta por segmento.
06¿Cuánto tiempo hasta que la transcripción esté lista?+
Menos de cinco minutos para un TikTok estándar de 30-90 segundos, generalmente menos de dos. Los TikToks de formato más largo (3-10 minutos) terminan en aproximadamente 1/10 del tiempo real.
07¿Puedo procesar en lote la alimentación completa de un creador?+
Sí, a través de la API o pegando una lista de URL en el panel de control. Limitamos la velocidad del buscador de URL amablemente para que TikTok no nos bloquee — espera ~30 videos en el primer lote, luego rendimiento constante desde allí.
08¿Esto está permitido según los términos de TikTok?+
Solo buscamos videos públicos a través de sus puntos finales de compartir público — de la misma manera que lo hace una vista previa del navegador. No eludimos cuentas privadas o muros de inicio de sesión. Si estás transcribiendo contenido de otra persona para uso comercial, el uso justo y las reglas de la plataforma corren por tu cuenta.

Pega una URL de TikTok. Mira qué sale.

30 minutos gratis cada mes. Sin tarjeta. SRT, VTT, más de 100 idiomas, todas las exportaciones incluidas.

Comenzar gratis