Transcripció de TikTok.Enganxa un enllaç, obtén captions.

Deixa una URL de vídeo de TikTok. Extraiem l'àudio del servidor i retornem text amb marca de temps més fitxers de caption SRT i VTT — llestos per a re-pujada o incrust.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira què surt

URL pública dins. Captions fora.

Enganxa qualsevol enllaç de vídeo de TikTok públic. Extraiem la pista d'àudio, executem detecció de llengua, i enviem captions mentre la música de fons segueix sonant per sota de la veu.

URL de vídeo de TikTokREC 1 veu · 0:47 · vertical 9:16
auto-detectat en-US44,1 kHz · pista de música -18 dB
~90s
Captions · en directe94% precisió
S1

D'acord, el secret del tofu cruixent que ningú t'ho diu — pressiona'l deu minuts, no dos.

S1

Llavors fécula de blat de moro, no farina. Agita-ho, no el pols.

S1

Freidora d'aire a 400 graus durant dotze minuts, dóna-li la volta a la meitat.

S1

Comenta 'tofu' i t'enviaré la recepta completa de la salsa.

94% sobre la veu en off del creadorSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcions reals · comparació honest

Auto-captions de TikTok. CapCut o Submagic. O nosaltres.

TikTok inclou auto-captions a l'editor. CapCut i Submagic afegeixen captions estilitzats i animats per a re-pujada. Tu obtens el transcript brut més SRT/VTT net — porta el teu propi editor.

Option 01

Auto-captions de TikTok

Integrat a l'editor de TikTok. Activa-ho, apareixen els captions. Cap fitxer que pots dur a una altra part.

RequereixCarrega a través de l'app TikTok
Cobertura de llengües~40 idiomes, EN més forte
ExportacióCap — només incrustats
Edita abans de publicarEditor de text dins de l'app
Maneig de músicaEs perd les lletres, distorsiona veu sobre pistes altes
CostGratis
Best forCreadors que només necessiten captions dins TikTok i mai republiquen als Reels o Shorts.
Option 02

Transcription.Solutions

Enganxa l'URL pública. Obtén el fitxer de transcript més SRT/VTT que pots deixar caure a qualsevol editor o re-pujar a qualsevol lloc.

RequereixURL pública de TikTok — sense connexió
Cobertura de llengües100+ amb auto-detecció
ExportacióSRT · VTT · DOCX · TXT · JSON
Edita abans de publicarEditor web, llavors re-exporta
Maneig de músicaAïllament de veu en pistes ruidoses
Cost · per minut$0.03
Best forCreadors que publiquen a Reels/Shorts/YouTube, agències que reutilitzen TikToks de clients, investigadors que arxiven tendències.
Option 03

CapCut / Submagic

Captions estilitzats i animats ajustats per a format curt. Bloquejats al seu editor, prioritat anglès.

RequereixInstal·lació d'app + pagament per export
Cobertura de llengües~20 forts, altres irregulars
ExportacióMP4 amb incrust, SRT de pagament
Edita abans de publicarNomés dins la seva línia de temps
Maneig de músicaAjustat a EN, cau en accents
Cost$10–24/mes (aproximat, 2026)
Best forCreadors solitaris que volen captions animats de paraula emergent i mai surten de l'editor CapCut/Submagic.

Preus aproximats a partir de maig de 2026. Comptatges de llengües basats en les pàgines de suport publicades de cada proveïdor.

Específic per a TikTok

Tres coses que mosseguen la gent amb eines de transcripció genèriques.

L'àudio de TikTok no és com l'àudio de pòdcast. Aquestes són les diferències que val la pena ajustar abans de posar el treball a la cua.

Què surt malament

  1. 1La música de fons es transcriu com a parla. L'ASR genèric escoltes lletres i les escriu al costat de la veu — el teu fitxer de caption es torna inutilitzable.
  2. 2L'argot del creador i els identificadors (@username, 'rizz', 'fanum tax', noms de producte) tornen filtràtics o auto-corregits a la paraula equivocada.
  3. 3Els gancs ràpids — el primer tres segons on els creadors apilen 15 paraules per superar el deslliç — es retallen o es comprimeixen perquè l'ASR encara s'està escalfant.

Què calfr aquí

  1. 1Activa Aïllament de veu al formulari de treball. Separem la pista de veu de la música abans de transcriure, així l'àudio de tendència no contamina els captions.
  2. 2Enganxa els identificadors, els noms de marca i el vocabulari específic del creador a Vocabulari personalitzat. Ho passem com a suggeriment del reconeixedor — el cas i l'ortografia tornen correctes.
  3. 3Estableix el Format de caption a format curt (màx 3 paraules per línia, 1,2 seg per cop). L'SRT surt pre-formatat per a vídeo vertical sense salts de línia manuals.

Configuració de treball recomanada per a TikTok

Enganxa una URL de TikTok i aquests s'activen per defecte. Substitueix per treball des del formulari.

Source
URL pública · àudio extret del servidor
Voice isolation
Activat (pista de música suprimida)
Language
Auto-detectar · 100+ suportats
Caption format
Format curt · 3 paraules/línia · senyals d'1,2s
Filler words
Mantinguts (els creadors es basen en ells)
Export
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% en veu en off neta. Els clips amb molta música calen predictablement.

El límit està establert per la força de la pista de música i la velocitat de parla del creador. La veu en off gravada separadament i deixada caure sobre una pista tranquil·la és el millor; les tendències de sincronització de llavis i duets són el pitjor. Els números de sota provenen de URLs reals de TikTok executades pel nostre sistema.

94%
Veu en off · pista de música tranquil·la

Creador gravat en micròfon, la música és 15-20 dB per sota de la veu. El contingut educatiu de cap parlant i les receptes cauen aquí.

91%
Davant de la càmera · micròfon del telèfon · sense música

Cap parlant estil selfie, sense pista de suport. El micròfon del telèfon i la reverberació de la sala costen alguns punts respecte a la veu en off.

85%
Àudio de tendència alt sota la veu

Veu i música dins de 6 dB. Els gancs ràpids i els noms de marca reben cops — espera una passada de neteja d'1 minut.

78%
Duets, costures, clips de sincronització de llavis

Dues pistes d'àudio superposades o lletres de cançó que es mouen. Transcrivim el que es parla; les lletres de cançó es marquen, no es reescriuen.

Preguntes freqüents

8 coses que demanen sobre transcripció de TikTok.

01Necessito descarregar el TikTok primer?+
No. Enganxa l'URL del vídeo públic (l'enllaç de compartir de l'app TikTok) i extraiem l'àudio del servidor. Si el vídeo és privat o bloquejat per regió, hauràs de descarregar el MP4 tu mateix i pujar-lo — no podem eludir les regles d'accés de TikTok.
02Transcriureu les lletres de la cançó o només la veu del creador?+
Només la veu parlada. L'aïllament de veu suprimeix la pista de música abans de la transcripció, i les lletres d'àudio de tendència es marquen a la sortida JSON en lloc d'escriure's a la pista de caption. Pots desactivar l'aïllament si específicament vols lletres.
03Puc obtenir un SRT formatat per a vídeo de format curt vertical?+
Sí. El sistema predefinit de caption de format curt trenca les senyals en aproximadament 3 paraules per línia i 1,2 segons per senyal — el ritme que s'ajusta a la zona segura 9:16 sense superposar interfície. SRT estàndard (una frase per senyal) també està disponible.
04Què tal els duets i les costures amb dues veus?+
La diarització acústica separa les dues veus i les etiqueta com Altaveu 1 i Altaveu 2. La precisió cau 5-10 punts quan les pistes d'àudio es superposen molt — aquest és el pitjor cas en les nostres dades.
05Maneja creadors no anglòfons?+
Sí — 100+ idiomes amb auto-detecció. Els creadors espanyol, portuguès, indonesi, vietnamita i àrab tornen aproximadament a la mateixa banda de precisió que anglès. L'intercanvi de codi (mesclar dos idiomes a la meitat de la frase) es detecta i s'etiqueta per segment.
06Quant de temps fins que el transcript estigui llest?+
Menys de cinc minuts per a un TikTok estàndard de 30-90 segons, normalment menys de dos. Els TikToks de forma més llarga (3-10 minuts) es completen en aproximadament 1/10 del temps real.
07Puc processar en bloc l'alimentació completa d'un creador?+
Sí, mitjançant l'API o enganxant una llista d'URLs al panell de control. Limitem la taxa del buscador d'URL de manera educada perquè TikTok no ens bloquegi — espera ~30 vídeos al primer lot, llavors un rendiment constant des de llavors.
08Això està permès segons els termes de TikTok?+
Només extraiem vídeos públics a través dels seus punts finals de compartir públics — de la mateixa manera que ho fa una vista prèvia del navegador. No eludim comptes privats ni murs de connexió. Si transcrius el contingut d'algú més per a ús comercial, les regles de fair-use i la plataforma són responsabilitat teva de verificar.

Enganxa una URL de TikTok. Mira què surt.

30 minuts gratis cada mes. Sense targeta. SRT, VTT, 100+ idiomes, totes les exportacions incloses.

Comença gratis