Trascrizione TikTok.Incolla un link, ottieni didascalie.

Incolla un URL di video TikTok. Estraiamo l'audio lato server e restituiamo testo con timestamp più file didascalie SRT e VTT — pronti per il re-upload o da bruciare in.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Guarda cosa esce

URL pubblico dentro. Didascalie fuori.

Incolla qualsiasi link pubblico di video TikTok. Estraiamo la traccia audio, eseguiamo il rilevamento della lingua, e trasmettiamo le didascalie mentre la musica di sottofondo continua sotto la voce.

URL video TikTokREC 1 voce · 0:47 · verticale 9:16
rilevamento automatico en-US44.1 kHz · letto musicale -18 dB
~90s
Didascalie · trasmesse94% di accuratezza
S1

Ok quindi il segreto del tofu croccante che nessuno ti dice — pressa per dieci minuti, non due.

S1

Poi amido di mais, non farina. Mescola, non spolverare.

S1

Friggitrice ad aria a 400 per dodici minuti, capovolgi a metà.

S1

Commenta 'tofu' e ti invierò la ricetta salsa completa.

94% sulla voce del creatoreSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre opzioni reali · confronto onesto

Didascalie automatiche TikTok. CapCut o Submagic. O noi.

TikTok fornisce didascalie automatiche nell'editor. CapCut e Submagic aggiungono didascalie stile e animate per il re-upload. Noi forniamo la trascrizione grezza più SRT/VTT pulito — porta il tuo editor.

Option 01

Didascalie automatiche TikTok

Integrate nell'editor TikTok. Attiva, le didascalie appaiono. Nessun file che puoi portare altrove.

RichiedeCaricamento tramite app TikTok
Copertura lingua~40 lingue, EN più forte
EsportazioneNessuna — solo bruciate
Modifica prima della pubblicazioneEditor di testo in-app
Gestione musicaManca i testi, distorce la voce su letti forti
CostoGratis
Best forCreator che hanno bisogno di didascalie solo dentro TikTok e non ripubblicano mai su Reels o Shorts.
Option 02

Transcription.Solutions

Incolla l'URL pubblico. Ottieni un file trascrizione più SRT/VTT che puoi inserire in qualsiasi editor o ripublicare ovunque.

RichiedeURL TikTok pubblico — nessun login
Copertura lingua100+ con rilevamento automatico
EsportazioneSRT · VTT · DOCX · TXT · JSON
Modifica prima della pubblicazioneEditor web, poi ri-esporta
Gestione musicaIsolamento voce su letti rumorosi
Costo · per min$0.03
Best forCreator che ripubblicano su Reels/Shorts/YouTube, agenzie che riadattano TikTok di client, ricercatori che archiviano trend.
Option 03

CapCut / Submagic

Didascalie stile e animate sintonizzate per short-form. Bloccate al loro editor, inglese-prima.

RichiedeInstallazione app + pagato per l'esportazione
Copertura lingua~20 forti, altri difettosi
EsportazioneMP4 con bruciatura, SRT se pagato
Modifica prima della pubblicazioneSolo dentro la loro timeline
Gestione musicaSintonizzata EN, cade su voce con accento
Costo$10–24/mese (approssimativo, 2026)
Best forCreator solitari che vogliono didascalie con animazione pop e non lasciano mai l'editor CapCut/Submagic.

Prezzi approssimativi a maggio 2026. Conteggi lingua basati sulle pagine di supporto pubblicate di ciascun fornitore.

Specifico per TikTok

Tre problemi su strumenti di trascrizione generici.

L'audio TikTok non è audio podcast. Queste sono le differenze che vale la pena capovolgere prima di mettere in coda il lavoro.

Cosa non funziona

  1. 1La musica di sottofondo viene trascritta come parlato. L'ASR generico sente i testi e li scrive insieme alla voce — il tuo file didascalia diventa inutilizzabile.
  2. 2Lo slang del creatore e gli handle (@username, 'rizz', 'fanum tax', nomi di prodotti) tornano indietro con errori fonetici o autocorretti alla parola sbagliata.
  3. 3Gli hook veloci — i primi tre secondi in cui i creator impilano 15 parole per battere lo scorrimento — vengono tagliati o compressi perché l'ASR sta ancora scaldandosi.

Cosa voltare qui

  1. 1Attiva Isolamento voce nel modulo di lavoro. Separiamo lo stelo vocale dalla musica prima di trascrivere, quindi l'audio in trend non inquina le didascalie.
  2. 2Incolla handle, nomi di marchi e vocabolario specifico del creatore in Vocabolario personalizzato. Lo passiamo come suggerimento riconoscente — maiuscole e ortografia tornano corrette.
  3. 3Imposta il Formato didascalia su short-form (max 3 parole per riga, 1,2 sec per cue). L'SRT esce pre-formattato per video verticale senza interruzioni di riga manuali.

Impostazioni di lavoro consigliate per TikTok

Incolla un URL TikTok e questi si attivano per impostazione predefinita. Sostituisci per lavoro dal modulo.

Sorgente
URL pubblico · audio estratto lato server
Isolamento voce
Attivo (letto musicale soppresso)
Lingua
Rilevamento automatico · 100+ supportate
Formato didascalia
Short-form · 3 parole/riga · 1,2s cue
Parole di riempimento
Mantenute (i creator si affidano a loro)
Esportazione
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% con voice-over pulito. Le clip ricche di musica calano in modo prevedibile.

Il soffitto è impostato da quanto forte è il letto musicale e da quanto velocemente parla il creatore. La voice-over registrata separatamente e depositata su un letto tranquillo è il miglior caso; i trend lip-sync e i duetti sono il peggiore. I numeri di seguito provengono da URL TikTok reali eseguiti attraverso la nostra pipeline.

94%
Voice-over · letto musicale tranquillo

Creator registrato su microfono, musica siede 15-20 dB sotto voce. Contenuti educativi talking-head e ricette arrivano qui.

91%
On-camera · microfono del telefono · nessuna musica

Testa parlante in stile selfie, nessuna traccia di backup. Microfono del telefono e riverbero della stanza costano alcuni punti rispetto alla voice-over.

85%
Audio in trend forte sotto voce

Voce e musica entro 6 dB. Hook veloci e nomi di marchi subiscono colpi — aspettati un passaggio di pulizia di 1 minuto.

78%
Duetti, stitches, clip lip-sync

Due tracce audio sovrapposte o testi di canzoni che vengono articolati. Trascriviamo ciò che è parlato; i testi delle canzoni sono segnalati, non riscritti.

Domande comuni

8 domande sulla trascrizione TikTok.

01Devo scaricare il TikTok per primo?+
No. Incolla l'URL del video pubblico (il link di condivisione dall'app TikTok) e estraiamo l'audio lato server. Se il video è privato o bloccato dalla regione, dovrai scaricare l'MP4 tu stesso e caricarlo — non possiamo aggirare le regole di accesso di TikTok.
02Trascriverai i testi della canzone o solo la voce del creatore?+
Solo la voce parlata. L'isolamento voce sopprime il letto musicale prima della trascrizione, e i testi audio in trend vengono contrassegnati nell'output JSON piuttosto che scritti nella traccia di didascalia. Puoi disattivare l'isolamento se vuoi specificamente i testi.
03Posso ottenere un SRT formattato per video short-form verticale?+
Sì. Il preset della didascalia short-form interrompe i cue a circa 3 parole per riga e 1,2 secondi per cue — il ritmo che si adatta alla zona di sicurezza 9:16 senza sovrapporre l'interfaccia utente. L'SRT standard (una frase per cue) è anche disponibile.
04Che dire di duetti e stitches con due voci?+
La diarizzazione acustica separa le due voci e le etichetta Speaker 1 e Speaker 2. L'accuratezza cala di 5-10 punti quando le tracce audio si sovrappongono pesantemente — questo è il peggiore caso nei nostri dati.
05Gestisce i creator non inglesi?+
Sì — 100+ lingue con rilevamento automatico. Creator spagnoli, portoghesi, indonesiani, vietnamiti e arabi tornano indietro con approssimativamente la stessa banda di accuratezza dell'inglese. Il code-switching (mischiare due lingue a metà frase) viene rilevato ed etichettato per segmento.
06Quanto tempo prima che la trascrizione sia pronta?+
Meno di cinque minuti per un TikTok standard di 30-90 secondi, solitamente sotto due. I TikTok più lunghi (3-10 minuti) finiscono in circa 1/10 del tempo reale.
07Posso elaborare in blocco l'intero feed di un creatore?+
Sì, tramite l'API o incollando un elenco di URL nella dashboard. Limitiamo la velocità dell'acquisitore URL in modo educato in modo che TikTok non ci blocchi — aspettati ~30 video nel primo batch, quindi throughput costante da lì.
08Questo è consentito secondo i termini di TikTok?+
Estraiamo solo video pubblici tramite i loro endpoint pubblici di condivisione — allo stesso modo di un'anteprima del browser. Non aggiriamo account privati o muri di accesso. Se stai trascrivendo il contenuto di qualcun altro per uso commerciale, il fair-use e le regole della piattaforma dipendono da te verificare.

Incolla un URL TikTok. Scopri cosa esce.

30 minuti gratis ogni mese. Nessuna carta. SRT, VTT, 100+ lingue, tutte le esportazioni incluse.

Inizia gratis