Trascrizione TikTok.Incolla un link, ottieni didascalie.

Incolla un URL di video TikTok. Estraiamo l'audio lato server e restituiamo testo con timestamp più file didascalie SRT e VTT — pronti per il re-upload o da bruciare in.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Guarda cosa esce

URL pubblico dentro. Didascalie fuori.

Incolla qualsiasi link pubblico di video TikTok. Estraiamo la traccia audio, eseguiamo il rilevamento della lingua, e trasmettiamo le didascalie mentre la musica di sottofondo continua sotto la voce.

URL video TikTokREC 1 voce · 0:47 · verticale 9:16

rilevamento automatico en-US44.1 kHz · letto musicale -18 dB

~90s

Didascalie · trasmesse94% di accuratezza

S1

Ok quindi il segreto del tofu croccante che nessuno ti dice — pressa per dieci minuti, non due.

S1

Poi amido di mais, non farina. Mescola, non spolverare.

S1

Friggitrice ad aria a 400 per dodici minuti, capovolgi a metà.

S1

Commenta 'tofu' e ti invierò la ricetta salsa completa.

94% sulla voce del creatoreSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Tre opzioni reali · confronto onesto

Didascalie automatiche TikTok. CapCut o Submagic. O noi.

TikTok fornisce didascalie automatiche nell'editor. CapCut e Submagic aggiungono didascalie stile e animate per il re-upload. Noi forniamo la trascrizione grezza più SRT/VTT pulito — porta il tuo editor.

Option 01

Didascalie automatiche TikTok

Integrate nell'editor TikTok. Attiva, le didascalie appaiono. Nessun file che puoi portare altrove.

RichiedeCaricamento tramite app TikTok

Copertura lingua~40 lingue, EN più forte

EsportazioneNessuna — solo bruciate

Modifica prima della pubblicazioneEditor di testo in-app

Gestione musicaManca i testi, distorce la voce su letti forti

CostoGratis

Best forCreator che hanno bisogno di didascalie solo dentro TikTok e non ripubblicano mai su Reels o Shorts.

Option 02

Transcription.Solutions

Incolla l'URL pubblico. Ottieni un file trascrizione più SRT/VTT che puoi inserire in qualsiasi editor o ripublicare ovunque.

RichiedeURL TikTok pubblico — nessun login

Copertura lingua100+ con rilevamento automatico

EsportazioneSRT · VTT · DOCX · TXT · JSON

Modifica prima della pubblicazioneEditor web, poi ri-esporta

Gestione musicaIsolamento voce su letti rumorosi

Costo · per min$0.03

Best forCreator che ripubblicano su Reels/Shorts/YouTube, agenzie che riadattano TikTok di client, ricercatori che archiviano trend.

Option 03

CapCut / Submagic

Didascalie stile e animate sintonizzate per short-form. Bloccate al loro editor, inglese-prima.

RichiedeInstallazione app + pagato per l'esportazione

Copertura lingua~20 forti, altri difettosi

EsportazioneMP4 con bruciatura, SRT se pagato

Modifica prima della pubblicazioneSolo dentro la loro timeline

Gestione musicaSintonizzata EN, cade su voce con accento

Costo$10–24/mese (approssimativo, 2026)

Best forCreator solitari che vogliono didascalie con animazione pop e non lasciano mai l'editor CapCut/Submagic.

Prezzi approssimativi a maggio 2026. Conteggi lingua basati sulle pagine di supporto pubblicate di ciascun fornitore.

Specifico per TikTok

Tre problemi su strumenti di trascrizione generici.

L'audio TikTok non è audio podcast. Queste sono le differenze che vale la pena capovolgere prima di mettere in coda il lavoro.

Cosa non funziona

1La musica di sottofondo viene trascritta come parlato. L'ASR generico sente i testi e li scrive insieme alla voce — il tuo file didascalia diventa inutilizzabile.
2Lo slang del creatore e gli handle (@username, 'rizz', 'fanum tax', nomi di prodotti) tornano indietro con errori fonetici o autocorretti alla parola sbagliata.
3Gli hook veloci — i primi tre secondi in cui i creator impilano 15 parole per battere lo scorrimento — vengono tagliati o compressi perché l'ASR sta ancora scaldandosi.

Cosa voltare qui

1Attiva Isolamento voce nel modulo di lavoro. Separiamo lo stelo vocale dalla musica prima di trascrivere, quindi l'audio in trend non inquina le didascalie.
2Incolla handle, nomi di marchi e vocabolario specifico del creatore in Vocabolario personalizzato. Lo passiamo come suggerimento riconoscente — maiuscole e ortografia tornano corrette.
3Imposta il Formato didascalia su short-form (max 3 parole per riga, 1,2 sec per cue). L'SRT esce pre-formattato per video verticale senza interruzioni di riga manuali.

Impostazioni di lavoro consigliate per TikTok

Incolla un URL TikTok e questi si attivano per impostazione predefinita. Sostituisci per lavoro dal modulo.

Sorgente: URL pubblico · audio estratto lato server
Isolamento voce: Attivo (letto musicale soppresso)
Lingua: Rilevamento automatico · 100+ supportate
Formato didascalia: Short-form · 3 parole/riga · 1,2s cue
Parole di riempimento: Mantenute (i creator si affidano a loro)
Esportazione: SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% con voice-over pulito. Le clip ricche di musica calano in modo prevedibile.

Il soffitto è impostato da quanto forte è il letto musicale e da quanto velocemente parla il creatore. La voice-over registrata separatamente e depositata su un letto tranquillo è il miglior caso; i trend lip-sync e i duetti sono il peggiore. I numeri di seguito provengono da URL TikTok reali eseguiti attraverso la nostra pipeline.

94^%

Voice-over · letto musicale tranquillo

Creator registrato su microfono, musica siede 15-20 dB sotto voce. Contenuti educativi talking-head e ricette arrivano qui.

91^%

On-camera · microfono del telefono · nessuna musica

Testa parlante in stile selfie, nessuna traccia di backup. Microfono del telefono e riverbero della stanza costano alcuni punti rispetto alla voice-over.

85^%

Audio in trend forte sotto voce

Voce e musica entro 6 dB. Hook veloci e nomi di marchi subiscono colpi — aspettati un passaggio di pulizia di 1 minuto.

78^%

Duetti, stitches, clip lip-sync

Due tracce audio sovrapposte o testi di canzoni che vengono articolati. Trascriviamo ciò che è parlato; i testi delle canzoni sono segnalati, non riscritti.

What affects accuracy

The model isn't the bottleneck — the audio is.

01

Microphone distance and quality

USB or lavalier mic at 30 cm vs phone in pocket at 3 m: 10-point accuracy swing. The mic captures or it doesn't.

02

Background noise

Café chatter, AC hum, traffic, room reverb. The model filters some but can't recover frequencies the mic masked entirely.

03

Accent and speech rate

Strong regional accents, fast speech, code-switching — all drop accuracy 2–4% vs neutral English. Still usable, but plan a review pass.

04

Codec and bitrate

Lossless WAV at 16 kHz+ beats MP3 by 1–2%. Below 64 kbps MP3, perceptual compression starts eating word accuracy noticeably.

05

Speaker overlap

Two people talking simultaneously is the hardest case. Diarization labels both turns but the words inside the overlap may be wrong.

Domande comuni

8 domande sulla trascrizione TikTok.

01Devo scaricare il TikTok per primo?+

No. Incolla l'URL del video pubblico (il link di condivisione dall'app TikTok) e estraiamo l'audio lato server. Se il video è privato o bloccato dalla regione, dovrai scaricare l'MP4 tu stesso e caricarlo — non possiamo aggirare le regole di accesso di TikTok.

02Trascriverai i testi della canzone o solo la voce del creatore?+

Solo la voce parlata. L'isolamento voce sopprime il letto musicale prima della trascrizione, e i testi audio in trend vengono contrassegnati nell'output JSON piuttosto che scritti nella traccia di didascalia. Puoi disattivare l'isolamento se vuoi specificamente i testi.

03Posso ottenere un SRT formattato per video short-form verticale?+

Sì. Il preset della didascalia short-form interrompe i cue a circa 3 parole per riga e 1,2 secondi per cue — il ritmo che si adatta alla zona di sicurezza 9:16 senza sovrapporre l'interfaccia utente. L'SRT standard (una frase per cue) è anche disponibile.

04Che dire di duetti e stitches con due voci?+

La diarizzazione acustica separa le due voci e le etichetta Speaker 1 e Speaker 2. L'accuratezza cala di 5-10 punti quando le tracce audio si sovrappongono pesantemente — questo è il peggiore caso nei nostri dati.

05Gestisce i creator non inglesi?+

Sì — 100+ lingue con rilevamento automatico. Creator spagnoli, portoghesi, indonesiani, vietnamiti e arabi tornano indietro con approssimativamente la stessa banda di accuratezza dell'inglese. Il code-switching (mischiare due lingue a metà frase) viene rilevato ed etichettato per segmento.

06Quanto tempo prima che la trascrizione sia pronta?+

Meno di cinque minuti per un TikTok standard di 30-90 secondi, solitamente sotto due. I TikTok più lunghi (3-10 minuti) finiscono in circa 1/10 del tempo reale.

07Posso elaborare in blocco l'intero feed di un creatore?+

Sì, tramite l'API o incollando un elenco di URL nella dashboard. Limitiamo la velocità dell'acquisitore URL in modo educato in modo che TikTok non ci blocchi — aspettati ~30 video nel primo batch, quindi throughput costante da lì.

08Questo è consentito secondo i termini di TikTok?+

Estraiamo solo video pubblici tramite i loro endpoint pubblici di condivisione — allo stesso modo di un'anteprima del browser. Non aggiriamo account privati o muri di accesso. Se stai trascrivendo il contenuto di qualcun altro per uso commerciale, il fair-use e le regole della piattaforma dipendono da te verificare.

Incolla un URL TikTok. Scopri cosa esce.

30 minuti gratis ogni mese. Nessuna carta. SRT, VTT, 100+ lingue, tutte le esportazioni incluse.