TikTok-transkription.Klistra in en länk, bildtexter.

Släpp en TikTok-video-URL. Vi hämtar spelets ljudspår server-sida och returnerar tidsstämplade bildtexter plus SRT- och VTT-bildtextfiler — klara att återöverföra eller bränna in.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Se vad som kommer ut

URL in. Bildtexter ut.

Klistra in vilken TikTok-video-länk som helst. Vi hämtar ljudspåret, kör språkdetektering och streamar tillbaka bildtexter medan bakgrundsmusik fortsätter spelas under rösten.

TikTok-video-URLREC 1 röst · 0:47 · vertikal 9:16
auto-detekterad en-US44.1 kHz · musikbädd -18 dB
~90s
Bildtexter · strömning94% noggrannhet
S1

Okej, så hemligheten till sprö tofu som ingen säger till dig — pressa den i tio minuter, inte två.

S1

Sen potatissterke, inte mjöl. Vänd det, inte bara pulvra på det.

S1

Luftfritös på 400 i tolv minuter, vänd det halvvägs.

S1

Kommentera 'tofu' så skickar jag hela såsreceptet.

94% på skaparens röstöverSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre verkliga alternativ · ärlig jämförelse

TikToks auto-bildtexter. CapCut eller Submagic. Eller oss.

TikTok har auto-bildtexter i redigeraren. CapCut och Submagic lägger till stiliserade, animerade bildtexter för återöverföring. Vi ger dig det råa utskriftet plus rent SRT/VTT — ta med din egen redigerare.

Option 01

TikToks auto-bildtexter

Inbyggt i TikTok-redigeraren. Slå på, bildtexter visas. Ingen fil du kan ta med dig.

KräverLadda upp genom TikTok-appen
Språkstöd~40 språk, engelska starkast
ExportIngen — bara inbränd
Redigera före publiceringText-editor i appen
MusikhanteringMissar texter, förvrider rösten över höga musikbäddar
KostnadGratis
Best forCreators som bara behöver bildtexter inom TikTok och aldrig delar om till Reels eller Shorts.
Option 02

Transcription.Solutions

Klistra in den offentliga URL:en. Få en utskriftsfil plus SRT/VTT som du kan släppa i vilken redigerare som helst eller återöverföra överallt.

KräverOffentlig TikTok-URL — ingen inloggning
Språkstöd100+ med automatisk detektering
ExportSRT · VTT · DOCX · TXT · JSON
Redigera före publiceringWebbredigerare, sedan återexport
MusikhanteringRöstisol​ering på bullriga musikbäddar
Kostnad · per minut$0.03
Best forCreators som delar om till Reels/Shorts/YouTube, byråer som återanvänder klienters TikToks, forskare som arkiverar trender.
Option 03

CapCut / Submagic

Stiliserade, animerade bildtexter anpassade för short-form. Låst till deras redigerare, engelskfokuerad.

KräverAppinstallation + betalt för export
Språkstöd~20 starka, andra ojämna
ExportMP4 med inbränning, SRT vid betalning
Redigera före publiceringBara inom deras tidslinje
MusikhanteringEngelskjusterad, sjunker vid accenterad röst
Kostnad$10–24/månad (ungefärlig, 2026)
Best forSolo-creators som vill ha animerade ord-pop-bildtexter och aldrig lämnar CapCut/Submagic-redigeraren.

Prissättning ungefärlig från maj 2026. Språkräkningar baseras på varje leverantörs publicerade supportsidor.

Specifikt för TikTok

Tre saker som skadar på generiska transkriptionsverktyg.

TikTok-ljud är inte podcastljud. Här är skillnaderna som är värda att ändra innan du kör jobbet.

Vad som går fel

  1. 1Bakgrundsmusiken transkriberas som tal. Generisk ASR hör texter och skriver ut dem tillsammans med rösten — din bildtextfil blir oanvändbar.
  2. 2Creator-slang och handles (@username, 'rizz', 'fanum tax', produktnamn) kommer tillbaka fonetiskt felstavade eller automatiskt korrigerade till fel ord.
  3. 3Snabba hooks — de första tre sekunderna där creators staplar 15 ord för att slå swipe — blir klippta eller komprimerade eftersom ASR fortfarande värms upp.

Vad du ska ändra här

  1. 1Slå på Röstisol​ering på jobbformuläret. Vi separerar roststammen från musiken före transkription, så trending-ljud förorenar inte bildtexterna.
  2. 2Klistra in handles, varumärken och creator-specifik ordförråd i Anpassat ordförråd. Vi skickar det som ett recognizer-tips — skiftläge och stavning kommer tillbaka korrekt.
  3. 3Ställ in Bildtextformat till short-form (max 3 ord per rad, 1,2 sek per cue). SRT:en kommer förformaterad för vertikal video utan manuella radbrytningar.

Rekommenderade jobbinställningar för TikTok

Klistra in en TikTok-URL och dessa slår på som standard. Åsidosätt per jobbformulär.

Källa
Offentlig URL · ljud extraherat på serversidan
Röstisol​ering
På (musikbädd undertryckad)
Språk
Automatisk detektering · 100+ stöds
Bildtextformat
Short-form · 3 ord/rad · 1,2s cues
Fyllordsord
Bibehållna (creators förlitar sig på dem)
Export
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% på rent röstöver. Musiktunga klipp sjunker förutsägbart.

Taket bestäms av hur högt musikbädden är och hur snabbt creatorn talar. Röstöver inspelat separat och lagt över en tyst bädd är det bästa scenariot; lip-sync-trender och duetter är det värsta. Siffrorna nedan kommer från verkliga TikTok-URL:er genom vår pipeline.

94%
Röstöver · tyst musikbädd

Creator inspelad på mikrofon, musik ligger 15-20 dB under rösten. Talking-head-utbildnings- och receptinnehål hamnar här.

91%
On-camera · telefon-mikrofon · ingen musik

Selfie-style talking head, ingen bakgrund. Telefon-mikrofon och rumsåterklang kostar några poäng jämfört med röstöver.

85%
Högt trending-ljud under rösten

Röst och musik inom 6 dB. Snabba hooks och varumärken tar slag — räkna med ett 1-minuters upprensningspass.

78%
Duetter, stitches, lip-sync-klipp

Två ljudspår överlappar eller låttexterna sägs. Vi transkriberar vad som sägs; låttexterna flaggas, inte omskrivs.

Vanliga frågor

8 saker folk frågar om om TikTok-transkription.

01Behöver jag ladda ner TikTok:en först?+
Nej. Klistra in den offentliga video-URL:en (delningslänken från TikTok-appen) och vi extraherar ljudet på serversidan. Om videon är privat eller regionblockerad måste du ladda ner MP4:en själv och ladda upp den — vi kan inte kringgå TikToks åtkomstregler.
02Transkriberar du låttexterna eller bara creatorns röst?+
Bara den talat rösten. Röstisol​ering undertrycker musikbädden före transkription, och trending-audio-texter flaggas i JSON-utdata snarare än skrivas in i bildtextspåret. Du kan stänga av röstisol​ering om du specifikt vill ha texter.
03Kan jag få en SRT formaterad för vertikal short-form-video?+
Ja. Short-form-bildtextförinställningen delar cues på ungefär 3 ord per rad och 1,2 sekunder per cue — den rytm som passar in i 9:16-zonen utan att överlappa gränssnittet. Standard-SRT (en mening per cue) är också tillgängligt.
04Vad sägs om duetter och stitches med två röster?+
Akustisk diarization separerar de två rösterna och etikett dem som Talare 1 och Talare 2. Noggrannheten sjunker 5-10 poäng när ljudspåren överlappar helt — det är det värsta fallet i vår data.
05Hanterar det icke-engelska creators?+
Ja — 100+ språk med automatisk detektering. Spanska, portugisiska, indonesiska, vietnamesiska och arabiska creators kommer tillbaka på ungefär samma noggrannhetsband som engelska. Code-switching (blandning av två språk mitt i meningen) detekteras och etiketteras per segment.
06Hur länge dröjer det innan utskriften är klar?+
Under fem minuter för en standard 30-90-sekunders TikTok, vanligtvis under två. Längre TikToks (3-10 minuter) är klara på ungefär 1/10 av realtid.
07Kan jag massbearbeta en creators helt feed?+
Ja, via API:et eller genom att klistra in en lista med URL:er i instrumentpanelen. Vi begränsar URL-hämtaren höfligt så att TikTok inte blockerar oss — förvänta ~30 videor i den första batchen, sedan steady genomströmning därifrån.
08Är det här tillåtet enligt TikToks villkor?+
Vi hämtar bara offentliga videor via deras offentliga delningsslutpunkter — på samma sätt som en webbläsarförhandsvisning gör. Vi kringgår inte privata konton eller inloggningsväggar. Om du transkriberar någon annans innehål för kommersiell användning är det upp till dig att kontrollera fair-use och plattformsregler.

Klistra in en TikTok-URL. Se vad som kommer ut.

30 gratis minuter varje månad. Inget kort. SRT, VTT, 100+ språk, alla exporter inkluderade.

Börja gratis