TikTok-Transkription.Link einfügen, Untertitel erhalten.

Geben Sie eine TikTok-Video-URL ein. Wir ziehen die Audiospur serverseitig und geben zeitgestempelten Text plus SRT- und VTT-Untertiteldateien zurück — bereit zum erneuten Hochladen oder Einbrennen.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Sehen Sie, was herauskommt

Öffentliche URL rein. Untertitel raus.

Geben Sie einen beliebigen öffentlichen TikTok-Video-Link ein. Wir laden die Audiospur ab, führen Spracherkennung durch und streamen Untertitel zurück, während die Hintergrundmusik unter der Stimme weiterläuft.

TikTok-Video-URLREC 1 Stimme · 0:47 · vertikal 9:16
auto-detected en-US44.1 kHz · Musikbett -18 dB
~90s
Untertitel · Streaming94 % Genauigkeit
S1

Also das Geheimnis für knuspriges Tofu, das dir niemand verrät — drücke es zehn Minuten lang, nicht zwei.

S1

Dann Maisstärke, nicht Mehl. Würfen, nicht bestäuben.

S1

Heißluftfritteuse auf 400 für zwölf Minuten, halbwegs umdrehen.

S1

Kommentiere 'tofu' und ich sende dir das vollständige Saucenrezept.

94% bei Creator Voice-overSRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Drei echte Optionen · ehrlicher Vergleich

TikTok-Auto-Untertitel. CapCut oder Submagic. Oder wir.

TikTok liefert Auto-Untertitel im Editor. CapCut und Submagic fügen gestylte, animierte Untertitel zum erneuten Hochladen hinzu. Wir geben dir das rohe Transkript plus sauberes SRT/VTT — bringe deinen eigenen Editor mit.

Option 01

TikTok-Auto-Untertitel

Im TikTok-Editor integriert. Einschalten, Untertitel erscheinen. Keine Datei, die du woanders verwenden kannst.

VoraussetzungUpload über TikTok-App
Sprachunterstützung~40 Sprachen, EN am stärksten
ExportKeine — nur eingebrannt
Bearbeitung vor VeröffentlichungIn-App-Texteditor
MusikbehandlungVerfehlt Liedtexte, verstümmelt Voice-over bei lauten Betten
KostenKostenlos
Best forCreator, die nur Untertitel im TikTok benötigen und nie auf Reels oder Shorts erneut posten.
Option 02

Transcription.Solutions

Geben Sie die öffentliche URL ein. Erhalten Sie eine Transkriptdatei plus SRT/VTT, die Sie in jeden Editor einfügen oder überall erneut hochladen können.

VoraussetzungÖffentliche TikTok-URL — kein Login
Sprachunterstützung100+ mit automatischer Erkennung
ExportSRT · VTT · DOCX · TXT · JSON
Bearbeitung vor VeröffentlichungWeb-Editor, dann erneut exportieren
MusikbehandlungStimmisolation bei lauten Betten
Kosten · pro Minute$0,03
Best forCreator, die auf Reels/Shorts/YouTube kreuzosten, Agenturen, die TikToks von Kunden umgestalten, Forscher, die Trends archivieren.
Option 03

CapCut / Submagic

Gestylte, animierte Untertitel für Short-Form optimiert. An ihren Editor gebunden, Englisch-Fokus.

VoraussetzungApp-Installation + kostenpflichtig für Export
Sprachunterstützung~20 stark, andere schwach
ExportMP4 mit Einbrennung, SRT zahlungspflichtig
Bearbeitung vor VeröffentlichungNur in ihrer Timeline
MusikbehandlungEN-optimiert, bricht bei akzentierter Stimme ab
Kosten$10–24/Monat (ungefähr, 2026)
Best forSolo-Creator, die animierte Word-Pop-Untertitel möchten und den CapCut/Submagic-Editor nie verlassen.

Preise ungefähr Stand Mai 2026. Sprachzahlen basieren auf veröffentlichten Support-Seiten jedes Anbieters.

Spezifisch für TikTok

Drei Dinge, die Menschen bei generischen Transkriptiontools ärgern.

TikTok-Audio ist kein Podcast-Audio. Das sind die Unterschiede, die es wert sind, vor dem Starten des Jobs zu überprüfen.

Was schiefgeht

  1. 1Hintergrundmusik wird als Sprache transkribiert. Generische ASR hört Liedtexte und schreibt sie neben der Stimme auf — deine Untertiteldatei wird unbrauchbar.
  2. 2Creator Slang und Griffe (@username, 'rizz', 'fanum tax', Produktnamen) kommen phonetisch falsch geschrieben oder mit Autokorrektur auf das falsche Wort zurück.
  3. 3Schnelle Hooks — die ersten drei Sekunden, in denen Creator 15 Wörter stapeln, um das Durchwischen zu schlagen — werden abgeschnitten oder komprimiert, weil die ASR sich noch aufwärmt.

Was du hier umschalten kannst

  1. 1Schalten Sie Stimmisolation im Job-Formular ein. Wir separieren den Stimm-Stem von der Musik vor dem Transkribieren, damit Trend-Audio die Untertitel nicht verschmutzt.
  2. 2Geben Sie Griffe, Markennamen und creator-spezifisches Vokabular in Benutzerdefiniertes Vokabular ein. Wir übergeben es als Erkennungshinweis — Fall und Rechtschreibung kommen korrekt zurück.
  3. 3Stellen Sie das Untertitelformat auf Short-Form (max. 3 Wörter pro Zeile, 1,2 Sek. pro Cue). Das SRT kommt vorformatiert für vertikale Videos ohne manuelle Zeilenumbrüche heraus.

Empfohlene Job-Einstellungen für TikTok

Geben Sie eine TikTok-URL ein und diese schalten sich standardmäßig ein. Überschreiben Sie pro Job aus dem Formular.

Quelle
Öffentliche URL · Audiodatei serverseitig extrahiert
Stimmisolation
Ein (Musikbett unterdrückt)
Sprache
Automatische Erkennung · über 100 unterstützt
Untertitelformat
Short-Form · 3 Wörter/Zeile · 1,2s Cues
Füllwörter
Behalten (Creator verlassen sich darauf)
Export
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

94% bei sauberem Voice-over. Musiklastige Clips fallen vorhersehbar ab.

Die Obergrenze wird durch die Lautstärke des Musikbetts und die Sprechgeschwindigkeit des Creators bestimmt. Voice-over separat aufgezeichnet und über ein stilles Bett gelegt ist der beste Fall; Lip-Sync-Trends und Duette sind die schlechtesten. Die Zahlen unten stammen von echten TikTok-URLs, die durch unsere Pipeline laufen.

94%
Voice-over · stilles Musikbett

Creator auf Mikrofon aufgezeichnet, Musik sitzt 15-20 dB unter der Stimme. Talking-Head-Lehr- und Rezeptinhalte landen hier.

91%
Vor der Kamera · Telefon-Mikrofon · keine Musik

Selfie-Stil Talking Head, kein Hintergrund-Track. Telefon-Mikrofon und Raumhall kosten ein paar Punkte im Vergleich zu Voice-over.

85%
Laute Trend-Musik unter der Stimme

Stimme und Musik innerhalb von 6 dB. Schnelle Hooks und Markennamen nehmen Treffer — erwartet einen einminütigen Aufräum-Pass.

78%
Duette, Stitches, Lip-Sync-Clips

Zwei Audiospuren überlagern sich oder Song-Liedtexte werden nachgemacht. Wir transkribieren das Gesprochene; Song-Liedtexte werden gekennzeichnet, nicht erneut eingegeben.

Häufig gestellte Fragen

8 Dinge, die Menschen über TikTok-Transkription fragen.

01Muss ich das TikTok zuerst herunterladen?+
Nein. Geben Sie die öffentliche Video-URL ein (der Share-Link aus der TikTok-App) und wir extrahieren die Audiospur serverseitig. Wenn das Video privat oder regionsgesperrt ist, müssen Sie das MP4 selbst herunterladen und hochladen — wir können TikToks Zugriffsvorgaben nicht umgehen.
02Werdet ihr die Song-Texte oder nur die Stimme des Creators transkribieren?+
Nur die gesprochene Stimme. Stimmisolation unterdrückt das Musikbett vor der Transkription, und Trend-Audio-Song-Texte werden in der JSON-Ausgabe gekennzeichnet statt in die Untertitelart geschrieben. Sie können die Isolation ausschalten, wenn Sie speziell Song-Texte benötigen.
03Kann ich ein SRT-Format für vertikale Short-Form-Videos erhalten?+
Ja. Die Short-Form-Untertitelvorlage trennt Cues bei ungefähr 3 Wörtern pro Zeile und 1,2 Sekunden pro Cue — das Tempo, das in die 9:16 Sicherheitszone passt, ohne die Benutzeroberfläche zu überlagern. Standard-SRT (ein Satz pro Cue) ist ebenfalls verfügbar.
04Was ist mit Duetten und Stitches mit zwei Stimmen?+
Akustische Diarisierung trennt die zwei Stimmen und kennzeichnet sie als Sprecher 1 und Sprecher 2. Die Genauigkeit sinkt um 5-10 Punkte, wenn sich die Audiospuren stark überlappen — das ist der schlechteste Fall in unseren Daten.
05Funktioniert es mit nicht-englischen Creatorn?+
Ja — über 100 Sprachen mit automatischer Erkennung. Spanisch-, Portugiesisch-, Indonesisch-, Vietnamesisch- und arabische Creator kommen bei ungefähr dem gleichen Genauigkeitsbereich wie Englisch zurück. Code-Switching (zwei Sprachen mitten im Satz mischen) wird erkannt und pro Segment gekennzeichnet.
06Wie lange dauert es, bis das Transkript bereit ist?+
Unter fünf Minuten für ein Standard-30-90-Sekunden-TikTok, normalerweise unter zwei. Längere TikToks (3-10 Minuten) werden in ungefähr 1/10 der realen Zeit abgeschlossen.
07Kann ich den gesamten Feed eines Creators im Stapel verarbeiten?+
Ja, über die API oder durch Einfügen einer URL-Liste in das Dashboard. Wir rate-limitieren den URL-Fetcher höflich, damit TikTok uns nicht blockiert — erwarten Sie ~30 Videos im ersten Batch, dann konstanten Durchsatz von dort.
08Ist dies gemäß TikToks Bedingungen zulässig?+
Wir holen nur öffentliche Videos über ihre öffentlichen Share-Endpoints ab — auf die gleiche Weise wie eine Browser-Vorschau. Wir umgehen keine privaten Konten oder Login-Wände. Wenn Sie Inhalte anderer Personen für kommerzielle Nutzung transkribieren, müssen Sie die Fair-Use- und Plattformregeln überprüfen.

Geben Sie eine TikTok-URL ein. Sehen Sie, was herauskommt.

30 kostenlose Minuten pro Monat. Keine Karte erforderlich. SRT, VTT, über 100 Sprachen, alle Exporte enthalten.

Kostenlos starten