TikTok文字起こし。リンク貼り付け、キャプション取得。

TikTok動画 URLを貼り付け。サーバーサイドで音声を取得し、タイムスタンプ付きテキストとSRT、VTTキャプションファイルを返却 — 再アップロードまたは焼き込み済み。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 出力結果を確認

公開URLを入力。 キャプション出力。

任意の公開TikTok動画リンクを貼り付け。音声トラックを取得、言語を自動検出し、バックグラウンド音楽が声の下で流れる間にキャプションをストリーミング送信。

TikTok動画URLREC 1音声 · 0:47 · 縦型 9:16
自動検出 en-US44.1 kHz · ミュージックベッド -18 dB
~90s
キャプション · ストリーミング精度 94%
S1

豆腐をパリパリにするコツ、誰も教えてくれないんだけど — 2分じゃなく10分押し潰す。

S1

小麦粉じゃなく片栗粉を使う。振るんじゃなくまぶす。

S1

エアフライヤー400度で12分、途中で返す。

S1

『豆腐』とコメントしてくれたら、ソースレシピ全部送ります。

クリエイターボイスオーバーで 94%SRT · VTT · TXT · DOCX · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

3つの選択肢 · 正直な比較

TikTokオートキャプション。CapCutまたはSubmagic。 またはTranscription.Solutions。

TikTokはエディター内でオートキャプションを提供。CapCutとSubmagicはスタイリング、アニメーション化されたキャプションを再アップロード用に追加。当社は生のトランスクリプトとクリーンなSRT/VTTを提供 — エディターは自分で用意。

Option 01

TikTokオートキャプション

TikTokエディターに組み込み。オンにするだけでキャプション表示。別途取り出せるファイルはなし。

必要TikTokアプリ経由のアップロード
言語対応約40言語、英語最強
エクスポートなし — 焼き込みのみ
公開前編集アプリ内テキストエディター
音楽処理歌詞を逃す、大音量ベッド上の音声が不明瞭
価格無料
Best forTikTok内のみでキャプションが必要で、ReelsやShortsに再投稿しないクリエイター向け。
Option 02

Transcription.Solutions

公開URLを貼り付け。トランスクリプトファイルとSRT/VTTを取得、任意のエディターに落とし込むか、どこでも再アップロード可能。

必要公開TikTok URL — ログイン不要
言語対応100+言語、自動検出
エクスポートSRT · VTT · DOCX · TXT · JSON
公開前編集ウェブエディター上で編集、再エクスポート可能
音楽処理ノイズの多いベッド上での音声分離
価格 · 1分あたり$0.03
Best forReels、Shorts、YouTubeにクロスポストするクリエイター、クライアントのTikTokを再利用する事業者、トレンドをアーカイブする研究者向け。
Option 03

CapCut / Submagic

短編向けにチューニングされたスタイリング、アニメーション化されたキャプション。エディターに組み込まれ、英語優先。

必要アプリインストール + エクスポート有料
言語対応約20言語強、その他は限定的
エクスポート焼き込みMP4、有料でSRT
公開前編集エディター内のみ
音楽処理英語対応、強めのアクセント音声では低下
価格$10–24/月(目安、2026年5月)
Best forアニメーション化されたキャプションが欲しく、CapCut/Submagicエディターから出ないソロクリエイター向け。

価格は2026年5月現在の目安。言語数は各ベンダーの公開サポートページから引用。

TikTok固有

ここで人々がはまる 3 つのこと。 汎用文字起こしツール。

TikTok音声はポッドキャスト音声ではありません。ジョブを投入する前に確認する価値がある違いを 3 つ紹介。

何が起きるか

  1. 1背景音楽が音声として文字起こしされる。 標準的な音声認識は曲の歌詞を拾って音声と一緒に出力 — キャプションファイルが使い物にならなくなる。
  2. 2クリエイターのスラングやハンドル(@username、『rizz』、『fanum tax』、製品名)が音声的に誤変換されるか、別の言葉に自動���正。
  3. 3高速フック — スワイプ逃げを防ぐため最初 3 秒に 15 語詰め込むクリエイター — 音声認識がウォーミングアップ中のため途切れるか圧縮される。

ここで設定すること

  1. 1ジョブフォームで音声分離をオン。文字起こし前に音声ステムを音楽から分離いるため、トレンド音がキャプションを汚さない。
  2. 2カスタムボキャブラリーにハンドル、ブランド名、クリエイター固有の用語を貼り付け。認識エンジンへのヒントとして渡される — 大文字と綴りが正しく戻る。
  3. 3キャプション形式を短編用に設定(1 行あたり最大 3 単語、キューは 1.2 秒)。SRT が手動改行なしで、縦型 9:16 動画に最適なフォーマットで出力される。

TikTok 向け推奨ジョブ設定

TikTok URL を貼り付けると、これらはデフォルトでオン。ジョブごとにフォームから変更可能。

ソース
公開 URL · サーバーサイドで音声抽出
音声分離
オン(音楽ベッド抑制)
言語
自動検出 · 100+対応
キャプション形式
短編用 · 3 単語/行 · 1.2 秒/キュー
フィラーワード
保持(クリエイターが頻繁に使用)
エクスポート
SRT · VTT · TXT · DOCX

Accuracy · real-world numbers

クリーンなボイスオーバーで 94%。 音楽が多いクリップは予測可能に低下します。

上限は音楽ベッドの大きさとクリエイターのしゃべるスピードで決まります。別録音したボイスオーバーを静かなベッドの上に重ねるのが最良のケース;リップシンク動画とデュエットが最悪です。以下の数字は実際のTikTok URLを当社のパイプラインで処理した結果から得られています。

94%
ボイスオーバー · 静かな音楽ベッド

クリエイターがマイク録音、音楽は声の下 15–20 dB。教育やレシピ系の解説動画はここに該当。

91%
オンカメラ · スマートフォンマイク · 音楽なし

自撮り風の解説、バックトラックなし。スマートフォンマイクと室内反響でボイスオーバー比で数ポイント低下。

85%
声の上に重なった大きなトレンド音

声と音楽が 6 dB 以内。速いフック、ブランド名は精度が落ちます — 1分の修正パスを想定。

78%
デュエット、stitches、リップシンク動画

音声トラック 2 つが重なるか、歌詞が口パク。話された部分を文字起こしします;歌詞はフラグ付けで再入力なし。

よくある質問

よくある質問 8 つ。 TikTok文字起こしについて。

01TikTok を先にダウンロードする必要がありますか?+
いいえ。公開動画の URL(TikTok アプリからの共有リンク)を貼り付けるだけで、サーバーサイドで音声を抽出します。動画が非公開またはリージョンブロックされている場合は、MP4 を自分でダウンロードしてアップロードする必要があります — TikTok のアクセス制限をバイパスすることはできません。
02歌詞も含めて文字起こししますか、それとも声だけ?+
声だけです。音声分離が文字起こし前に音楽ベッドを抑制し、トレンド音の歌詞はキャプショントラックに書き込まれず JSON 出力でフラグされます。歌詞が必要な場合は分離をオフにできます。
03縦型短編動画向けにフォーマットされた SRT を取得できますか?+
できます。短編用キャプションプリセットはキューを約 3 単語/行、1.2 秒/キューで分割 — 9:16 セーフゾーンに最適で UI と重ならないペース。標準 SRT(キューごと 1 文)も利用可能。
042 人の声が入るデュエットや Stitch には対応していますか?+
対応しています。音声の分離で 2 人の声を分割し、話者 1、話者 2 とラベル付けします。音声トラックが大きく重なる場合は精度が 5–10 ポイント低下 — データ上、最悪のケース。
05英語以外で活動するクリエイターの動画に対応していますか?+
はい、100+言語に自動検出で対応。スペイン語、ポルトガル語、インドネシア語、ベトナム語、アラビア語クリエイターは英語とおおむね同じ精度で処理されます。コードスイッチング(文中に言語を混合)も検出・セグメント手にラベル付け。
06トランスクリプトはどのくらいで完成しますか?+
標準的な 30–90 秒の TikTok なら 5 分以内、通常は 2 分以内。長編(3–10 分)なら実時間の約 1/10 の時間で完成します。
07クリエイターのフィード全体を一括処理できますか?+
できます。API 経由または、ダッシュボードに URL リストを貼り付けることで処理可能。URL フェッチャーは TikTok にブロックされないよう適切なレート制限を行います — 最初のバッチで約 30 本の動画、その後は安定したスループット。
08TikTok の利用規約で許可されていますか?+
公開動画のみを公開共有エンドポイント経由で取得します — ブラウザプレビューと同様の方法。非公開アカウントやログイン壁をバイパスしません。他人のコンテンツを商用目的で文字起こしする場合は、フェアユースとプラットフォーム規約をご自身で確認してください。

TikTok URL を貼り付け。 結果を確認。

毎月 30 分無料。クレ���ットカード不要。SRT、VTT、100+言語、すべてのエクスポート搭載。

無料で始める