YouTube ショーツの文字起こし。動画60秒、文字起こし10秒。

ショーツのURLを貼り付けるか、MP4をドロップ。SRT、VTT、クリーンなテキストを数秒で取得 — ショーツクリップをReels、TikTok、ブログ記事に再利用する準備ができています。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 出力結果を見る

ショーツのURLを入力。 字幕が出力。

ショーツ動画からオーディオをサーバー側で取得し、音楽トラックを除去して、タイムスタンプ付きテキストとフレーム精度のSRTを返します。ブラウザ拡張機能、OBSキャプチャ、自分でのスクレイピングは不要。

youtube.com/shorts/aB3kQ…REC 1スピーカー · 00:58
自動検出 en-US44.1 kHz · ボーカルトラック分離
~90s
文字起こし · ストリーミング94% 精度
S1

3つのiPhoneの設定、誰も教えてくれない — その1はアクセシビリティに隠れている。

S1

設定を開いて、アクセシビリティ、タッチと進んで、下にスクロールしてバックタップを探す。

S1

ダブルタップをスクリーンショットに設定。片手でスクリーンショット撮影ができるようになる。

S1

これをフィードに埋もれさせる前に保存してください。

顔出しショーツで94%SRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

3つの実際の選択肢 · 正直な比較

YouTubeの自動字幕。SubMagic。 またはTranscription.Solutions。

YouTubeはStudio内で無料で字幕を生成します。SubMagicやSubMagic風のツール(CapCut、Veed)はアニメ字幕を動画に焼き込みます。私たちはデータとして使える、処理済みの文字起こしとクリーンな字幕ファイルを提供します。

Option 01

YouTubeの自動字幕

無料、Studioに組み込み。YouTubeに限定、英語寄り、真のエクスポート機能なし。

必須要件ショーツチャンネルを所有
スピーカーラベルなし
言語対応約13言語
エクスポートSBV / SRT in Studio
音楽処理しばしば[Music]を挿入
コスト無料
Best forYouTube自体でのみ字幕が必要で、クリップを他の場所で再利用しないクリエイター向け。
Option 02

Transcription.Solutions

任意の公開ショーツのURLを貼り付け。クリーンなSRT、VTT、テキストを取得 — どこでも使える。

必須要件公開URL またはMP4
スピーカーラベルダイアリゼーション含む
言語対応99言語、自動検出
エクスポートSRT · VTT · DOCX · TXT · JSON
音楽処理ボーカル分離がデフォルトON
コスト · 分単位$0.03
Best forショーツをTikTokとReelsに再利用するクリエイター、他のチャンネルを運用するエージェンシー、Studio外でテキストが必要な誰もが対象。
Option 03

SubMagic / CapCut

焼き込みアニメ字幕。画面上で見栄えがいいが、テキストはピクセル内に閉じ込められている。

必須要件ソースMP4をアップロード
スピーカーラベルシングルスピーカーのみ
言語対応約30言語、英語中心
エクスポートビデオファイル(テキストではない)
音楽処理良好 — ショーツ向けに設計
コスト約$10–25/月
Best forポップオンワードレベル字幕をエクスポートに焼き込みたい、生の文字起こしが不要なクリエイター向け。

料金と機能フラグは2026年時点の概算です。YouTube字幕言語サポートは地域によって異なります。

ショーツ固有

クリエイターがで突き当たる3つのこと。 汎用トランスクリプションツール

ショーツは小さなポッドキャストではありません。音楽床、スピード、ハッシュタグ満載のスクリプトはすべて、会議向けに設計されたツールを壊します。

何が機能していないのか

  1. 1音楽床がホットミックス。 汎用ASRは歌詞を文の真ん中に文字起こしします。「[Music] go to settings [Music] tap on」のようになります。
  2. 2ブランド名とハッシュタグ(Notion、Arc、Linear、#buildinpublic)は小文字で音声として返されます。再アップロード時、キャプションがアマチュアに見えます。
  3. 3速いペースの配信。 ショーツクリエイターは60秒のフック内に収まるため200+ WPMで話す。会議ケイデンス向けにチューニングされたツールは単語の終わりをドロップします。

ここで何を反転させるか

  1. 1ボーカル分離をONのままに — これがデフォルトです。認識前に音楽抑制パスを実行するため、歌詞は文字起こしにリークしません。
  2. 2ブランドリストをカスタム語彙にドロップ。チャンネル名、製品名、繰り返しハッシュタグ。これらを認識用ただし多様化ヒントとして渡します。
  3. 3短編スピーカーモデルを選択。シングルスピーカー、速いペース配信用にチューニングされ、会話モデルより単語境界検出に重みづけします。

ショーツの推奨ジョブ設定

ショーツのURLを貼り付けると、これらがデフォルトでONになります。フォームからジョブごとにオーバーライド。

入力
公開URL またはMP4アップロード
スピーカーモデル
短編 · 1-2スピーカー
ボーカル分離
ON(音楽抑制)
フィラーワード
保持 — クリエイターは正確さを望む
要約
フック+ペイオフ(Pro/Business)
エクスポート
SRT · VTT · ワードレベルJSON

Accuracy · real-world numbers

顔出しショーツで94%。 音楽床がセットの天井を決める。

ショーツは短いため、1つの間違った単語が目立ちます。 音楽トラックに対するボーカル分離がチューニングの焦点です。 以下の数値は、アクティブなショーツURLから処理した実データであり、合成クリップではありませ���。

96%
スタジオボイスオーバー、音楽なし

マイクで録音、音楽は後処理で追加だがミックスは低め。最もクリーン — エラーは主に固有名詞とスラングで発生。

94%
トーキングヘッド、軽い音楽床

スマートフォンまたはDSLR、音声の下に音楽を下げたもの。ボーカル分離で対話をクリーンリフト。ほとんどのショーツはここに該当。

87%
大きなトレンドオーディオバック

音楽が音声と同じレベル。硬い子音と対話と重なる歌詞で単語がクリップ。

82%
街、フィールド、またはBロールボイスオーバー

風、交通、周囲の人声。使用可能なテキストだが、数字、名前、ブランド言及に30秒のクリーンアップパスを想定。

よくある質問

クリエイターが質問する8つのこと ショーツトランスクリプションについて

01youtube.com/shorts/ URLを貼り付けるだけで動作しますか?+
はい — これが主なフロー。URLを貼り付けると、オーディオをサーバー側で取得して文字起こしを開始します。ブラウザ拡張機能、OBSキャプチャ、最初にMP4をダウンロードする必要はありません。
02所有していないショーツで機能しますか?+
はい、ショーツが公開されている限り。YouTubeは匿名取得をそれらでブロックするため、非公開またはプライベート動画にはアクセスできません。プライベートショーツの場合、StudioからMP4をダウンロードして直接アップロード。
03TikTokまたはReelsで再アップロードされた動画と同期しますか?+
はい。タイムスタンプがオーディオ開始を参照するため、再アップロード時にクリップの先頭をトリミングしない限り、SRTはクリーンに適用されます。先頭をトリム? 任意の字幕エディターでそのオフセットを差し引きます。
04音楽はどうなる — YouTubeのように[Music]として表示される?+
いいえ。認識前にボーカル分離を実行するため、音楽床は抑制され、スポーク音声のみを文字起こしします。文字起こし全体に[Music]タグが散在しません。
05無料枠では何個のショーツできますか?+
月30分。平均ショーツは30-45秒のため、これは大体月40-60ショーツです(Proに達する前)。ダイアリゼーションとSRTエクスポートはすべてのプランに含まれています。
06アニメ字幕用ワードレベルタイムスタンプを処理しますか?+
はい、すべてのプラン。エクスポートドロップダウンからワードレベルJSONを選択。CapCut、Premiere、またはカスタムRemotionテンプレート��直接フィードしてポップオン字幕をレンダリング。
07非英語ショーツについては?+
99言語対応、オーディオから自動検出。スペイン語、ポルトガル語、ヒンディー語、タガログ語、アラビア語 — 本番環境ですべてテスト済み。混合言語ショーツ(コード切り替え)は機能しますが精度は4-6ポイント低下。
08文字起こしから要約またはタイトル候補を取得できますか?+
Pro/Businessで可能。要約はワンラインフック、ペイオフ、スクリプトに基づいた3-5個の推奨タイトルバリアントを返します。無料枠は文字起こしのみ。

ショーツのURLを貼り付ける。 何が出てくるか見る。

毎月無料30分 — 数十のショーツ。カードは不要。SRT、VTT、ワードレベルJSONはすべてのプランに含まれています。

無料で開始