YouTube の文字起こし。 自動字幕より高精度。人間による文字起こしより安価。

YouTube 動画の URL を貼り付けます。話者ラベル、チャプタータイムスタンプ、再アップロード可能な SRT/VTT 字幕付きの 95%+ 精度のトランスクリプトが得られます。— Premium も Chrome 拡張機能も不要です。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 出力内容を見る

URL を貼り付け。 クリーンなトランスクリプトが返ってくる。

youtu.be または youtube.com のリンクを貼り付けます。URL を解析し、最高ビットレートの音声トラックをサーバー側で取得し、話者分離を実行し、タイムスタンプ付きトランスクリプトと YouTube へのアップロード用 SRT/VTT を返します。

youtu.be/dQw4w9WgXcQREC インタビュー · 2 人の発話者 · 28:14
自動検出 en-USopus 160 kbps · 48 kHz
~90s
トランスクリプト · ストリーミング精度 96%
S1

チャンネルが8か月で 100K 登録者に達したけど、実際に視聴者の関心を引いたのは何だと思う?

S2

正直なところ、Shorts を 6 週間毎日投稿したことです。そのあと長編動画の視聴時間がついてきました。

S1

サムネイル改善に関しても、YouTube Studio で A/B テストをしたんですか?

S2

そう、新しい Test & Compare ツールを使いました。3 つの候補中 2 つは顔を映さないものでした。

トーク形式の音声で 96%SRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

3 つの実際的な選択肢 · 正直な比較

YouTube の自動字幕。Rev の人間翻訳。 または当社。

YouTube はすべての動画向けに自動字幕を無料で提供していますが、精度があまり高くなく、話者ラベルがありません。Rev は $1.50/分で人間が打った文字起こしを販売しています。当社はその中間:95%+ の AI、話者ラベル付き、3 分以内で完成。

Option 01

YouTube の自動字幕

無料ですべての公開動画に組み込まれています。句読点なし、話者ラベルなし。

費用無料
精度クリーンな音声で ~80%
話者ラベルなし
句読点少なく、段落分けなし
エクスポートトランスクリプト パネルからコピペ
対応動画公開動画のみ
Best for自分が所有していない動画を素早く確認したい、精度は重要でないという場合。
Option 02

Transcription.Solutions

URL を貼り付けます。3 分後:クリーンなトランスクリプト、SRT/VTT、チャプタリンク付き AI サマリー。

費用 · 1 分当たりPro で $0.03
精度トーク形式で 95%+
話者ラベルあり(Pro および Business)
句読点完全で段落分け付き
エクスポートSRT · VTT · DOCX · TXT · JSON
対応動画公開動画 + 限定公開 URL
Best for字幕を再アップロードするクリエイター、動画をブログに転用するポッドキャスター、インタビューからクォートを抽出する研究者。
Option 03

Rev の人間による文字起こし

人間がタイプします。最高の精度、最も遅い対応、1 分単位での料金体系。

費用 · 1 分当たり$1.50
精度99%+ 保証
話者ラベルあり
句読点完全で編集品質
対応時間通常 12~24 時間
対応動画アップロード済みファイル
Best for法廷用コンテンツ、放送字幕、紛失した 1 単語でクォートが台無しになるインタビュー。

料金は 2026 年時点で正確です。Rev レートは標準サービス等級を反映しており、競合他社の AI のみの等級は比較対象に含まれていません。

YouTube に固有

で人をつまずかせる 3 つのポイント。 汎用文字起こしツール

YouTube 音声には汎用の文字起こしツールが対応していないクセがあります。適切な設定をフリップし、トランスクリプトを字幕として再アップロード可能な状態で取得しましょう。

何が問題になるか

  1. 1音楽ベッドが認識器を混乱させます。 Intro スティングと背景音楽がぐちゃぐちゃな言葉として転写されます。汎用 AI はそれらを無視することを知りません。
  2. 2SRT 行の長さが YouTube の字幕ルールに適合しません。 字幕がモバイルの安全領域からはみ出したり、ビデオ用にチューニングされていないチャンカーのせいで言葉の途中で切れたりします。
  3. 3チャネル固有の名前(スポンサーブランド、ゲームタイトル、ゲスト呼び出しネーム @MKBHD など)は音韻的に綴られます。1 つのタイプミスでクォートは検索��可になります。

ここでフリップするもの

  1. 1ジョブフォームで 音楽対応セグメンテーションをオンにします。当社は音楽リージョンに `[music]` でタグを付け、歌詞を幻視する代わりに、音声が戻ったときに無視して文字起こしを再開します。
  2. 2エクスポート時に YouTube 対応 SRT を選択します。行は 42 文字で上限、キューあたり最大 2 行、区切りはフレーズ境界に着地します — YouTube Studio にファイルを直接ドロップしてください。
  3. 3チャネルボキャブラリー(スポンサー名、定期的なゲスト、ゲームタイトル)を カスタムボキャブラリーに貼り付けます。認識器へのヒントとして提供され、ブランド綴りが正確に保たれます。

YouTube 用の推奨ジョブ設定

YouTube URL を貼り付けると、これらはデフォルトでオンになります。フォームから必要に応じてジョブごとにオーバーライドしてください。

ソース
URL 貼り付け · youtu.be 自動解析
ダイアライゼーション
アコースティック · 1~4 人の話者
音楽処理
[music] にタグ付け、歌詞をスキップ
フィラーワード
デフォルトで削除
サマリー
チャプタータイムスタンプ+主要な瞬間
エクスポート
YouTube 対応 SRT · VTT · DOCX

Accuracy · real-world numbers

トーク形式動画で 95%+。 音楽とゲーム音声は下限に達します。

YouTube コンテンツは顕著に異なります。スタジオポッドキャストと Fortnite ストリームは同じ問題ではありません。ラペルマイク型のトーク形式が最良のケースです。背景音楽と重なるゲーム音声が精度低下を最も速く引き起こします。以下の数値は本番環境の実際の顧客 YouTube URL から得られています。

97%
スタジオポッドキャスト · ゲスト別マイク

Joe Rogan スタイルのセットアップ:各ゲストが独立したブームマイク、軽い室内処理、音楽ベッドなし。声が混ざらないので話者分離は簡単です。

95%
シングルトーク形式 · ラペル/USB マイク

標準的なチュートリアルまたはビデオエッセイ。話者 1 人、屋内音声、intro 音楽は音声の下に埋め込まれます。ほとんどの YouTube アップロードはここに該当します。

89%
B ロール付き Vlog · 屋外音声

風、交通、ボイスオーバー下の環境音楽。言葉は依然として有用です。固有名詞とブランド名で時々ミスが発生することを想定してください。

84%
ゲーミング配信 · ゲーム音声上のボイス

ゲーム効果音、音楽、可変音量のチャットリーディング。配信者の音声は通常クリアです。Discord のチームメートが最も速く聞き取れなくなります。当社データの最悪のケース。

よくある質問

人々が尋ねる 8 つのこと。 YouTube の文字起こしについて

01URL を貼り付けるだけで済みますか、それとも最初にビデオをダウンロードする必要がありますか?+
URL を貼り付けるだけです。当社は youtube.com/watch、youtu.be のショートリンク、限定公開動画 URL を受け入れます。サーバー側で解析し、音声トラックのみ(動画ではなく)を取得し、文字起こしを開始します — 通常、貼り付けてから 10 秒以内に開始します。
02プライベート動画または限定公開動画で機能しますか?+
限定公開はい、プライベートいいえ。 限定公開 URL はリンクを持っていれば公開的に解析可能なため、当社は取得できます。プライベート動画は Google アカウントにサインインする必要があります — 当社があなたになりすますことはできません。YouTube Studio から MP4 を最初にダウンロードしてから、ファイルをアップロードしてください。
03あなたのトランスクリプトが YouTube の自動字幕より大幅に優れているのはなぜですか?+
YouTube の自動字幕は、数十億のビデオ全体にわたる規模でコストを最適化するようにチューニングされたストリーミング モデルを実行します。当社はフルコンテキスト デコードを備えた大規模なモデル、カスタム ボキャブラリー、別の話者分離パスを実行します。結果:~95% vs ~80%、さらに話者ラベルと適切な句読点。
04SRT を YouTube にコミュニティ字幕として再度アップロードできますか?+
はい。YouTube 対応 SRT としてエクスポートし、YouTube Studio → 字幕 → 追加 → ファイルをアップロードを開きます。当社の行の長さとタイミングは YouTube の表示ルールに適合するため、モバイルでキューがはみ出したり、言葉の途中で切れたりしません。
05著作権について — 他の人の動画を文字起こしするのは合法ですか?+
個人的な使用、研究、ジャーナリズム、またはコメントのための文字起こしは、米国では一般的にフェアユースです。完全なトランスクリプトを商用で再公開することはより曖昧です。当社は音声または動画をホストしていません、テキストを提供しています — それで何をするかはあなたの判断です。法的なアドバイスではありません。
064 時間のポッドキャスト エピソードのような長い動画に対応できますか?+
はい。当社のハードキャップはファイルあたり 8 時間です。4 時間の Lex Fridman エピソードは壁時計時間でおおよそ 8~12 分で文字起こしされ、Pro 価格で約 $7.20 になります。話者ダイアライゼーションは全長にわたって機能します。
07英語以外の YouTube 動画に対応していますか?+
はい — 99 言語の自動検出。スペイン語、ヒンディー語、ポルトガル語、日本語はすべてクリーンな音声英語精度の 2~3 ポイント以内に着地します。コードスイッチング(同じ文内の英語+スペイン語)は機能しますが、約 5 ポイント低下します。
08YouTube の自動チャプターのようなチャプタータイムスタンプを取得できますか?+
はい。AI サマリーにはトピック遷移へのチャプター形式タイムスタンプと主要な瞬間へのリンクが含まれます。動画説明に `00:00 Intro / 03:42 Setup / …` として貼り込みます — YouTube は自動的にそれらをクリック可能なチャプターとしてレンダリングします。

YouTube URL を貼り付けます。 出力内容を見ます。

毎月 30 分間無料。カード不要。話者ラベル、YouTube 対応 SRT、チャプタータイムスタンプ付き AI サマリー — すべて含まれます。

無料で始める