最大10時間のオーディオファイルをトランスクライブ — 長いオーディオをテキストに、タイムアウトなし

長いオーディオファイルをトランスクライブします。最大10時間、タイムアウトなし。

長いオーディオファイルをドロップ — Business最大10時間、5 GB対応。並列でチャンキングし、スピーカーIDを一貫性保ちながら処理し、番号付きフォルダではなく1つのトランスクリプトを返します。

音声または動画をドロップ

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

ブラウザから直接録音

サインアップは30秒 — その後すぐにダッシュボードで録音が開始されます。

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTファイルは24時間後に自動削除

何時間でも。 1つのきれいなファイルで完了。

ほとんどのツールは90分前後でタイムアウトするか、長い音声を番号付きの部分に分割し、手動で接合する必要があります。12分の重複するウィンドウでチャンキングし、並列処理し、グローバルスピーカーパスで再構成します。

戦略会議REC 3スピーカー · 5:14:22 · 3.1 GB

自動検出 en-GB44.1 kHz ステレオ · 192 kbps

~90s

トランスクリプト · 単一ファイル92% 精度 · 処理時間 3:14:08

3時間経ったので、朝のセッションからのサプライチェーンポイントに戻りましょう。

そうですね、ベトナム製造へのシフト。リードタイムリスクを見落としていたと思います。

関税変更後、リードタイムは14日から31日に延びました。

これはロングビーチの港湾混雑を考慮する前の話です。

5時間ファイル全体で92%DOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

サマリー 5文字起こし 1,420話者 2エクスポート

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

キーポイント

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

アクション項目

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

長いファイルを1録音あたり4時間に制限。スピーカーラベルは2時間を過ぎるとドリフ��。

最大ファイル長4時間（Pro層）

最大ファイルサイズ～1.5 GB アップロード

スピーカーID一貫性2時間後ドリフト

長ファイル出力単一ドキュメント、上限で切り詰め

コスト$16.99/ユーザー/月

レジューマブルアップロードなし

Best for2時間未満の短い会議。丸1日の音声では機能しません。

Option 02

Transcription.Solutions

1ファイル10時間。並列チャンキング、グローバルスピーカーパス、1つのDOCXで完了。

最大ファイル長10時間（Pro & Business）

最大ファイルサイズ2 GB Pro · 5 GB Business

スピーカーID一貫性グローバル埋め込みパス

長ファイル出力単一ファイル · DOCX/SRT/TXT

コスト · 分単位$0.03 固定（長さ問わず）

レジューマブルアップロードマルチパート、接続断対応

Best for終日ワークショップ、証拠調べ、取締役会、口述歴史 — 90分の壁を超えるあらゆる場面。

Option 03

Whisper API + DIY チャンキング

分単位での最安値。チャンカー、スピーカー接合、リトライロジックは自分で構築。

最大ファイル長リクエストあたり25 MB（～25分）

最大ファイルサイズ25 MB ハード上限

スピーカーID一貫性なし — ダイアライゼーション非対応

長ファイル出力番号付き部分、手動で接合

コスト · 分単位$0.006（OpenAI Whisper）

エンジニア時間パイプラインあたり数時間から数日間

Best forチャンクあたりの生テキストを望み、スピーカー、要約、単一出力を不要とするエンジニア。

価格と制限は2026年5月時点で正確です。Otter Pro長さ制限は公開価格ページで最後に確認されています。

92%は5時間ファイル全体で維持されます。品質は時間ごとに変わりません。

長いオーディオの難しい部分はモデルではなく、1分から600分まで精度をフラットに保つことです。スピーカードリフトとチャンク境界エラーはほとんどのパイプラインを破壊するものです。以下の数字は最初の10分ではなく、全長の顧客ファイル全体で測定されています。

8つのよくある質問 — 長いオーディオトランスクリプションについて。

01実際のファイル長とサイズの制限は何ですか？+

Pro と Business 両プランで 10 時間あたり。 Pro はファイルサイズを 2 GB に制限、Business を 5 GB に制限。10 時間を超えるものがある場合は、自然なブレークで1度スプリット — 同じプロジェクトで連続してアップロードすれば、スピーカーID を一貫性保ちます。

021つのトランスクリプトか番号付き部分のフォルダか？+

1つのファイル。常に。DOCX、SRT、TXT、またはJSON — 選択可能。タイムスタンプはすべてのチャンク境界でリセットされるのではなく、00:00:00 から記録の終了まで継続して実行されます。

036時間ファイルの返信にかかる時間は？+

Pro キューで約 18～25 分、Business 優先度で 8～12 分。12 分のチャンクを並列処理するため、ウォールクロック時間はファイル長に対して線形ではなく部分線形でスケール。

04スピーカー ID は end-to-end で一貫性を保ちますか？+

はい。チャンク単位のダイアライゼーション後、グローバル埋め込みパスはファイル全体の声をクラスタ化します。12分のスピーカー3は487分でも同じスピーカー3。DIY Whisper パイプラインが間違える主要なものです。

054 GB ファイルの3時間目でアップロードが落ちたら？+

レジューマブルマルチパートアップロードは最後に完了した部分から再開。最初の 3 GB を再アップロードしない。不安定なホテル Wi-Fi とセルラーテザリングで動作 — 両方テスト済み。

06Whisper API が長いファイルで失敗する理由は？+

OpenAI の Whisper エンドポイントにはリクエストあたり 25 MB のハードキャップ — 圧縮オーディオの約 25 分。それ以上は、チャンクし、並列でトランスクライブし、トランスクリプトを接合してスピーカーを手動で��整する必要があります。すべてサーバー側で実行。

07分単位の価格は、10時間ファイルで10分ファイルと同じ？+

はい。分単位平坦 $0.03、長さに関係なく。10時間ファイルは $18 。Rev のように長いファイルに追加課金しません（$1.50/分人間 × 10時間 = $900）。

08時間マーカーまたは1時間ごとのタイムスタンプを取得できますか？+

ジョブフォームで 'Hour markers' をトグルすると、DOCX は 60 分ごとのヘッディングブレークでエクスポート。SRT は継続的なタイムコードを保持。JSON には両方 — チャプター配列とワードレベルのタイムスタンプ。

長いオーディオファイルをトランスクライブします。最大10時間、タイムアウトなし。

音声または動画をドロップ

Paste a link, we’ll fetch the audio

ブラウザから直接録音

何時間でも。 1つのきれいなファイルで完了。

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro、DIY Whisper チャンキング、またはTranscription.Solutions。

Otter Pro

Transcription.Solutions

Whisper API + DIY チャンキング

汎用ツールが 90分を過ぎて失敗する3つの方法。

何が問題になるか

ここで変更すること

長いファイルの推奨ジョブ設定

92%は5時間ファイル全体で維持されます。品質は時間ごとに変わりません。

8つのよくある質問 — 長いオーディオトランスクリプションについて。

長いファイルをドロップしたら、 1つのトランスクリプトを取得。

長いオーディオファイルをトランスクライブします。最大10時間、タイムアウトなし。

音声または動画をドロップ

Paste a link, we’ll fetch the audio

ブラウザから直接録音

何時間でも。 1つのきれいなファイルで完了。

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro、DIY Whisper チャンキング、 またはTranscription.Solutions。

Otter Pro

Transcription.Solutions

Whisper API + DIY チャンキング

汎用ツールが 90分を過ぎて失敗する3つの方法。

何が問題になるか

ここで変更すること

長いファイルの推奨ジョブ設定

92%は5時間ファイル全体で維持されます。 品質は時間ごとに変わりません。

8つのよくある質問 — 長いオーディオトランスクリプションについて。

長いファイルをドロップしたら、 1つのトランスクリプトを取得。

Otter Pro、DIY Whisper チャンキング、またはTranscription.Solutions。

92%は5時間ファイル全体で維持されます。品質は時間ごとに変わりません。