Rev 人力文字起こし
実際の人間があなたのインタビューをタイプします。悪い音声に最適ですが、待つ必要があり、費用が高いです。
電話の音声メモ、Zoom 通話、ラベリアン マイク、またはハンドヘルド フィールド レコーダー — インタビュー音声をドロップしたら、スピーカーラベル付きで、タイムスタンプ付きのテキストが得られ、引用できます。
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ 出力結果を確認
ほとんどのインタビューは 1 つのデバイス上の 2 人 — テーブルの上の電話、あるいはあなたの間に置いた録音機です。単一のモノ チャンネルからでも、レポーターと出典をインタビュー音声から分離して、引用のためにすべてのターンにタイムスタンプをつけます。
18 日の朝に見たことについて、詳しく教えていただけますか?
6 時頃に着きました。ローディング ベイのドアはすでに開いていて、そのはずではありませんでした。
そのドアの問題については以前報告されていたと思いますが、だれに報告されましたか?
施設の Diane Okafor に 3 月に 2 回報告しました。メールがあります。
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
3 つの選択肢 · 正直に比較
Rev は音声を人間の文字起こし者に送ります — 遅く、高い費用ですが、悪い音声で高い忠実度です。Otter と Trint は AI ファースト(私たちと同じ)で、ジャーナリストと研究者向けにチューニングされています。各選択肢がどこに適合するかを以下に示します。
実際の人間があなたのインタビューをタイプします。悪い音声に最適ですが、待つ必要があり、費用が高いです。
AI トランスクリプト、スピーカー分離、数分で準備完了。電話メモ、Zoom、フィールド レコーダーでも同じエンジンを使用。
研究指向のエディタ付き AI 文字起こし。英語が強く、月間プランに制限されています。
価格と機能フラグは 2026 年現在で正確です。Rev の人力ターンアラウンドはキュー深度と音声長によって異なります。
インタビューに特有
インタビュー音声はめったにクリーンではありません。以下の設定を切り替えると、トランスクリプトは引用に耐える力を持つようになります。
インタビュー ファイルをドロップするとこれらはデフォルトでオンになります。ジョブごとにフォームでオーバーライドします。
Accuracy · real-world numbers
インタビューの精度はマイクが実際に拾った音声で制限されます。各スピーカーの密閉マイク ステレオが上限で、テーブルの上に置かれた電話がノイズが多い下限です。以下の数字は合成ベンチマークではなく、本番インタビュー ファイルから取得しました。
スピーカーごとに 1 つのマイク、別のチャンネル(Zoom H5/H6、Tascam DR-40)。ダイアライゼーションは簡単で、エラーはテキストのみです。
2 スピーカーの間に単一のコンデンサー、静かな部屋。音響ダイアライゼーションは 4 フィート以下での音声分離を確実に行います。
iPhone または Pixel 音声メモをテーブルに置く。名前と数字は時々逃しますが、引用のためのペースは大丈夫です。
エスプレッソ マシン、トラフィック、近くの 3 番目の音声。私たちのデータで最悪のケース — ナビゲーションに使用可能で、オーディオに対して引用を確認してください。
よくある質問