学術研究者向けトランスクリプション。IRB対応、CAQDAS対応、100+言語対応。

研究インタビューまたはフォーカスグループの音声をアップロードしてください。スピーカーラベル付き、タイムスタンプ付きのテキストが NVivo、Atlas.ti、MaxQDA にすぐインポート可能 — 音声は24時間以内に削除されます。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 出力内容を見る

フィールド音声が入る。 コード化準備済みの文字起こしが出る。

参加者発言の開始位置にタイムスタンプを挿入し、逐語モードを選択すれば「えっと」などのフィラー語を保持。CAQDAS ツールが既に認識するスピーカースタイル付きで DOCX をエクスポートします。

半構造化インタビュー · .wavREC 2名 · 1:08:24
自動検出 en-GB44.1 kHz モノ · ラベリアマイク
~90s
文字起こし · ストリーミング94% 精度 · 逐語モード
S1

最初に近所が変わったことに気づいた時のことを教えてもらえますか?

S2

あ、多分 2019年だったと思う — コーナーのベーカリーが閉店して、ああ、その時点で気づいたんです。

S1

その数ヶ月間、そうなっていくのを見てどう感じましたか?

S2

正直なところ?30年知ってた場所が消えていくような、少しずつね。

ラベリアインタビューで 94%DOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

3つの実際の選択肢 · 正直な比較

Rev の人間翻訳。NVivo Transcription。 またはわたしたち。

Rev のヒューマンサービスはディサートーション向け引用の歴史的なデフォルトです。NVivo は AI 文字起こしを CAQDAS ツール内にバンドルしています。わたしたちはその中間 — Rev より高速で、NVivo の組み込みより正確で IRB に優しい。

Option 01

Rev(人間による文字起こし)

人間が入力します。遅く、高いが、出版対象の逐語版として金標準。

所要時間12~24時間(標準)
コスト · 分単位$1.50 人間 / $0.25 AI
スピーカーラベルはい、手動で配置
音声保持Rev サーバーに保管
言語EN 人間 · 約 30 AI
CAQDAS エクスポートDOCX、TXT(手動)
Best for論文での直接引用が出版予定で、予算に制約がない単一インタビュー向け。
Option 02

Transcription.Solutions

分単位で AI 文字起こし、24時間以内に音声削除、NVivo と Atlas.ti インポート対応の DOCX スタイル。

所要時間60分ファイルで約 5分
コスト · 分単位$0.03
スピーカーラベル話者分離済み、アプリ内で名前変更可
音声保持24時間以内に削除
言語100+、自動検出
CAQDAS エクスポートDOCX 見出しスタイル + TXT
Best for20+ インタビューを実施する研究者向け。高速なファースト パス文字起こしを取得し、出版予定の引用部分 5% は手修正。
Option 03

NVivo Transcription / Otter

CAQDAS ツールまたはノートアプリ内に統合された AI 文字起こし。便利だが、英語寄り、カスタマイズ性低め。

所要時間同等(AI)
コストクレジット パック · 約 $0.30/分
スピーカーラベル音響判定、英語チューニング
音声保持サブスクリプション期間中
言語非英語は精度低下
CAQDAS エクスポートNVivo のみ
Best forひとつの CAQDAS エコシステム内で英語のみの PhD 学生。請求書を統一したい場合。

2026年現在の価格と機能。Rev の AI/人間比率と NVivo Transcription クレジット料金は地域および学術ライセンスにより異なります。

定性研究に特有

研究者を困らせる3つのこと。 一般的な文字起こしツールで

アップロード前に正しい設定に切り替えると、文字起こしは CAQDAS プロジェクトに直接インポート可能。

何が起きるか

  1. 1フィラー語が無言削除される。 一般的な AI は「えっと」「ほら」「言い直し」を削除 — 会議記録ならいいが、会話分析や言説研究には致命的。
  2. 2領域用語(理論的枠組み、薬剤名、地名、親族用語)が音韻的に文字起こしされる。コード化時に検索置換パスが必要。
  3. 3音声ベンダーのサーバーに無期限保管される。 ほとんどの IRB データ管理計画は削除または管理保持を要求 — ベンダーはこれを明確に文書化することはめったにない。

ここで切り替えること

  1. 1ジョブフォームの逐語モードを有効にします。フィラー語、言い直し、繰り返し、笑い記号を保持 — クリーンモードはオプションで、研究者向けのデフォルトではありません。
  2. 2コードブック用語と固有名詞をカスタム語彙に貼り付けます。認識ヒントとして渡すので、ハード置換ではなく、文脈が優先。
  3. 3音声はジョブ完了から24時間以内に削除。文字起こしはアカウントに残ります。IRB ファイル用に削除確認を発行することもできます。

研究インタビュー推奨ジョブ設定

フィールド音声をアップロードすると、これらがデフォルトで有効化。ジョブから個別に上書き可。

モード
逐語(フィラー + 言い直し有効)
スピーカーモデル
インタビュー · 2~8人
言語
自動検出 · 訛り対応
タイムスタンプ
各スピーカーターン
音声保持
24時���以内に削除
エクスポート
DOCX (CAQDAS スタイル) · TXT · SRT

Accuracy · real-world numbers

クリーンなラベリアインタビューで 94%。 フィールド仕事がどこで精度を落とすか、正直に言う。

フィールド音声は文字起こしの難易度が高い事例です — 開放的な空間、訛りのある英語、フォーカスグループの重複発話。ラベリアマイクの1対1 インタビューは天井性能に到達易く、環境音ノイズのあるフィールド記録と大人数フォーカスグループほど精度低下が大きい。以下の数字は合成ベンチマークではなく、実際の研究者アップロードから算出。

95%
1対1、ラベリアまたは USB マイク

静かな部屋、単一の L2 話者またはネイティブ、テーブルの上のレコーダー。半構造化インタビュー最適ケース — ほとんどの1対1研究はここに該当。

91%
ハンドヘルドレコーダー、2~3人

Zoom H4n またはテーブル中央のスマートフォン。スピーカー位置は方向から判別。5分程度の名前変更パスを想定。

85%
フィールドインタビュー、背景ノイズ

カフェ、市場、歩きながらのインタビュー。背景の雑音と交通音は短い返答に影響。主な発言はコード化可能。

80%
フォーカスグループ、5~8人

重複発話と共有マイク。話者分離は静かい声の一部をマージする可能性 — コード化時に曖昧さを解く予定。

よくある質問

研究者から聞く8つのこと。 学術文字起こしについて

01典型的な IRB データ管理計画で認められますか?+
ほとんどのプランを見ると、この2つのポイントを読むと認可されます:音声はジョブ完了から24時間以内に削除され、文字起こしは研究者アカウントにのみ残されます。わたしたちは IRB ではありません — 最終判定は委員会が下します — ですがプロトコル用に書面処理説明を発行します。
02インタビュー音声を保持していますか?+
いいえ。音声ファイルはジョブ完了から24時間以内に削除されます。文字起こしのみアカウントに残り、いつでも削除可。わたしたちは研究音声をモデル学習に使用していません。
03真の逐語版 — フィラー、言い直し、重複発話を含む — 会話分析用に対応していますか?+
はい。ジョブフォームで逐語モードを有効にすると「えっと」「あ」「繰り返し」「言い直し」「笑い記号」を保持します。重複は発言境界にブレース記号でマークします。Jefferson 記法は自動ではありません — それは人間パスのままです。
04DOCX は NVivo、Atlas.ti、MaxQDA にクリーンにインポートできますか?+
はい。DOCX は各ツールが自動コード化スピーカーに期待する見出しとスピーカースタイルを使用。NVivo の場合は File → Import → Transcripts を使用。Atlas.ti と MaxQDA の場合、スピーカー段落構造が保持されているため、スピーカーによる自動コード化すぐに機能します。
05訛りのある英語や多言語インタビューはどう対応していますか?+
100+言語に自動検出対応。言語内のコード切り替えも含めます。重度の L2 訛りはクリーン音声で 85~90% に着地。少数言語の訓練データが疎なもの(例:一部アフリカ系言語、先住民言語)は精度が低くなり、言語ピッカーでそう表示します。
066~8人のフォーカスグループ — 話者分離は実際に機能していますか?+
部分的です。音響話者分離は共有マイクで 4~5 の異なる声を確実に分離。それ以上だと静かい 2 人がマージされる可能性があります。修正は文字起こしエディタで名前変更パス — ほとんどのフォーカスグループ文字起こしは 10~15分のクリーンアップが必要。
07共同 PI と大学院生が同じプロジェクトで文字起こしにアクセスできますか?+
はい。ワークスペースは共有フォルダをユーザー単位の権限でサポート — PI はすべてのインタビューを見られ、RA は割り当てコーホートのみ。複数サイト研究で一学生が別学生のデータをエクスポートさせない場合に便利。
08出版対象の直接引用で人間パスはありますか?+
まだぜったい、ないし約束もしません。論文や学位論文の引用ならば、推奨ワークフロー:AI 文字起こしを実行、CAQDAS でコード化、各引用の前後 30~60秒を音声に対して手修正(削除前)。これがわたしたちの研究者ユーザーが使うワークフロー。

1 つのインタビューをアップロード。文字起こしが一致するか確かめてください。 あなたのコード方法と

月30分無料。カード不要。逐語モード、100+言語、CAQDAS対応 DOCX、音声24時間以内削除。

無料で開始