フォーカスグループ文字起こし。全員にラベルを、全ての言葉を。

6人、8人、10人の声が入ったフォーカスグループ録音をドロップすれば、各参加者にラベル付きの逐語記録、クロストークのタグ、NVivo にそのまま読み込める DOCX が手に入ります。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 出力をご覧ください

8人の参加者が入ると、 逐語記録で出ます。

フォーカスグループは、我々のキューの中で最難度の音声ダイアライゼーションケースです — 類似の人口統計、似た声、頻繁なクロストークの重複。我々はそれをドロップするのではなくインラインでタグを付け、Speaker 3 を 'Participant_F2' に一度リネームすると、全体に反映されます。

フォーカスグループ録音REC モデレーター+ 7 参加者 · 1:23:14
自動検出 en-US44 kHz バウンダリーマイク · WAV
~90s
トランスクリプト · ストリーミング91% 精度 · 8 スピーカー
S1

最初にパッケージを開いたときのことを説明してもらえますか — 何に気づきましたか。

S2

正直に言うと?最初は匂いでした。病院みたいな、クリニカルな感じ —

S3

ああ、同じだ。ラベンダー香って書いてあるのかと思ったのに。

S2

そう、ラベンダーって書いてあるのにそれっぽくない —

8スピーカー・ルームマイク上で91%DOCX(QDA対応) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

3つの選択肢 · 正直な比較

Rev人間翻訳。汎用AI。 それとも私たち。

���究者は通常、人間の文字起こし者に支払う(遅い、正確、高い)か、8音声ルーム用に構築されていない汎用AIツールでファイルを実行するかのどちらかを選びます。我々はその中間です — AI のスピード、リサーチ録音向けにチューニングされたダイアライゼーション、NVivo に手術なしで読み込める DOCX。

Option 01

Rev 人間逐語記録

人間がタイプします。精度が高いですが、24時間のターンアラウンドと料金はコンテンツ時間に応じて線形にスケールします。

精度〜99%(人間)
ターンアラウンド12〜24時間(一般的)
クロストークマークあり [crosstalk]
QDA エクスポートDOCX、手作業でクリーンアップ
分当たりの料金$1.50 逐語記録
90分グループ〜$135
Best for博士論文や、すべての音声乱雑さが人間で検証されなければならない規制研究。
Option 02

Transcription.Solutions

6〜10音声用にチューニングされたダイアライゼーション、インラインでタグ付けされたクロストーク、NVivo、ATLAS.ti、Dedoose 向けのサイズ調整された DOCX エクスポート。

精度グループオーディオ上で88〜94%
ターンアラウンド〜1×リアルタイム
クロストークタグ付き、ドロップなし
QDA エクスポートスピーカーターン付き DOCX
分当たりの料金$0.03
90分グループ〜$2.70
Best for複数グループを実施している研究者で、初回パスのトランスクリプトが明日の朝までに NVivo に必要(来週ではなく)。
Option 03

Otter / Sonix

ミーティング向けの汎用AI。2〜3スピーカーで普通ですが、5を超えるとボロボロになり、エクスポートは QDA ソフトウェアを想定していません。

精度5スピーカーを超えるとドロップ
ターンアラウンド高速
クロストークドロップされることが多い
QDA エクスポートネイティブ NVivo フォーマットなし
スピーカー上限ソフトリミット 〜6
料金$17〜22/ユーザー/月
Best for録音に2〜3音声があり、カレンダーワークフローに含まれる短いインタビューと1対1。

価格は2026年5月現在。精度範囲は合成ベンチマークではなく、顧客フォーカスグループファイルの内部サンプルから派生しています。

フォーカスグループに固有

で研究者が直面する3つのこと。 汎用AIツール

最初に正しい設定をフリップすれば、トランスクリプトはクリーンアップの週末なしで NVivo に落ちます。

何が悪くなるか

  1. 1クロストークがドロップされます。 通常、ほとんどのコンシューマーツールは重複中に1人のスピーカーを選択し、残りを破棄します。コンセンサスやプッシュバックが発生する瞬間を失います。
  2. 2スピーカーが3に崩壊します。 ツールはミーティングサイズのルームを想定し、ダイアライゼーションクラスタを低く キャップします。8人の参加者は「Speaker 1」「Speaker 2」「Speaker 3」として戻ります。
  3. 3エクスポートはテキストの壁です。 スピーカーターン単位の段落を破棄、NVivo がインポート時に自動コード化できる DOCX 構造はありません。

ここで何をフリップするか

  1. 1ジョブフォームで重複する音声をタグ付けするをオンにします。クロストークはインライン `[overlap]` マーカーを取得し、両方のスピーカーは発話を保持します。
  2. 2予想スピーカー: 8〜12 を明示的に設定します。推測ではなく、予想に対応するようにダイアライゼーションクラスタ数をサイズ調整します。
  3. 3DOCX(QDA対応)エクスポートを選択します。スピーカーターンはラベル付きプレフィックスの段落になります — NVivo、ATLAS.ti、Dedoose はすべてインポート時にこのフォーマットを自動検出します。

フォーカスグループの推奨ジョブ設定

「研究」テンプレートでフォーカスグループファイルをドロップすると、これらはデフォルトでオンになります。フォームからジョブごとにオーバーライドしますo

ダイアライゼーション
アコースティック · 予想スピーカー 6〜10
逐語モード
フル — 音声乱雑さを保持
重複処理
[overlap] でインラインタグ
カスタム語彙
スクリーニングからの製品/ブランド名
スピーカーラベル
ジョブ後に編集可能、全てに反映
エクスポート
DOCX(QDA対応) · タイムスタンプ付き TXT

Accuracy · real-world numbers

ラバリア式で参加者ごとに94%。 シングルルームマイクで82%を維持。

フォーカスグループの精度はマイク配置でボトルネック — モデルではありません。全参加者にラバリアマイクがあれば、参加者ごとにクリーンなチャネルが得られます — ダイアライゼーションは簡単になります。8音声のカンファレンステーブルの上のシングルバウンダリーマイクは難しいケースです。以下の数値は、パイプラインの実際のリサーチ録音から来ています。

94%
参加者ごとのラバリア

各参加者は独自のトラック上で、マルチトラック WAV に混在。ダイアライゼーションはスキップ — テキストのみのエラー。博士論文レベルの仕事に最適。

91%
カンファレンスマイク、4〜6参加者

テーブルに中心置きのバウンダリーマイク、中程度のルーム処理。声は見分けられ、同じ性別で同じような年代の参加者間で時々混乱。

86%
シングルルームマイク、7〜10参加者

クロストークは頻繁で、似た声は音響ダイアライゼーション下でマージします。分析前に、スピーカーチップのリネームおよびマージにのパス(10分間)を予想してください。

82%
モノ Zoom のリモートグループ

圧縮モノミックス、チャネルごとの分割は利用不可。言葉はテーマティックコーディングに使用可能ですが、軽微レベルの逐語請求はここで弱まります。

よくある質問

フォーカスグループ文字起こしについてよく聞かれる8つのこと。

01Speaker 1 を参加者の実名またはID にリネームできますか?+
可能です。エディターの任意のスピーカーチップをクリックし、名前またはスクリーニング ID(例:'P04_F_34')を入力すると、そのスピーカーからのトランスクリプトのすべてのターンに反映されます。DOCX エクスポートはリネームされたラベルを使用します。
02クロストークと重複する音声をどのように処理しますか?+
我々は `[overlap]` マーカーでインラインでタグを付け、トランスクリプトに両方のスピーカーの発話を保持します。汎用ツールは通常、1つの音声を選択して他方をドロップします — 重複の瞬間がしばしばフォーカスグループの実際のダイナミクスが一番目立つ場所のため、我々はそうしません。
03DOCX は本当に NVivo と ATLAS.ti に���リーンにインポートされますか?+
はい。我々はスピーカーラベルを段落形式の見出しとしてエクスポートします。NVivo はインポート中にこれを自動コード化し、ATLAS.ti はスピーカーターンとして認識します。Dedoose はトランスクリプトインポートパスを介して同じ DOCX を受け入れます。
041つのファイルで何人のスピーカーをダイアライゼーションできま?+
ソフト上限は12人です。それを超えると、音響クラスタリングは似た声をマージし始めます — 通常、あなたの側で10〜15分のリネームパスが必要になります。最良の結果のためにジョブフォームで「予想スピーカー」を明示的に設定します。
05逐語またはクリーンアップ — 選べますか?+
両方可能です。逐語モードはすべての「um」、フォルススタート、繰り返された言葉をディスコース分析用に保持します。クリーンアップは可読性のために音声乱雑さを削除します。ジョブごとに選択できます。研究テンプレートのデフォルトは逐語です。
06IRB 要件と参加者の機密性について?+
ファイルは当社のインフラストラクチャで処理され、第三者 API に送信されません。ジョブごとにフラグをN日後に自動削除するオプションを提供しており、IRB プロトコルに対応しています。我々は SOC 2 Type II および GDPR 準拠で、IRB が必要な場合、DPA は法務ページにあります。
07ビデオのみまたはオーディオのみで最良の結果が得られますか?+
オーディオのみで問題ありません — ダイアライゼーション用にビデオは使用しません。参加者識別用のビデオがある場合、独自のコーディング用にローカルで保持します。オーディオトラックのみのアップロードは高速で安価です。
08Rev 人間逐語記録と比較して費用はどうですか?+
90分のフォーカスグループは、ここで約 $2.70、Rev 逐語記録で約 $135 です。トレードオフは精度です。我々はマイク設定に応じて 86〜94% に着地し、Rev の人間文字起こし者は〜99% に達します。ほとんどの研究者は我々を初回パス用に使用し、必要な場合のみ特定のグループを人間にエスカレートします。

フォーカスグループ録音をドロップすれば、 トランスクリプトが明日 NVivo に。

毎月30分無料。カードは不要。スピーカーラベル、クロストークタグ、QDA対応 DOCX エクスポートはすべてのプランに含まれます。

無料で始める