焦点小组转录。每个发言者有标签,每个词都有。

放入一个焦点小组录音,有6个、8个,甚至10个声音。获得逐字记录转录,每个参与者都有标签,交叉说话被标记,DOCX可以直接加载到NVivo中。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 看看输出什么

八个参与者进去。 标记逐字记录出来。

焦点小组是我们队列中最难的分层案例——人口统计相似、声音相似、频繁交叉说话重叠。我们内联标记重叠而不是丢弃,然后你重命名发言者3 → 'Participant_F2'一次,它就会传播。

焦点小组录音REC 主持人 + 7名参与者 · 1:23:14
auto-detected en-US44 kHz boundary mic · WAV
~90s
转录·流式传输91%准确度 · 8发言者
S1

所以当你第一次打开包装时——告诉我你注意到了什么。

S2

老实说?首先是气味。就像医院一样,有点临床——

S3

是的,一样。我以为应该是薰衣草的。

S2

对,标签上说薰衣草,但实际上根本不是——

8发言者房间麦克风91%准确度DOCX(QDA就绪)· SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

三个真实选项·诚实比较

Rev人工。通用AI。 或者我们。

研究人员通常在支付人类转录员(缓慢、准确、昂贵)或通过不是为8个声音房间构建的通用AI工具运行文件之间选择。我们介于两者之间——AI速度、针对研究录音优化的分层、以及可以直接放入NVivo而无需修改的DOCX。

Option 01

Rev人工逐字

人类输入。精度高,但24小时周转,价格随时数线性增加。

准确度~99%(人工)
周转时间12–24小时典型
交叉说话标记为[crosstalk]
QDA导出DOCX,手动清理
成本·每分钟$1.50逐字
90分钟小组~$135
Best for学位论文或受管制研究,其中每个不流畅都必须由人工验证。
Option 02

Transcription.Solutions

分层为6-10个声音优化,交叉说话内联标记,DOCX导出适配NVivo、ATLAS.ti和Dedoose。

准确度群组音频88–94%
周转时间~1倍实时
交叉说话标记,不丢弃
QDA导出DOCX带发言者轮流
成本·每分钟$0.03
90分钟小组~$2.70
Best for进行多个小组的研究人员,他们需要明天早上在NVivo中获得初始转录,而不是下周。
Option 03

Otter / Sonix

为会议而构建的通用AI。2-3个发言者表现不错,超过5个就退化——导出不是为QDA软件设计的。

准确度超过5个发言者会下降
周转时间快速
交叉说话经常被丢弃
QDA导出没有本地NVivo格式
发言者限制软限制~6
成本$17–22/用户/月
Best for小型采访和1对1对话,其中录音有2-3个声音且存在于日历工作流中。

定价截至2026年5月准确。准确度范围来自我们客户焦点小组文件的内部样本,不是合成基准。

焦点小组的特定之处

通用AI工具对研究人员造成的三个问题。

预先翻转正确的设置,转录就会进入NVivo而无需清理周末。

出了什么问题

  1. 1交叉说话被丢弃。 大多数消费者工具在重叠期间选择一个发言者并丢弃其余的。你会丢失共识或反驳发生的时刻。
  2. 2发言者下降到3个。 工具假设会议大小的房间并将分层群集设定较低。你的8个参与者回来时为'发言者1' / '发言者2' / '发言者3'。
  3. 3导出是一面文字墙。 每个发言者轮流没有段落中断,没有NVivo在导入时可以自动编码的DOCX结构。

这里要翻转什么

  1. 1��工作表单中打开标记重叠言论。交叉说话获得内联`[overlap]`标记,两个发言者都保留他们的陈述。
  2. 2设定预期发言者:8-12明确。我们将分层群集计数调整为匹配而不是猜测较低。
  3. 3选择DOCX(QDA就绪)导出。发言者轮流变成以标签为前缀的段落——NVivo、ATLAS.ti和Dedoose在导入时都会自动检测此格式。

焦点小组的推荐工作设置

放入具有'研究'模板的焦点小组文件,这些默认翻转。从表单按工作覆盖。

分层
声学·预期6-10个发言者
逐字模式
完全——保持不流畅
重叠处理
内联标记[overlap]
自定义词汇
筛选者的产品/品牌名称
发言者标签
工作后可编辑,传播全部
导出
DOCX(QDA就绪)·带时间戳的TXT

Accuracy · real-world numbers

领夹麦克风每参与者94%。 单个房间麦克风时保持在82%。

焦点小组准确度受麦克风拓扑限制,而不是模型。每个参与者的领夹麦克风为我们提供干净的每发言者通道——分层变得微不足道。一个边界麦克风在会议桌上有8个声音是困难的情况。下面的数字来自我们管道中的真实研究录音。

94%
每个参与者的领夹麦克风

每个参与者在自己的轨道上,混合至多轨WAV。分层跳过——仅文本错误。学位论文级工作的最佳情况。

91%
会议麦克风,4-6名参与者

边界麦克风在桌子中心,房间处理适度。声音可区分,同性别和相似年龄的参与者之间偶有混淆。

86%
单个房间麦克风,7-10名参与者

交叉说话频繁,相似的声音在声学分层下合并。在分析前,预期对发言者芯片进行10-15分钟的重命名和合并。

82%
Zoom上的远程小组单声道

压缩单声道混合,没有每通道拆分可用。言语仍可用于主题编码,但不流畅级逐字声明在此处减弱。

常见问题

的8个常见问题。 关于焦点小组转录

01我能把发言者1重命名为参与者的实际名称或ID吗?+
能。点击编辑器中的任何发言者芯片,输入名称或筛选器ID(例如'P04_F_34'),它会传播到该发言者在转录中的每个轮次。DOCX导出使用重命名的标签。
02你如何处理交叉说话和重叠言论?+
我们用`[overlap]`标记内联标记,并在转录中保留两个发言者的陈述。通用工具通常选择一个声音并丢弃另一个——我们不这样做,因为重叠时刻通常是焦点小组动态实际存在的地方。
03DOCX真的能干净地导入到NVivo和ATLAS.ti吗?+
能。我们导出时带有发言者标签作为段落样式标题,NVivo在导入时自动编码,ATLAS.ti将其识别为发言者轮次。Dedoose通过其转录导入��径接受相同的DOCX。
04你最多能在一个文件中分层多少发言者?+
软限制约12个。超过这个,声学群集开始合并相似声音——这通常意味着你最后进行10-15分钟的重命名。在工作表单中明确设置'预期发言者'以获得最佳结果。
05逐字或清理——我能选择吗?+
都能。逐字模式保留每个'嗯'、错误开始和重复的词进行言论分析。清理去除不流畅之处以提高可读性。你按工作选择;研究模板的默认值是逐字。
06对于IRB要求和参与者保密呢?+
文件在我们的基础设施中处理,不发送给第三方API。我们为IRB协议提供按工作自动删除-N日后标志。我们是SOC 2 Type II和GDPR兼容;如果你的IRB需要,DPA在法律页面上。
07我应该录制视频还是仅音频?+
仅音频就可以——我们不使用分层视频。如果你有参与者识别视频,请将其保存在本地以进行自己的编码;仅上传音频轨道更快更便宜。
08成本与Rev人工逐字相比如何?+
90分钟焦点小组在这里运行约$2.70,而在Rev逐字上约$135。权衡是准确度:我们落在86-94%,取决于麦克风设置,Rev的人类转录员达到~99%。大多数研究人员使用我们进行初始转录,仅当需要时升级特定小组为人工。

放入焦点小组录音。 明天在NVivo中看到转录。

每个月免费30分钟。无卡。发言者标签、交叉说话标记、QDA就绪DOCX导出包含在每个计划中。

免费开始