Rev 人工转录
真人输入你的采访。在困难音频上最佳,但需要等待且成本高。
电话语音备忘录、Zoom 通话、领夹式麦克风或便携式录音机 — 上传采访录音,获得带有说话人标签、时间戳的文本,可直接引用。
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ 看看输出结果
大多数采访是一个设备上的两个人 — 桌子上的手机、你们之间的录音机。我们甚至从单声道频道中将采访音频分离为记者和受访者,然后为每个转折处标注时间戳以供引用。
你能跟我讲一下十八号早上你看到的情况吗?
我大约六点到那里。装货湾的门已经开了,本来不应该开的。
你之前报告过门的问题 — 向谁报告的?
向设施部的 Diane Okafor 报告的,3 月报告了两次。我有邮件。
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
三个真实选项 · 诚实比较
Rev 将你的音频发送给人工转录员 — 慢且昂贵,但在困难音频上保证高保真度。Otter 和 Trint 同我们一样是 AI 优先,针对记者和研究人员调优。以下是每个的适用场景。
真人输入你的采访。在困难音频上最佳,但需要等待且成本高。
AI 转录,说话人分离,几分钟内完成。电话备忘录、Zoom 或便携式录音机采用相同引擎。
AI 转录,配备研究型编辑器。英文强势,仅限月度计划。
定价和功能标志截至 2026 年准确。Rev 人工转折时间因队列深度和音频长度而异。
采访特定
采访音频很少是清晰的。翻转这些设置,转录在引用时就能经受考验。
上传采访文件,这些默认打开。从表单按工作覆盖。
Accuracy · real-world numbers
采访准确率由麦克风实际听到的内容所限制。每个说话人各一个近距离麦克风的立体声是上限;放在嘈杂桌子上的手机是下限。以下数字来自生产采访文件,而非合成基准。
每个说话人一个麦克风,独立频道(Zoom H5/H6、Tascam DR-40)。话者分离微不足道 — 错误仅在文本上。
两个说话人之间放一个单声电容麦克风,房间安静。声学话者分离在 4 英尺以内可靠分离声音。
iPhone 或 Pixel 语音备忘录放在桌子上。名字和数字偶尔漏掉;节奏适合引用。
浓缩咖啡机、交通、附近的第三个声音。我们数据中最坏的情况 — 可用于导航,根据音频验证引言。
常见问题