Zoom 转录。带说话人标签,支持任意语言。

上传一段 Zoom 通话录制。得到带时间戳、说话人标签的转录稿,支持 99 种语言 — 无需 Zoom 付费套餐,也无需绑定在某个面板里。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 看看输出长什么样

云端录制传入, 干净转录传出。

当 Zoom 开启每位参与者独立声道录制时,我们直接借此分离说话人,无需猜测。只有单声道云端录制?声学分离会作为兜底方案。

Zoom 云端录制REC 3 位说话人 · 47:08
自动识别为 en-US16 kHz 立体声 · 128 kbps
~90s
转录稿 · 流式生成96% 准确率
S1

顺便确认一下 — Marcus,供应商的 SOW 签回来了吗?

S2

签回来了,周二到的。会后我转发给你。

S1

好。第三季度预测评审 — 还是周四吗?

S2

周四下午 2 点。PPT 今早已经发出去了。

立体声云端录制 96%SRT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

三个真实可选方案 · 坦诚对比

Zoom 内置功能。Otter 或 Fireflies。 或者我们。

Zoom 在付费套餐里提供自家转录。Otter 和 Fireflies 以机器人形式驻扎在你的日历里。我们既能处理你手头已有的文件,也能在你需要实时记录时派出机器人。

Option 01

Zoom 内置

Zoom 应用内的自动转录。仅限 Zoom 付费套餐。

前置条件Zoom Pro+($15/主持人/月)
说话人分离无(单声道下)
语言每场 1 种,偏向英语
导出仅 VTT,只在面板内
AI 摘要Zoom AI Companion(付费)
成本$15+/主持人/月
Best for已经用 Zoom Pro、只需要单一语言会议粗略文字稿的团队。
Option 02

Transcription.Solutions

上传录制文件,或派出机器人。兼容任意 Zoom 套餐 — 包括免费版。

前置条件Zoom 端无需任何配置
说话人分离立体声声道分离
语言99 种,自动识别
导出SRT · VTT · DOCX · TXT · JSON
AI 摘要所有套餐免费
成本 · 每分钟$0.03
Best for用免费版 Zoom 录制、跑多语言会议,或想把转录稿从 Zoom 面板里搬出来的所有人。
Option 03

Otter / Fireflies

机器人驻扎在你的日历里。界面好看,英语优先,文件大小有硬上限。

前置条件日历 OAuth + 付费
说话人分离声学方式,按英语调优
语言非英语准确率下降
导出2 GB 上限(Fireflies)
AI 摘要仅限付费套餐
成本$17–19/用户/月
Best for只用英语、想要日历原生机器人、且从不在 Zoom 之外录制的销售团队。

定价与功能信息截至 2026 年 5 月准确。Zoom AI Companion 的可用性取决于各地区的逐步开放进度。

Zoom 专属注意事项

上常让人栽跟头的三件事。 通用转录工具

录制前先开对设置,转录结果就会干净许多。

常见问题

  1. 1单声道云端录制。 Zoom 默认把所有人混进一个声道。声学分离随后会把相似嗓音并成同一位说话人。
  2. 2两到三字母的公司缩写(PSI、DKMS、Klue)会被按发音拼写。通用 AI 不知道它们是专有名词。
  3. 3聊天消息里的链接、ID、行动项独立于音频存在,常常被丢失。

正确做法

  1. 1会议前在 Zoom 中开启为每位参与者生成独立音频文件。我们识别到逐声道文件后会直接跳过分离。
  2. 2在任务表单的自定义词表里粘贴团队术语。我们会作为提示传给识别器,而不是强匹配。
  3. 3把机器人派到实时会议(而不是录制文件)。聊天消息会按时间顺序合并进转录稿。

Zoom 推荐任务设置

上传 Zoom 文件后,下列选项默认开启。每次任务可在表单中覆盖。

说话人分离
若可用,使用逐声道
说话人模型
对话型 · 2-8 位说话人
语言
自动识别 · 多语种开启
口头语
默认去除
摘要
行动项 + 决议
导出
DOCX · SRT · 带时间戳 TXT

Accuracy · real-world numbers

云端录制 96%+ 准确率。 电话拨入同样稳定。

上限由 Zoom 实际录到的内容决定。立体声逐声道云端录制是最佳情况;电话拨入的参与者掉得最快。下面的数字来自生产环境中真实客户的 Zoom 文件,不是合成基准。

96%+
逐声���云端录制

开启 Zoom 的「为每位参与者生成独立音频文件」设置。每位说话人单独成轨,跳过分离环节 — 误差只来自文本本身。

94%
立体声云端,≤3 位说话人

默认云端录制,128 kbps。立体声声道分离可可靠区分声音。多数 Zoom 通话落在这一档。

90%
单声道云端,4-6 位说话人

声学分离,相似嗓音可能被合并。预留 2 分钟手动重命名说话人标签。

87%
电话拨入参与者

8 kHz 窄带音频。文本可用,数字和专有名词偶有遗漏。我们数据中的最差情况。

常见问题

,大家常问的 8 个问题。 关于 Zoom 转录

01可以直接从 Zoom 云端录制链接拉取吗?+
不行。Zoom 云端链接需要你的 Zoom 账户登录 — 我们无法代你登录。先把 MP4 下载下来(zoom.us → Recordings → Download),再把文件拖到这里。只需 30 秒。
02机器人需要像 Otter 那样授权日历 OAuth 吗?+
不需要。你可以手动把机器人链接粘进 Zoom 邀请,或从我们的面板把机器人派到某个会议链接。我们不会读取你的日历。
03那 Zoom AI Companion 呢 — 它能转录吗?+
Zoom AI Companion 只提供摘要,并不输出带说话人标签和可导出文件的逐字稿。它也仅限 Zoom 付费套餐,且在很多企业环境中默认是关闭的。
04能处理多语言混合的国际 Zoom 通话吗?+
可以 — 自动识别会选定主导语言,识别器能在句中处理大多数语言对的代码切换。西班牙语 ↔ 英语、普通话 ↔ 英语,以及大多数印欧语言对都能干净处理。
05转录完成后录制文件会删除吗?+
会 — 任务完成 24 小时后删除。转录稿和导出文件会按你需要的时长保留在账户中。删除不可恢复,并会记录在审计日志中。
06机器人会作为参与者出现���会议中吗?+
会 — 机器人以带标签的身份像普通参与者一样加入。你可以在设置里改名(默认为「Transcription.Solutions」),在双方同意制地区还可配置自动告知。
07如果 Zoom 只存了单声道录制怎么办?+
声学分离会接手 — 我们通过声纹聚类来识别说话人。准确率不如逐声道(90% 对 96%),但仍可读。把「说话人 1/2」重命名一次后即可在全文生效。
08我只想要 SRT 用来重新上传字幕,可以吗?+
可以。每个任务都会默认生成 SRT 和 VTT。可通过 Zoom 的字幕上传功能重新上传,发布到 YouTube 时同样适用。

上传你的 Zoom 录制文件, 看看效果如何。

每月 30 分钟免费额度。无需信用卡。包含说话人标签、99 种语言、全部导出格式。

免费开始