转录最长10小时的音频文件 — 长音频转文本，无超时

转录长音频文件。最长10小时。无超时。

上传一个长音频文件 — 最长10小时、5 GB（Business支持）。我们并行分块，保持说话人ID从始至终的一致性，交付单个转录文件而不是编号文件夹。

Drop your audio or video

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

直接在浏览器里录音

注册只要 30 秒——之后直接在控制台里开始录音。

No card required~90s per 60-min fileSRT · VTT · DOCX · TXT文件 24 小时后自动删除

数小时的音频。一份清晰的文件。

大多数工具在90分钟左右超时或将你的长音频 分成编号的部分文件供你自己拼接。我们以12分钟的重叠窗口分块、并行处理，然后通过全局说话人检测来重新组合。

董事会战略会议REC 3位说话人 · 5:14:22 · 3.1 GB

自动检测 en-GB44.1 kHz立体声 · 192 kbps

~90s

转录文本 · 单个文件92%准确率 · t=3:14:08

我们已经三小时了 — 让我们回到上午会议中提到的供应链问题。

对，越南制造转向。我认为我们忽略了交期风险。

关税变化后，交期从14天增加到31天。

那还没有考虑长滩港的拥堵情况。

整个5小时文件的准确率为92%DOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2导出

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

待办事项

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

对长文件的限制是每个录音4小时。说话人标签在2小时后会偏移。

最大文件长度4小时（Pro版本）

最大文件大小约1.5 GB上传

说话人ID从始至终2小时后有偏移

长文件输出单个文档，在上限处截断

价格$16.99/用户/月

可恢复上传否

Best for2小时以内的短会议。对整天录音无法胜任。

Option 02

Transcription.Solutions

每个文件10小时。并行分块，全局说话人检测，输出DOCX。

最大文件长度10小时（Pro和Business）

最大文件大小2 GB Pro · 5 GB Business

说话人ID从始至终全局嵌入检测

长文件输出单个文件 · DOCX/SRT/TXT

价格 · 按分钟$0.03统一价，与长度无关

可恢复上传分多部分，可从断点续传

Best for全天研讨会、书面供述、董事会会议、口述历史 — 任何超过90分钟的内容。

Option 03

Whisper API + 自己做分块

每分钟最便宜。你需要构建分块器、说话人拼接和重试逻辑。

最大文件长度每请求25 MB（约25分钟）

最大文件大小25 MB硬上限

说话人ID从始至终无 — 不支持说话人分离

长文件输出编号的部分文件，你自己拼接

价格 · 按分钟$0.006（OpenAI Whisper）

工程时间每个管道需要数小时到数天

Best for想要每块原始文本且不需要说话人、摘要或单个输出的工程师。

定价和限制截至2026年5月准确无误。Otter Pro长度上限最后在其公开定价页面验证。

关于长音频转录的8个常见问题。

01实际文件长度和大小限制是多少？+

Pro和Business上都是每个文件10小时。 Pro的文件大小上限为2 GB，Business为5 GB。如果你有超过10小时的内容，可在自然断点处分割一次 — 如果你在同一项目中连续上传它们，我们将保持说话人ID的一致性。

02我会得到一份转录文件还是一个编号文件夹？+

一个文件。总是。DOCX、SRT、TXT或JSON — 由你选择。时间戳从00:00:00连续运行到录音结束，不会在每个分块边界重置。

036小时的文件需要多长时间完成？+

Pro队列大约18-25分钟，Business优先队列8-12分钟。我们并行处理12分钟的分块，所以实际时间增长不在与文件长度线性，而是更慢增长。

04说话人ID从始至终保持一致吗？+

是的。分块后处理后，全局嵌入检测会在整个文件中对语音进行聚类。第12分钟的说话人3是同一个第487分钟的说话人3。这是自己做Whisper管道最常出错的地方。

05如果我的上传在4 GB文件的第3小时时断了呢？+

可恢复的分多部分上传从最后完成的部分继续。你不需要重新上传前3 GB。在糟糕的酒店Wi-Fi和移动热点上都有效 — 我们都测试过。

06为什么Whisper API在长文件上失效？+

OpenAI的Whisper端点有每请求25 MB的硬上限 — 大约25分钟的压缩音频。任何更长的内容都需要你分块、并行转录，然后自己拼接转录文本并对齐说话人。我们在服务器端做所有这些。

0710小时文件的每分钟价格与10分钟文件相同吗？+

是的。无论长度如何，每分钟$0.03统一价。 一个10小时文件成本$18。与Rev不同，我们不对长文件额外收费（人工转录$1.50/分钟 × 10小时 = $900）。

08我能获得章节标记或每小时的时间戳吗？+

在任务表单上打开'小时标记'，DOCX每60分钟导出一个标题分割。SRT保持连续时间码。JSON同时有两者 — 章节数组加上单词级时间戳。

转录长音频文件。最长10小时。无超时。

Drop your audio or video

Paste a link, we’ll fetch the audio

直接在浏览器里录音

数小时的音频。一份清晰的文件。

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro。自己做Whisper分块。或我们。

Otter Pro

Transcription.Solutions

Whisper API + 自己做分块

三种通用工具在90分钟后失效的方式。

会出什么问题

这里的改进方向

长文件推荐的任务设置

92%的准确率在5小时文件中保持稳定。质量逐小时保持一致。

关于长音频转录的8个常见问题。

上传你的长文件。获得一份转录。

转录长音频文件。最长10小时。无超时。

Drop your audio or video

Paste a link, we’ll fetch the audio

直接在浏览器里录音

数小时的音频。 一份清晰的文件。

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro。自己做Whisper分块。 或我们。

Otter Pro

Transcription.Solutions

Whisper API + 自己做分块

三种通用工具 在90分钟后失效的方式。

会出什么问题

这里的改进方向

长文件推荐的任务设置

92%的准确率在5小时文件中保持稳定。 质量逐小时保持一致。

关于长音频转录的8个常见问题。

上传你的长文件。 获得一份转录。

数小时的音频。一份清晰的文件。

Otter Pro。自己做Whisper分块。或我们。

三种通用工具在90分钟后失效的方式。

92%的准确率在5小时文件中保持稳定。质量逐小时保持一致。

上传你的长文件。获得一份转录。