YouTube Shorts 转录。60 秒视频,10 秒得到转录。

粘贴 Shorts URL 或上传 MP4。几秒内得到 SRT、VTT 和干净文本 — 随时可将Shorts 剪辑重新用于 Reels、TikTok 或博文。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 看看输出结果

Shorts URL 输入。 字幕输出。

我们在服务器端从 Shorts 视频中提取音频,去除音乐底层,返回带时间戳的文本和帧精准的 SRT。无需浏览器扩展、OBS 捕获或自己去抓取。

youtube.com/shorts/aB3kQ…REC 1 位演讲者 · 00:58
自动检测 en-US44.1 kHz · 人声轨道隔离
~90s
转录 · 流媒体94% 准确度
S1

三个没人告诉你的 iPhone 设置 — 第一个隐藏在无障碍中。

S1

进入设置、无障碍、触感,然后向下滚动到背面轻点。

S1

将双击设置为截屏。现在你可以单手截屏。

S1

保存这个,免得它淹没在你的信息流中。

谈话头类 Shorts 上 94% 准确度SRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

三个真实方案 · 诚实对比

YouTube 自动字幕。SubMagic。 或我们。

YouTube 在 Studio 内免费生成字幕。SubMagic 和类似产品(CapCut、Veed)将动画字幕烧录到视频中。我们提供原始转录和干净的字幕文件,你可以带到任何地方使用。

选项 01

YouTube 自动字幕

免费,内置 Studio。局限在 YouTube,偏向英语,无真正的导出。

需要拥有 Shorts 频道
演讲者标签
语言约 13 种可靠
导出Studio 中的 SBV / SRT
音乐处理经常插入 [Music]
成本免费
Best for只需在 YouTube 本身上添加字幕且不在其他地方重新用途的创作者。
选项 02

Transcription.Solutions

粘贴任何公开 Shorts URL。获得干净的 SRT、VTT 和文本 — 你可以在任何地方使用。

需要公开 URL 或 MP4
演讲者标签包含人声分离
语言99 种,自动检测
导出SRT · VTT · DOCX · TXT · JSON
音乐处理默认打开人声隔离
成本 · 每分钟$0.03
Best for将 Shorts 重新用于 TikTok 和 Reels 的创作者、运营他人频道的代理机构、任何想让文本在 Studio 之外的人。
选项 03

SubMagic / CapCut

烧录动画字幕。在屏幕上看起来很棒,但文本存在于像素内。

需要上传源 MP4
演讲者标签仅单个演讲者
语言约 30 种,英语优化
导出视频文件(非文本)
音乐处理好 — 为短视频而生
成本约 $10–25/月
Best for想要弹出式单词级字幕烧录到导出中且不需要原始转录的创作者。

定价和功能标志近似截至 2026 年。YouTube 字幕语言支持因地区而异。

Shorts 特定

给 Shorts 创作者的三个坑。 通用转录工具

Shorts 不是缩小的播客。音乐底层、速度和主题标签密集的脚本都会破坏为会议而生的工具。

什么会出错

  1. 1音乐底层混音过热。通用 ASR 将歌词转录到你句子的中间。你会得到'[Music] go to settings [Music] tap on'。
  2. 2品牌名和主题标签(Notion、Arc、Linear、#buildinpublic)以小写和音译形式返回。重新上传时字幕显得业余。
  3. 3快速节奏的演讲。Shorts 创作者以 200+ 字/分钟的速度讲话以将钩子融入 60 秒。为会议节奏调优的工具会丢掉词尾。

这里要切换什么

  1. 1保持人声隔离打开 — 这是默认值。我们在识别前运行音乐抑制处理,所以歌词不会泄漏到转录中。
  2. 2将你的品牌列表放入自定义词汇表。频道名、产品名、常见主题标签。我们将它们作为偏差提示传递给识别器。
  3. 3选择短形式演讲者模型。它针对单演讲者、快速节奏演讲调优,对词边界检测的权重比会话模型更重。

Shorts 推荐工作设置

粘贴 Shorts URL,这些默认打开。从表单按工作覆盖。

输入
公开 URL 或 MP4 上传
演讲者模型
短形式 · 1-2 位演讲者
人声隔离
打开(音乐抑制)
填充词
保留 — 创作者要精确
摘要
钩子 + 回报(Pro/Business)
导出
SRT · VTT · 词级 JSON

Accuracy · real-world numbers

谈话头类 Shorts 上 94%。 音乐底层设定了上限。

Shorts 很短,所以一个错词就很明显。音乐轨道人声隔离是我们调优的方向。下面的数字来自我们处理的真实 Shorts URL,不是合成剪辑。

96%
Studio 旁白,无音乐

录进麦克风,音乐在后期添加但混音较低。最干净的情况 — 错误主要在专有名词和俚语上。

94%
谈话头,轻音乐底层

手机或 DSLR,音乐混音在语音下。人声隔离干净地提升对话。大多数 Shorts 归于此类。

87%
大声热门音频背景

音乐与语音处于同一级别。硬辅音和与对话重叠的歌词处有词裁切。

82%
街道、现场或 B-roll 旁白

风声、交通、环境人群。可用文本但预期数字、名字和品牌提及需 30 秒清理通过。

常见问题

创作者经常问的 8 个问题。 关于 Shorts 转录

01我可以直接粘贴 youtube.com/shorts/ URL 吗?+
可以 — 这是主要流程。粘贴 URL,我们在服务器端获取公开音频并开始转录。无需浏览器扩展、OBS 捕获或先下载 MP4。
02它对我不拥有的 Shorts 有效吗?+
可以,只要 Shorts 是公开的。我们无法访问未列出或私人视频,因为 YouTube 会阻止这些内容的匿名获取。对于私人 Shorts,从 Studio 下载 MP4 并直接上传。
03SRT 会与重新上传到 TikTok 或 Reels 的视频对齐吗?+
会。时间戳引用音频开始,所以只要你在重新上传时不裁剪剪辑的头部,SRT 就能干净地插入。裁剪前面?在任何字幕编辑器中减去该偏移。
04音乐会怎样 — 它会像 YouTube 一样显示为 [Music] 吗?+
不会。我们在识别前运行人声隔离,所以音乐底层被抑制,我们只转录语音。你不会看到 [Music] 标签散布在整个转录中。
05免费套餐能做多少个 Shorts?+
每月 30 分钟。平均 Shorts 是 30-45 秒,所以大约是每月 40-60 个 Shorts在你切换到 Pro 之前。免费层上包含人声分离和 SRT 导出。
06你们处理动画字幕的词级时间戳吗?+
是的,在每个计划上。在导出下拉菜单中选择词级 JSON。你可以直接将其输入 CapCut、Premiere 或自定义 Remotion 模板以渲染弹出式字幕。
07非英文 Shorts 怎样?+
支持 99 种语言,从音频自动检测。西班牙语、葡萄牙语、印地语、菲律宾语、阿拉伯语 — 所有在生产中测试。混合语言 Shorts(代码转换)有效但准确度下降 4-6 点。
08我能从转录中获得摘要或标题建议吗?+
是的,在 Pro 和 Business 上。摘要返回单行钩子、回报和 3-5 个基于脚本的建议标题变体。免费套餐仅获得转录。

粘贴 Shorts URL。 看看输出结果。

每月 30 免费分钟 — 数十个 Shorts。无需卡。每个计划都包含 SRT、VTT 和词级 JSON。

免费开始