為播客製作者提供的轉錄。節目大綱和 SRT 一次完成。

上傳你的播客劇集原始檔 — MP3、WAV 或 YouTube 連結。獲得帶有人物標籤的文稿、帶有重點和標籤的 AI 節目大綱,加上影片版本的 SRT。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 一份檔案進,四份成品出

劇集原始檔進。文稿、 節目大綱、SRT、標籤出。

大多數播客都是後期製作的立體聲 MP3,主持人和嘉賓已混合在一起。我們在聲學層面分離他們,偵測音樂介紹,並在第一句話開始謄寫文稿。

第 142 集原始檔REC 2 位講者 · 48:21 · MP3 192 kbps
自動偵測 en-US44.1 kHz 立體聲 · 後期混合
~90s
文稿 · 串流95% 精準度
S1

歡迎回到節目。今天我在和 Priya Anand 談她的新書,內容是關於供應鏈。

S2

謝謝你的邀請,Jordan。自從我們上次談話,這三年可真是不平靜。

S1

所以這本書一開始講的是蘇伊士運河堵塞 — 為什麼從這裡開始?

S2

因為那是非物流人士突然開始關注貨櫃的時刻。

立體聲後期混合的 95% 精準度SRT · DOCX · TXT · 節目大綱 MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

三個真實選項 · 誠實比較

Descript。Castmagic。 或是我們。

Descript 是編輯工具優先,轉錄其次。Castmagic 是節目大綱優先,文稿其次。我們專注於檔案 → 文稿 → 節目大綱的流程,不涉入你的編輯器。

Option 01

Descript

內建轉錄功能的音訊編輯器。適合用文字編輯工作流,如果你只是想要文稿可能太重了。

主要用途DAW + 文字編輯
人物分化聲學、EN-強
節目大綱Underlord AI 附加功能
匯出SRT · TXT · 專案檔
免費方案1 小時/月轉錄
成本$24/使用者/月(Creator)
Best for獨立播主,習慣通過刪除文稿中的文字來編輯,希望一個應用程式做所有事。
Option 02

Transcription.Solutions

上傳劇集原始檔。文稿、節目大綱、標籤、SRT — 四份全部一次完成。沒有編輯器,沒有綁定。

主要用途文稿 + 節目大綱
人物分化聲學 + 個別軌道上傳
節目大綱所有方案都免費
匯出SRT · VTT · DOCX · MD · JSON
免費方案30 分鐘/月,無需卡片
成本 · 每分鐘$0.03
Best for已經有編輯器(Logic、Hindenburg、Reaper)的節目,劇集混合完成後只需要乾淨的文稿 + 筆記。
Option 03

Castmagic

節目大綱即服務。拖入檔案,獲得漂亮的內容包。文稿更多是副產品。

主要用途內容重新利用
人物分化是,EN 調整
節目大綱多個範本,僅限付費
匯出SRT · TXT · 範本 MD
免費方案僅試用版
成本~$23+/月(Starter)
Best for行銷導向的節目,需要每集 12 則社群貼文、4 份電子報草稿和一個 LinkedIn 輪播。

定價截至 2026 年左右,供應商各異,會隨時改變。免費方案和附加 AI 功能會定期更新。

播客特有

播客踩到的三大陷阱。 通用轉錄工具。

上傳時告訴我們一些關於這集的事,輸出就不需要清理了。

出了什麼問題

  1. 1音樂介紹被轉錄成亂碼。識別器試圖讀取歌詞或哼聲模式,在前 30 秒插入 'la la na' 之類的廢話。
  2. 2嘉賓名字拼音錯誤。'Priya Anand' 變成 'Pria Anan' 或 'Prea Ahnand' — 每次出現都錯。
  3. 3笑聲和交叉談話被轉錄成填充詞或歸到錯誤的講者,特別是在活躍的對話中。

改成這樣

  1. 1在任務表單上���換略過音樂介紹/結尾。我們偵測非語音片段,在第一句話開始謄寫 — 時間碼偏移量自動調整。
  2. 2把嘉賓名字和品牌提及貼到自訂詞彙。我們把它當作識別器提示傳入,所以拼字在整集保持一致。
  3. 3開啟節目大綱,獲得 2-4 句摘要、3-7 個關鍵重點、行動項目和 3-8 個主題標籤用 markdown 呈現 — 直接貼到你的 CMS。

播客推薦的任務設定

上傳劇集,這些預設值就會開啟。可以在表單中按任務覆蓋。

人物分化
立體聲分割(2 位講者)
音樂偵測
略過介紹/結尾片段
填充詞
預設移除
節目大綱
摘要 + 關鍵重點 + 標籤
章節
從關鍵重點生成
匯出
SRT · DOCX · 節目大綱 MD

Accuracy · real-world numbers

錄音室麥克風劇集達 97% 精準度。 遠端嘉賓通話也能撐得住。

播客精準度主要取決於嘉賓的錄音方式,而不是主持人。錄音室主持人配合僅 Zoom 嘉賓的情況下,表現就像最差的一條腿。下方的數字來自真實客戶的劇集,不是實驗室音訊。

97%
個別軌道上傳(Riverside / SquadCast)

每位講者都在單獨的 WAV。我們獨立處理每個軌道,跳過人物分化。最乾淨的情況。

95%
立體聲後期混合,2 位講者

主持人在左,嘉賓在右,混音後。最常見的播客格式。人物分化基本上是立體聲分割的免費附送。

91%
單聲道混合,3-4 位講者

圓桌節目或小組討論混合為單聲道。相似的聲音可能每小時合併一兩次 — 2 分鐘的清理就搞定。

86%
遠端嘉賓通話 / 差的麥克風

嘉賓用 AirPods 通過旅館 wifi 通話。數字和專有名詞受損最多。自訂詞彙可以恢復大部分。

常見問題

人們最常問的 播客轉錄問題 — 8 個。

01我可以直接貼 YouTube 或 SoundCloud 連結嗎?+
可以。貼公開的 YouTube URL 或代管劇集連結(SoundCloud、Buzzsprout、Transistor、Libsyn 直接 MP3),我們在我們這邊下載音訊。私人料源的話,下載檔案並上傳。
02音樂介紹會被轉錄成 'la la la' 亂碼嗎?+
不會,如果略過音樂介紹/結尾開著(預設就是)。我們偵測非語音音訊,在第一句話開始謄寫。SRT 中的時間碼會偏移以符合,所以 YouTube 字幕仍然同步。
03節目大綱檔案明確包含什麼?+
2-4 句劇集摘要、3-7 個關鍵重點作為項目符號列表、提及的行動項目,以及 3-8 個主題標籤。用 markdown 呈現,所以你可以直接貼到 WordPress、Ghost、Substack,或你的播客代管的劇集頁面。
04你可以為 Apple Podcasts 和 Spotify 生成章節標記嗎?+
可以 — 章節從關鍵重點連同時間碼生成。匯出為單獨的 chapters.txt 或嵌入 WAV/M4A。注意 Spotify 僅在 Anchor 代管的節目上識別章節,所以 txt 檔是你的備用方案。
05我有來自 Riverside / SquadCast 的個別軌道檔案 — 我應該上傳那些嗎?+
應該上傳。依名字分開上傳各講者的 WAV 並給他們標籤。我們獨立謄寫各個軌道,然後按時間碼合併。精準度在這個設定上達到約 97% — 我們看過的最乾淨情況。
06它可以自動標記贊助方朗讀或廣告中斷嗎?+
目前不行 — 這在路線圖上。現在的話,在你的編輯中丟一個標記(短暫靜音或提示音),我們會在文稿中以時間碼出現。你也可以之後通過貼搜尋贊助品牌名稱來標記廣告段。
07劇集可以有多長?+
單個上傳最多 6 小時。大多數節目 30-90 分鐘,完成時間約 4-8 分鐘。一個 3 小時訪談劇集,預期從上傳到四份成品就緒約 12-15 分鐘。
08SRT 可以乾淨地替換 YouTube 的自動字幕嗎?+
可以。SRT 在 ~42 字符處換行,帶有適當的標點符號和選擇性的講者前綴。在 YouTube Studio → 字幕 → 新增語言 → SRT 上傳。它完全覆蓋自動生成的字幕軌道。

上傳你的劇集。獲得文稿、 大綱和 SRT。

每月免費 30 分鐘。無需卡片。包含人物標籤、節目大綱、章節和所有匯出。

免費開始