訪談轉錄 — 通過說話人標籤和時間戳轉錄訪談

訪談轉錄。不同的錄音，同樣的結果。

手機備忘錄、Zoom 通話、領夾式麥克風或手持現場錄音機 — 上傳訪談錄音，獲得帶有說話人標籤、時間戳的文本，可直接引用。

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

兩個聲音進去。兩個聲音出來，有標籤。

大多數訪談是一個設備上的兩個人 — 桌上的手機或兩人之間的錄音機。我們即使在單一單聲道中也能將訪談音頻分離為記者和受訪者，然後為每個回合添加時間戳以便引用。

現場錄音機 · WAVREC 2 位說話人 · 38:42

自動檢測 en-US48 kHz 單聲道 · 1411 kbps

~90s

轉錄 · 實時傳輸94% 準確度

能告訴我你在 18 號早上看到的情況嗎？

我大約六點到達。裝卸灣的門已經打開了，本不應該打開的。

你之前報告過門的問題 — 向誰報告的？

向設施部門的 Diane Okafor 報告，三月報告了兩次。我有郵件記錄。

現場 WAV 上 94% 準確DOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Rev 人工轉錄

真人輸入你的訪談。在困難音頻上效果最好，但需要等待且費用高。

完成時間通常 12–24 小時

清晰音頻上的準確度99%（聲稱）

說話人標籤手動，已包含

語言英文人工 · 30+ AI

成本 · 每分鐘$1.50 人工 · $0.25 AI

隱私音頻發送給承包商

Best for法庭相關或發布前的訪談，音頻質量差且需要人工審核，且你有時間等待。

Option 02

Transcription.Solutions

AI 轉錄，分離說話人，數分鐘內完成。手機備忘錄、Zoom 或現場錄音機使用同一引擎。

完成時間每小時音頻約 3 分鐘

清晰音頻上的準確度94–96%

說話人標籤自動 · 在編輯器中重命名

語言99 種，自動檢測

成本 · 每分鐘$0.03

隱私音頻 24 小時後刪除 · 無訓練

Best for每週進行多個訪談的記者、研究人員和製作人，他們需要快速、可引用的文本，無需上傳到承包商。

Option 03

Otter / Trint

AI 轉錄和研究導向的編輯器。英文強勢，限於月度計畫。

完成時間實時至約 5 分鐘

清晰音頻上的準確度約 90–93%

說話人標籤是 · 英文調優

語言Otter 僅英文 · Trint 30+

成本$17–80/用户/月（訂閱）

隱私默認存儲在帳戶中

Best for想要一個錄製的每個訪談的託管庫的團隊，且不介意每個用户的月度座位費。

定價和功能標誌截至 2026 年準確。Rev 人工服務完成時間因隊列深度和音頻長度而異。

人們對常問的 8 個問題。訪談轉錄

01我可以在發布的文章中使用這些轉錄，無需針對音頻驗證嗎？+

對於直接引用 — 不可以，始終針對音頻驗證。94% 準確度的 AI 轉錄平均仍會誤讀 17 個詞中的 1 個，引用中的錯誤詞是一個更正。轉錄用於導航和起草；音頻是事實來源。

02我的錄音機保存了帶有每位說話人一個麥克風的立體聲 WAV。我應該怎麼辦？+

直接上傳該文件 — 不要先轉換為單聲道。我們檢測這兩個聲道並將每個路由到自己的說話人分離軌道，這是我們擁有��最高精度路徑。靜音房間中預期 96%+ 的準確度。

03通過電話通話錄製的訪談怎麼樣？+

電話音頻是 8 kHz 窄帶，這會將準確度限制在即使在清晰線路上也約 88%。如果你的錄音應用分別捕獲了他們（大多數都這樣做），我們仍然使用聲道分離來分離兩方。VoIP 通話通過 WhatsApp 或 Signal 的聲音比 PSTN 要好一點。

04我可以在共享轉錄之前編輯保密部分嗎？+

是的。在編輯器中，選擇時間戳範圍並將其標記為 `[REDACTED]`。導出用編輯標記替換文本，但保留時間戳，以便文件仍然跟蹤音頻。

05你會在我的訪談錄音上訓練模型嗎？+

不會。源音頻在完成後 24 小時內從我們的基礎設施中刪除，我們不在任何計畫下使用客户錄音進行模型訓練。轉錄文本保留在你的帳戶中，直到你刪除它。

06三四個人參加小組訪談 — 說話人分離還能工作嗎？+

最多約 6 個不同的聲音，是的，但每增加一個人，說話人分配的準確度都會下降，當兩位說話人聲音相��時會變得更差。計畫在轉錄完成後進行 2–3 分鐘的說話人芯片重命名。

07你可以用英語以外的語言轉錄訪談嗎？+

99 種語言，自動檢測。代碼轉換（英文受訪者中途切換到西班牙文）在 12 個語言對中處理。準確度因語言而異 — 歐洲語言與英文相匹配；低資源非洲和中亞語言準確度低 5–10 分。

08我在 Zoom 通話上錄製 — 我應該改用你的 Zoom 頁面嗎？+

相同的引擎，相同的結果。Zoom 頁面涵蓋了雲錄製細節（每個參與者的音頻、撥入降級）。如果你通過 Zoom 進行一對一訪談，任一路徑都可行 — 在這裡上傳 MP4，說話人標籤的結果是相同的。

訪談轉錄。不同的錄音，同樣的結果。

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

兩個聲音進去。兩個聲音出來，有標籤。

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Rev 人工轉錄。Otter 或 Trint。或是我們。

Rev 人工轉錄

Transcription.Solutions

Otter / Trint

會害人的三件事。通用轉錄工具

出錯的地方

在這裡翻轉什麼

推薦的訪談工作設置

優質無線電視麥克風 96%。在咖啡館錄音仍可讀。

人們對常問的 8 個問題。訪談轉錄

上傳你的訪談錄音。看看會得到什麼。

訪談轉錄。不同的錄音，同樣的結果。

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

兩個聲音進去。 兩個聲音出來，有標籤。

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Rev 人工轉錄。Otter 或 Trint。 或是我們。

Rev 人工轉錄

Transcription.Solutions

Otter / Trint

會害人的三件事。 通用轉錄工具

出錯的地方

在這裡翻轉什麼

推薦的訪談工作設置

優質無線電視麥克風 96%。 在咖啡館錄音仍可讀。

人們對常問的 8 個問題。 訪談轉錄

上傳你的訪談錄音。 看看會得到什麼。

兩個聲音進去。兩個聲音出來，有標籤。

Rev 人工轉錄。Otter 或 Trint。或是我們。

會害人的三件事。通用轉錄工具

優質無線電視麥克風 96%。在咖啡館錄音仍可讀。

人們對常問的 8 個問題。訪談轉錄

上傳你的訪談錄音。看看會得到什麼。