Rev 人工轉錄
真人輸入你的訪談。在困難音頻上效果最好,但需要等待且費用高。
手機備忘錄、Zoom 通話、領夾式麥克風或手持現場錄音機 — 上傳訪談錄音,獲得帶有說話人標籤、時間戳的文本,可直接引用。
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ 看看會得到什麼
大多數訪談是一個設備上的兩個人 — 桌上的手機或兩人之間的錄音機。我們即使在單一單聲道中也能將訪談音頻分離為記者和受訪者,然後為每個回合添加時間戳以便引用。
能告訴我你在 18 號早上看到的情況嗎?
我大約六點到達。裝卸灣的門已經打開了,本不應該打開的。
你之前報告過門的問題 — 向誰報告的?
向設施部門的 Diane Okafor 報告,三月報告了兩次。我有郵件記錄。
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
三個真實選項 · 誠實比較
Rev 將你的音頻發送給人工轉錄員 — 速度慢且費用高,但在困難音頻上保真度高。Otter 和 Trint 如我們一樣是 AI 優先的,針對記者和研究人員調整。以下是各自適用的場景。
真人輸入你的訪談。在困難音頻上效果最好,但需要等待且費用高。
AI 轉錄,分離說話人,數分鐘內完成。手機備忘錄、Zoom 或現場錄音機使用同一引擎。
AI 轉錄和研究導向的編輯器。英文強勢,限於月度計畫。
定價和功能標誌截至 2026 年準確。Rev 人工服務完成時間因隊列深度和音頻長度而異。
特定於訪談
訪談音頻很少是乾淨的。翻轉這些設置,轉錄在引用時會經得起考驗。
上傳訪談文件後,這些默認開啟。每個工作表單可覆蓋。
Accuracy · real-world numbers
訪談準確度受限於麥克風實際聽到的內容。每位說話人的近麥克風立體聲是上限;放在吵雜桌子上的手機是下限。下面的數字來自實際訪談文件,不是合成基準測試。
每位說話人一個麥克風,分開的聲道(Zoom H5/H6、Tascam DR-40)。說話人分離是微不足道的 — 錯誤僅在文本層面。
兩位說話人之間的單個電容麥克風,安靜的房間。聲學說話人分離在 4 英尺以內可靠地分離聲音。
iPhone 或 Pixel 語音備忘錄放在桌上。名稱和數字偶爾會漏掉;節奏對引用來說是可以的。
濃縮咖啡機、交通、附近第三方聲音。我們數據中最差的情況 — 可用於導航,針對音頻驗證引用。
常見問題