Phiên dịch phỏng vấn — phiên dịch phỏng vấn có nhãn người nói và dấu thời gian

Phiên dịch phỏng vấn.Cách ghi âm khác nhau, kết quả như nhau.

Ghi âm điện thoại, cuộc gọi Zoom, bộ dây đeo cổ, hoặc bộ ghi hướng — thả bản ghi phỏng vấn và nhận văn bản có nhãn người nói, có dấu thời gian để bạn có thể trích dẫn.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Hai giọng nói vào. Hai giọng nói ra, có nhãn.

Hầu hết các phỏng vấn là hai người trên một thiết bị — một điện thoại trên bàn, một bộ ghi giữa bạn. Chúng tôi tách âm thanh phỏng vấn thành phóng viên và nguồn ngay cả từ một kênh mono, sau đó dấu thời gian mỗi lượt nói để trích dẫn.

Bộ ghi hướng · WAVREC 2 người nói · 38:42

tự động phát hiện en-US48 kHz mono · 1411 kbps

~90s

Bản phiên dịch · phát trực tuyếnđộ chính xác 94%

Bạn có thể kể cho tôi những gì bạn thấy vào sáng ngày mười tám không?

Tôi đến khoảng sáu giờ. Cửa bãi chứa hàng đã mở, điều mà nó không nên như vậy.

Và bạn đã báo cáo vấn đề cửa trước — cho ai?

Cho Diane Okafor trong cơ sở vật chất, hai lần vào tháng Ba. Tôi có các email.

độ chính xác 94% trên WAV hướngDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev người phiên dịch. Otter hoặc Trint. Hoặc chúng tôi.

Rev gửi âm thanh của bạn cho những người phiên dịch — chậm và đắt nhưng độ trung thực cao trên âm thanh khó khăn. Otter và Trint là AI-first giống như chúng tôi, được tinh chỉnh cho phóng viên và nhà nghiên cứu. Đây là nơi mỗi cái phù hợp.

Option 01

Phiên dịch tiếng người Rev

Những người thật nhập phỏng vấn của bạn. Tốt nhất trên âm thanh đối nghịch, nhưng bạn chờ và bạn trả.

Thời gian hoàn thành12–24 giờ điển hình

Độ chính xác trên âm thanh sạch99% (tuyên bố)

Nhãn người nóiThủ công, bao gồm

Ngôn ngữEN người · 30+ AI

Chi phí · mỗi phút$1.50 người · $0.25 AI

Bảo mậtÂm thanh gửi cho nhà thầu

Best forCác phỏng vấn liên quan tới tòa án hoặc xuất bản trên âm thanh tồi tại nơi bạn cần tai của người và có một ngày để chờ.

Option 02

Transcription.Solutions

Bản phiên dịch AI, tách người nói, sẵn sàng trong vài phút. Cùng một công cụ cho ghi âm thoại, Zoom, hoặc bộ ghi hướng.

Thời gian hoàn thành~3 phút mỗi giờ âm thanh

Độ chính xác trên âm thanh sạch94–96%

Nhãn người nóiTự động · đổi tên trong trình biên tập

Ngôn ngữ99, tự động phát hiện

Chi phí · mỗi phút$0.03

Bảo mậtÂm thanh xóa trong 24h · không đào tạo

Best forPhóng viên, nhà nghiên cứu, và nhà sản xuất thực hiện nhiều phỏng vấn mỗi tuần những người cần văn bản trích dẫn nhanh mà không tải lên nhà thầu.

Option 03

Otter / Trint

Phiên dịch AI với trình biên tập hướng tới nghiên cứu. Tiếng Anh-mạnh, khóa vào kế hoạch hàng tháng.

Thời gian hoàn thànhThời gian thực đến ~5 phút

Độ chính xác trên âm thanh sạch~90–93%

Nhãn người nóiCó · tinh chỉnh EN

Ngôn ngữOtter EN-chỉ · Trint 30+

Chi phí$17–80/người/tháng (đăng ký)

Bảo mậtLưu trữ trong tài khoản theo mặc định

Best forCác đội muốn một thư viện được lưu trữ của mọi phỏng vấn từng được ghi âm và không phiền một khoản phí ghế hàng tháng cho mỗi người dùng.

Giá cả và cờ tính năng chính xác từ năm 2026. Thời gian hoàn thành Rev tiếp nhân khác nhau theo độ sâu hàng đợi và độ dài âm thanh.

96% trên một lav tốt. Vẫn có thể đọc được trên ghi âm quán cà phê.

Độ chính xác phỏng vấn bị giới hạn bởi những gì microphone thực sự đã nghe được. Microphone riêng biệt gần trên mỗi người nói là trần nhà; một điện thoại ngồi trên một bàn ồn ào là sàn nhà. Các số dưới đây đến từ các tệp phỏng vấn sản xuất, không phải điểm chuẩn tổng hợp.

8 điều mọi người hỏi về phiên dịch phỏng vấn.

01Tôi có thể sử dụng các bản phiên dịch này trong một bài báo đã xuất bản mà không xác minh so với âm thanh không?+

Đối với trích dẫn trực tiếp — không, luôn xác minh so với âm thanh. Các bản phiên dịch AI ở độ chính xác 94% vẫn đọc sai một từ trong 17 trung bình, và từ sai trong trích dẫn là một sửa chữa. Bản phiên dịch dành cho điều hướng và dàn thảo; âm thanh là nguồn sự thật.

02Bộ ghi của tôi đã lưu một WAV stereo với một microphone cho mỗi người nói. Tôi phải làm gì?+

Tải tệp đó trực tiếp — không chuyển đổi sang mono trước tiên. Chúng tôi phát hiện hai kênh và định tuyến từng kênh vào bài hát phân biệt riêng của nó, đây là đường dẫn độ chính xác cao nhất mà chúng tôi có. Mong đợi 96%+ trên một phòng yên tĩnh.

03Còn những phỏng vấn được ghi âm qua cuộc gọi điện thoại thì sao?+

Âm thanh điện thoại là 8 kHz dải hẹp, điều này làm giới hạn độ chính xác khoảng 88% ngay cả trên một dòng sạch. Chúng tôi vẫn tách hai bên sử dụng tách kênh nếu ứng dụng ghi âm của bạn nắm bắt chúng riêng biệt (hầu hết làm). Cuộc gọi VoIP qua WhatsApp hoặc Signal nghe tốt hơn một chút so với PSTN.

04Tôi có thể xóa các phần ngoài hồ sơ trước khi chia sẻ bản phiên dịch không?+

Vâng. Trong trình biên tập, chọn phạm vi dấu thời gian và đánh dấu nó `[REDACTED]`. Xuất khẩu thay thế văn bản bằng một dấu hiệu đỏ nhưng giữ dấu thời gian để tài liệu vẫn theo dõi âm thanh.

05Bạn có đào tạo mô hình trên các bản ghi phỏng vấn của tôi không?+

Không. Âm thanh nguồn được xóa khỏi cơ sở hạ tầng của chúng tôi trong vòng 24 giờ kể từ khi hoàn thành, và chúng tôi không sử dụng bản ghi khách hàng để đào tạo mô hình theo bất kỳ kế hoạch nào. Văn bản bản phiên dịch vẫn ở trong tài khoản của bạn cho đến khi bạn xóa nó.

06Ba hoặc bốn người trên một phỏng vấn bảng điều khiển — phân biệt vẫn hoạt động?+

Lên tới khoảng sáu giọng nói riêng biệt, vâng, nhưng độ chính xác trên gán người nói giảm với mỗi người được thêm và trở nên tồi tệ hơn khi hai người nói nghe tương tự. Lên kế hoạch một lần đổi tên 2–3 phút trên các chip người nói sau khi bản phiên dịch đáp xuống.

07Bạn có thể phiên dịch các phỏng vấn bằng các ngôn ngữ khác ngoài tiếng Anh không?+

99 ngôn ngữ, tự động phát hiện. Chuyển mã (nguồn tiếng Anh trượt vào tiếng Tây Ban Nha giữa câu) được xử lý trong 12 cặp ngôn ngữ. Độ chính xác thay đổi theo ngôn ngữ — các ngôn ngữ Châu Âu kết hợp tiếng Anh; các ngôn ngữ Phi châu và Châu Á Trung Á có ít tài nguyên chạy 5–10 điểm thấp hơn.

08Tôi ghi âm trên cuộc gọi Zoom — tôi có nên sử dụng trang Zoom của bạn thay thế không?+

Cùng một công cụ, kết quả tương tự. Trang Zoom bao gồm các chi tiết ghi âm đám mây (âm thanh đặc biệt-tham gia, suy giảm quay số. Nếu bạn đang tiến hành một phỏng vấn tại một thời điểm qua Zoom, tuyến đường nào cũng hoạt động — thả MP4 ở đây và các nhãn người nói xuất ra giống nhau.