Phiên dịch phỏng vấn.Cách ghi âm khác nhau, kết quả như nhau.

Ghi âm điện thoại, cuộc gọi Zoom, bộ dây đeo cổ, hoặc bộ ghi hướng — thả bản ghi phỏng vấn và nhận văn bản có nhãn người nói, có dấu thời gian để bạn có thể trích dẫn.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Xem những gì xuất ra

Hai giọng nói vào. Hai giọng nói ra, có nhãn.

Hầu hết các phỏng vấn là hai người trên một thiết bị — một điện thoại trên bàn, một bộ ghi giữa bạn. Chúng tôi tách âm thanh phỏng vấn thành phóng viên và nguồn ngay cả từ một kênh mono, sau đó dấu thời gian mỗi lượt nói để trích dẫn.

Bộ ghi hướng · WAVREC 2 người nói · 38:42
tự động phát hiện en-US48 kHz mono · 1411 kbps
~90s
Bản phiên dịch · phát trực tuyếnđộ chính xác 94%
S1

Bạn có thể kể cho tôi những gì bạn thấy vào sáng ngày mười tám không?

S2

Tôi đến khoảng sáu giờ. Cửa bãi chứa hàng đã mở, điều mà nó không nên như vậy.

S1

Và bạn đã báo cáo vấn đề cửa trước — cho ai?

S2

Cho Diane Okafor trong cơ sở vật chất, hai lần vào tháng Ba. Tôi có các email.

độ chính xác 94% trên WAV hướngDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Ba tùy chọn thực tế · so sánh trung thực

Rev người phiên dịch. Otter hoặc Trint. Hoặc chúng tôi.

Rev gửi âm thanh của bạn cho những người phiên dịch — chậm và đắt nhưng độ trung thực cao trên âm thanh khó khăn. Otter và Trint là AI-first giống như chúng tôi, được tinh chỉnh cho phóng viên và nhà nghiên cứu. Đây là nơi mỗi cái phù hợp.

Option 01

Phiên dịch tiếng người Rev

Những người thật nhập phỏng vấn của bạn. Tốt nhất trên âm thanh đối nghịch, nhưng bạn chờ và bạn trả.

Thời gian hoàn thành12–24 giờ điển hình
Độ chính xác trên âm thanh sạch99% (tuyên bố)
Nhãn người nóiThủ công, bao gồm
Ngôn ngữEN người · 30+ AI
Chi phí · mỗi phút$1.50 người · $0.25 AI
Bảo mậtÂm thanh gửi cho nhà thầu
Best forCác phỏng vấn liên quan tới tòa án hoặc xuất bản trên âm thanh tồi tại nơi bạn cần tai của người và có một ngày để chờ.
Option 02

Transcription.Solutions

Bản phiên dịch AI, tách người nói, sẵn sàng trong vài phút. Cùng một công cụ cho ghi âm thoại, Zoom, hoặc bộ ghi hướng.

Thời gian hoàn thành~3 phút mỗi giờ âm thanh
Độ chính xác trên âm thanh sạch94–96%
Nhãn người nóiTự động · đổi tên trong trình biên tập
Ngôn ngữ99, tự động phát hiện
Chi phí · mỗi phút$0.03
Bảo mậtÂm thanh xóa trong 24h · không đào tạo
Best forPhóng viên, nhà nghiên cứu, và nhà sản xuất thực hiện nhiều phỏng vấn mỗi tuần những người cần văn bản trích dẫn nhanh mà không tải lên nhà thầu.
Option 03

Otter / Trint

Phiên dịch AI với trình biên tập hướng tới nghiên cứu. Tiếng Anh-mạnh, khóa vào kế hoạch hàng tháng.

Thời gian hoàn thànhThời gian thực đến ~5 phút
Độ chính xác trên âm thanh sạch~90–93%
Nhãn người nóiCó · tinh chỉnh EN
Ngôn ngữOtter EN-chỉ · Trint 30+
Chi phí$17–80/người/tháng (đăng ký)
Bảo mậtLưu trữ trong tài khoản theo mặc định
Best forCác đội muốn một thư viện được lưu trữ của mọi phỏng vấn từng được ghi âm và không phiền một khoản phí ghế hàng tháng cho mỗi người dùng.

Giá cả và cờ tính năng chính xác từ năm 2026. Thời gian hoàn thành Rev tiếp nhân khác nhau theo độ sâu hàng đợi và độ dài âm thanh.

Cụ thể cho phỏng vấn

Ba điều cắn mọi người trên các công cụ phiên dịch chung chung.

Âm thanh phỏng vấn hiếm khi sạch. Lật những cài đặt này và bản phiên dịch giữ vững khi trích dẫn.

Có gì sai lầm

  1. 1Nói xen kẽ trên một kênh duy nhất. Khi nguồn của bạn trở nên nhấn mạnh và nói qua câu hỏi của bạn, phân biệt chung chung gộp cả hai vào một khối người nói.
  2. 2Tên và địa điểm nguồn (Okafor, Tigray, Maranello) trả lại ngữ âm. Vô dụng để kiểm tra sự kiện so với bản phiên dịch.
  3. 3Những khoảnh khắc ngoài hồ sơ kết thúc trong cùng một bản phiên dịch như vật liệu có thể trích dẫn — không có cách để đánh dấu một vùng là đã xóa.

Để lật ở đây

  1. 1Nếu bộ ghi hướng của bạn viết một WAV hai kênh (một microphone cho mỗi bài hát), tải tệp đó trực tiếp. Chúng tôi phát hiện mỗi kênh và bỏ qua phân biệt hoàn toàn.
  2. 2Dán các ghi chú chuẩn bị của bạn — tên nguồn, tổ chức, tên địa điểm — vào Từ vựng tùy chỉnh trên biểu mẫu công việc. Máy nhận dạng coi chúng là danh từm riêng đã biết.
  3. 3Sau khi bản phiên dịch hạ cánh, đánh dấu một vùng là ngoài hồ sơ trong trình biên tập. Nó xuất khẩu dưới dạng `[REDACTED 14:22–15:08]` trong DOCX và TXT, với âm thanh nguồn xóa trong 24 giờ bất kể.

Cài đặt công việc được khuyên cho phỏng vấn

Thả một tệp phỏng vấn và những cái này lật bật theo mặc định. Ghi đè cho mỗi công việc từ biểu mẫu.

Phân biệt người nói
Mỗi kênh nếu stereo · âm thanh khác
Mô hình người nói
Phỏng vấn · 2–4 người nói
Ngôn ngữ
Tự động phát hiện · code-switch bật
Từ chuyên kỹ thuật
Giữ lại (chế độ từng chữ)
Tóm tắt
Trích dẫn chính + chỉ mục chủ đề
Xuất khẩu
DOCX có dấu thời gian · TXT thuần túy · JSON

Accuracy · real-world numbers

96% trên một lav tốt. Vẫn có thể đọc được trên ghi âm quán cà phê.

Độ chính xác phỏng vấn bị giới hạn bởi những gì microphone thực sự đã nghe được. Microphone riêng biệt gần trên mỗi người nói là trần nhà; một điện thoại ngồi trên một bàn ồn ào là sàn nhà. Các số dưới đây đến từ các tệp phỏng vấn sản xuất, không phải điểm chuẩn tổng hợp.

96%
Microphone lavalier kép · yên tĩnh như studio

Một microphone cho mỗi người nói, các kênh riêng biệt (Zoom H5/H6, Tascam DR-40). Phân biệt người nói là không đáng kể — lỗi chỉ là văn bản.

94%
Bộ ghi cầm tay trên bàn

Một micrô conductor giữa hai người nói, phòng yên tĩnh. Phân biệt âm thanh tách giọng nói một cách đáng tin cậy dưới 4 feet.

90%
Ghi âm thoại điện thoại · gần

Ghi âm thoại iPhone hoặc Pixel trên bàn. Tên và số thỉnh thoảng bị bỏ lỡ; nhịp độ tốt để trích dẫn.

84%
Ghi âm hướng · quán cà phê hoặc đường phố

Máy pha cà phê espresso, giao thông, giọng nói thứ ba gần đó. Trường hợp xấu nhất trong dữ liệu của chúng tôi — có thể sử dụng được để điều hướng, xác minh trích dẫn so với âm thanh.

Những câu hỏi chung

8 điều mọi người hỏi về phiên dịch phỏng vấn.

01Tôi có thể sử dụng các bản phiên dịch này trong một bài báo đã xuất bản mà không xác minh so với âm thanh không?+
Đối với trích dẫn trực tiếp — không, luôn xác minh so với âm thanh. Các bản phiên dịch AI ở độ chính xác 94% vẫn đọc sai một từ trong 17 trung bình, và từ sai trong trích dẫn là một sửa chữa. Bản phiên dịch dành cho điều hướng và dàn thảo; âm thanh là nguồn sự thật.
02Bộ ghi của tôi đã lưu một WAV stereo với một microphone cho mỗi người nói. Tôi phải làm gì?+
Tải tệp đó trực tiếp — không chuyển đổi sang mono trước tiên. Chúng tôi phát hiện hai kênh và định tuyến từng kênh vào bài hát phân biệt riêng của nó, đây là đường dẫn độ chính xác cao nhất mà chúng tôi có. Mong đợi 96%+ trên một phòng yên tĩnh.
03Còn những phỏng vấn được ghi âm qua cuộc gọi điện thoại thì sao?+
Âm thanh điện thoại là 8 kHz dải hẹp, điều này làm giới hạn độ chính xác khoảng 88% ngay cả trên một dòng sạch. Chúng tôi vẫn tách hai bên sử dụng tách kênh nếu ứng dụng ghi âm của bạn nắm bắt chúng riêng biệt (hầu hết làm). Cuộc gọi VoIP qua WhatsApp hoặc Signal nghe tốt hơn một chút so với PSTN.
04Tôi có thể xóa các phần ngoài hồ sơ trước khi chia sẻ bản phiên dịch không?+
Vâng. Trong trình biên tập, chọn phạm vi dấu thời gian và đánh dấu nó `[REDACTED]`. Xuất khẩu thay thế văn bản bằng một dấu hiệu đỏ nhưng giữ dấu thời gian để tài liệu vẫn theo dõi âm thanh.
05Bạn có đào tạo mô hình trên các bản ghi phỏng vấn của tôi không?+
Không. Âm thanh nguồn được xóa khỏi cơ sở hạ tầng của chúng tôi trong vòng 24 giờ kể từ khi hoàn thành, và chúng tôi không sử dụng bản ghi khách hàng để đào tạo mô hình theo bất kỳ kế hoạch nào. Văn bản bản phiên dịch vẫn ở trong tài khoản của bạn cho đến khi bạn xóa nó.
06Ba hoặc bốn người trên một phỏng vấn bảng điều khiển — phân biệt vẫn hoạt động?+
Lên tới khoảng sáu giọng nói riêng biệt, vâng, nhưng độ chính xác trên gán người nói giảm với mỗi người được thêm và trở nên tồi tệ hơn khi hai người nói nghe tương tự. Lên kế hoạch một lần đổi tên 2–3 phút trên các chip người nói sau khi bản phiên dịch đáp xuống.
07Bạn có thể phiên dịch các phỏng vấn bằng các ngôn ngữ khác ngoài tiếng Anh không?+
99 ngôn ngữ, tự động phát hiện. Chuyển mã (nguồn tiếng Anh trượt vào tiếng Tây Ban Nha giữa câu) được xử lý trong 12 cặp ngôn ngữ. Độ chính xác thay đổi theo ngôn ngữ — các ngôn ngữ Châu Âu kết hợp tiếng Anh; các ngôn ngữ Phi châu và Châu Á Trung Á có ít tài nguyên chạy 5–10 điểm thấp hơn.
08Tôi ghi âm trên cuộc gọi Zoom — tôi có nên sử dụng trang Zoom của bạn thay thế không?+
Cùng một công cụ, kết quả tương tự. Trang Zoom bao gồm các chi tiết ghi âm đám mây (âm thanh đặc biệt-tham gia, suy giảm quay số. Nếu bạn đang tiến hành một phỏng vấn tại một thời điểm qua Zoom, tuyến đường nào cũng hoạt động — thả MP4 ở đây và các nhãn người nói xuất ra giống nhau.

Thả bản ghi phỏng vấn của bạn. Xem những gì xuất ra.

30 phút miễn phí mỗi tháng. Không cần thẻ. Nhãn người nói, 99 ngôn ngữ, tất cả xuất khẩu bao gồm.

Bắt đầu miễn phí