Phiên bản ghi âm dành cho nhà nghiên cứu học thuật.Tuân thủ IRB, sẵn sàng CAQDAS, 100+ ngôn ngữ.

Tải lên phỏng vấn nghiên cứu hoặc ghi âm nhóm tập trung. Nhận văn bản có nhãn người nói, gắn thời gian sẵn sàng cho NVivo, Atlas.ti hoặc MaxQDA — với âm thanh được xóa trong 24 giờ.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Xem kết quả

Bản ghi thực địa vào. Phiên bản ghi âm sẵn sàng mã hóa ra.

Chúng tôi đánh dấu mỗi lượt người tham gia bằng dấu thời gian ở đầu, giữ lại các từ lấp đầy nếu bạn yêu cầu trích dẫn chính xác, và xuất DOCX với các kiểu người nói mà công cụ CAQDAS của bạn đã nhận ra.

Phỏng vấn bán cấu trúc · .wavREC 2 người nói · 1:08:24
tự động phát hiện en-GB44.1 kHz mono · micro lavalier
~90s
Phiên bản ghi âm · phát trực tuyếnĐộ chính xác 94% · chế độ trích dẫn chính xác
S1

Bạn có thể hướng dẫn tôi lần đầu tiên bạn nhận thấy sự thay đổi trong khu phố không?

S2

Ừm, có lẽ là vào 2019 — tiệm bánh ở góc phố đóng cửa, và, vâng, đó là lúc nó ấn tượng với tôi.

S1

Và cảm xúc của bạn như thế nào khi nhìn thấy điều đó xảy ra trong những tháng đó?

S2

Thành thật mà nói? Giống như nơi tôi biết được ba mươi năm đang biến mất, từng mảnh một.

94% trên phỏng vấn lavalierDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Ba lựa chọn thực tế · so sánh trung thực

Rev con người. NVivo Transcription. Hoặc chúng tôi.

Dịch vụ con người của Rev là lựa chọn mặc định trong lịch sử cho các trích dẫn cấp luận văn. NVivo đóng gói phiên bản ghi âm AI bên trong công cụ CAQDAS. Chúng tôi ở giữa — nhanh hơn Rev, chính xác hơn và thân thiện với IRB hơn tính năng tích hợp sẵn của NVivo.

Option 01

Rev (phiên bản ghi âm con người)

Con người gõ nó. Chậm, đắt tiền, nhưng tiêu chuẩn vàng cho trích dẫn chính xác có thể xuất bản.

Thời gian quay12–24 giờ (điển hình)
Chi phí · mỗi phút$1.50 con người / $0.25 AI
Nhãn người nóiCó, được đặt thủ công
Giữ lại âm thanhStored on Rev servers
Ngôn ngữEN con người · ~30 AI
Xuất CAQDASDOCX, TXT (thủ công)
Best forCác phỏng vấn có rủi ro cao dành cho trích dẫn trực tiếp trong một bài báo xuất bản, nơi ngân sách không phải là hạn chế.
Option 02

Transcription.Solutions

Phiên bản ghi âm AI trong vài phút, âm thanh được xóa trong 24 giờ, DOCX được tạo kiểu cho nhập khẩu NVivo và Atlas.ti.

Thời gian quay~5 phút cho tệp 60 phút
Chi phí · mỗi phút$0.03
Nhãn người nóiDiarized, đổi tên trong ứng dụng
Giữ lại âm thanhXóa trong 24 giờ
Ngôn ngữ100+, tự động phát hiện
Xuất CAQDASDOCX heading styles + TXT
Best forNhà nghiên cứu chạy 20+ phỏng vấn cần phiên bản ghi âm lần đầu nhanh, sau đó sửa lại 5% trích dẫn dành cho xuất bản.
Option 03

NVivo Transcription / Otter

Phiên bản ghi âm AI được đóng gói bên trong công cụ CAQDAS hoặc trình ghi chú của bạn. Tiện lợi, theo hướng EN, ít kiểm soát hơn.

Thời gian quaySo sánh được (AI)
Chi phíGói tín dụng · ~$0.30/phút
Nhãn người nóiAcoustic, EN-tuned
Giữ lại âm thanhĐược liên kết với đăng ký
Ngôn ngữĐộ chính xác non-EN giảm
Xuất CAQDASNative to NVivo only
Best forSinh viên tiến sĩ độc lập làm việc hoàn toàn bằng tiếng Anh bên trong một hệ sinh thái CAQDAS muốn một hóa đơn duy nhất.

Giá cả và cờ tính năng chính xác từ 2026. Tỷ lệ AI/con người của Rev và giá tín dụng NVivo Transcription khác nhau theo khu vực và cấp phép học thuật.

Cụ thể để nghiên cứu định tính

Ba điều cắn nhà nghiên cứu trên các công cụ phiên bản ghi âm chung.

Lật cài đặt bên phải trước khi bạn tải lên và phiên bản ghi âm sẽ nhập trực tiếp vào dự án CAQDAS của bạn.

Điều gì sai lầm

  1. 1Từ lấp đầy bị xóa âm thầm. AI chung loại bỏ "um", "like", khởi đầu sai — tốt cho ghi chú cuộc họp, chết người cho phân tích hội thoại hoặc công việc diễn ngôn.
  2. 2Thuật ngữ miền (khung lý thuyết, tên thuốc, tên địa điểm, thuật ngữ quan hệ) được phiên bản ghi âm theo âm thanh. Mã hóa sau đó cần một lần chuyển tìm và thay thế.
  3. 3Âm thanh nằm trên máy chủ của nhà cung cấp vô thời hạn. Hầu hết các kế hoạch quản lý dữ liệu IRB yêu cầu xóa hoặc giữ lại được kiểm soát — các nhà cung cấp hiếm khi ghi lại điều này rõ ràng.

Cái gì để lật ở đây

  1. 1Chuyển sang Chế độ trích dẫn chính xác trên biểu mẫu công việc. Chúng tôi giữ lại các từ lấp đầy, khởi đầu sai, lặp lại và bộ đánh dấu cười — chế độ sạch là tùy chọn, không phải mặc định cho nhà nghiên cứu.
  2. 2Dán các điều khoản codebook và danh từ riêng vào Tùy chỉnh từ vựng. Chúng tôi chuyển nó dưới dạng gợi ý nhận dạng, không phải thay thế cứng, vì vậy ngữ cảnh vẫn thắng.
  3. 3Âm thanh được xóa trong 24 giờ hoàn thành công việc. Phiên bản ghi âm ở lại tài khoản của bạn. Chúng tôi có thể cấp xác nhận xóa cho tệp IRB của bạn khi được yêu cầu.

Cài đặt công việc được đề xuất cho phỏng vấn nghiên cứu

Tải lên bản ghi thực địa và những cái này bật theo mặc định. Ghi đè mỗi công việc từ biểu mẫu.

Chế độ
Trích dẫn chính xác (fillers + false starts bật)
Mô hình người nói
Phỏng vấn · 2–8 người nói
Ngôn ngữ
Auto-detect · accent-tolerant
Dấu thời gian
Mỗi lượt người nói
Giữ lại âm thanh
Xóa trong 24 giờ
Xuất
DOCX (CAQDAS styles) · TXT · SRT

Accuracy · real-world numbers

94% trên phỏng vấn lavalier sạch. Trung thực về những gì làm hỏng công việc thực địa.

Âm thanh thực địa là trường hợp khó trong phiên bản ghi âm — phòng mở, tiếng Anh có giọng ngoại lai, lời nói chồng lấn trong nhóm tập trung. Phỏng vấn nhị phân với micro lavalier chạm đến giới hạn; bản ghi âm thực địa xung quanh và nhóm tập trung lớn suy giảm nhanh nhất. Các con số dưới đây đến từ tải lên nhà nghiên cứu thực tế, không phải điểm chuẩn tổng hợp.

95%
1-on-1, lavalier hoặc USB mic

Phòng yên tĩnh, người nói L2 hoặc bản địa duy nhất, máy ghi âm trên bàn. Trường hợp tốt nhất cho phỏng vấn bán cấu trúc — hầu hết các nghiên cứu nhị phân nằm ở đây.

91%
Máy ghi âm cầm tay, 2–3 người nói

Zoom H4n hoặc máy ghi âm điện thoại ở giữa bàn. Các ghế người nói được xác định theo hướng. Kế hoạch một lần đổi tên 5 phút.

85%
Phỏng vấn thực địa, tiếng ồn xung quanh

Quán cà phê, chợ, phỏng vấn đi bộ. Tiếng chuyện thầm thì nền và giao thông ảnh hưởng đến các phản hồi ngắn; các lượt chính vẫn có thể mã hóa được.

80%
Nhóm tập trung, 5–8 người tham gia

Lời nói chồng lấn và micro dùng chung. Diarization sẽ hợp nhất một số giọng nói yên tĩnh hơn — dự định phân biệt rõ ràng vào thời gian mã hóa.

Câu hỏi phổ biến

8 điều nhà nghiên cứu hỏi về phiên bản ghi âm học thuật.

01Điều này có chấp nhận được theo kế hoạch quản lý dữ liệu IRB điển hình không?+
Hầu hết các kế hoạch chúng tôi đã thấy phê duyệt chúng tôi khi họ đọc hai sự thật: âm thanh được xóa trong 24 giờ hoàn thành công việc, và phiên bản ghi âm chỉ ở lại tài khoản của nhà nghiên cứu. Chúng tôi không phải là IRB chính nó — hội đồng của bạn đưa ra cuộc gọi cuối cùng — nhưng chúng tôi sẽ cấp một mô tả xử lý bằng văn bản cho giao thức của bạn khi được yêu cầu.
02Bạn có giữ âm thanh phỏng vấn của tôi không?+
Không. Tệp âm thanh được xóa trong 24 giờ hoàn thành công việc. Chỉ phiên bản ghi âm ở lại tài khoản của bạn, và bạn có thể xóa nó bất kỳ lúc nào. Chúng tôi không sử dụng âm thanh nghiên cứu để huấn luyện các mô hình.
03Bạn có thể làm trích dẫn chính xác — với fillers, khởi đầu sai và chồng lấn — để phân tích hội thoại không?+
Vâng. Bật chế độ Trích dẫn chính xác trên biểu mẫu công việc và chúng tôi giữ "um", "uh", lặp lại, khởi đầu sai và bộ đánh dấu cười. Chồng lấn được đánh dấu bằng ký hiệu dấu ngoặc ở ranh giới lượt. Chúng tôi không tự động làm ký hiệu Jefferson — đó vẫn là một lần vượt qua con người.
04DOCX sẽ nhập sạch vào NVivo, Atlas.ti hoặc MaxQDA không?+
Vâng. DOCX của chúng tôi sử dụng các kiểu tiêu đề và người nói mà mỗi công cụ mong đợi để mã hóa tự động theo người nói. Trong NVivo, hãy sử dụng Tệp → Nhập → Phiên bản ghi âm. Trong Atlas.ti và MaxQDA, cấu trúc người nói đoạn văn được bảo tồn vì vậy mã hóa tự động theo người nói hoạt động ngay từ đầu.
05Nó xử lý tiếng Anh có giọng ngoại lai hoặc các phỏng vấn đa ngôn ngữ như thế nào?+
Chúng tôi hỗ trợ 100+ ngôn ngữ với tự động phát hiện, bao gồm chuyển mã trong một bản ghi duy nhất. Các giọng ngoại lai L2 nặng đạt ~85–90% trên âm thanh sạch. Đối với các ngôn ngữ thiểu số có dữ liệu huấn luyện thưa thớt (ví dụ: một số ngôn ngữ Phi châu và bản địa), độ chính xác thấp hơn và chúng tôi nói vậy trên bộ chọn ngôn ngữ.
06Nhóm tập trung với 6–8 người — diarization có thực sự hoạt động không?+
Một phần. Diarization âm thanh đáng tin cậy tách các giọng nói khác biệt 4–5 trên micro dùng chung. Ngoài ra, mong đợi mô hình hợp nhất hai người tham gia yên tĩnh nhất. Sửa chữa là một lần đổi tên trong trình chỉnh sửa phiên bản ghi âm — hầu hết các phiên bản ghi âm nhóm tập trung cần 10–15 phút dọn dẹp.
07PI và sinh viên sau đại học của tôi có thể truy cập phiên bản ghi âm trong cùng một dự án không?+
Vâng. Không gian làm việc hỗ trợ các thư mục được chia sẻ với quyền cho mỗi người dùng — PI có thể xem tất cả các phỏng vấn, RA chỉ xem các đơn vị được gán của họ. Hữu ích cho các nghiên cứu đa địa điểm nơi bạn không muốn một sinh viên xuất dữ liệu của sinh viên khác.
08Đối với các trích dẫn trực tiếp cấp xuất bản, bạn có cung cấp một lần vượt qua con người không?+
Chưa, và chúng tôi sẽ không giả vờ chúng tôi làm. Đối với các trích dẫn vào luận văn hoặc bài báo, khuyến nghị của chúng tôi là: chạy phiên bản ghi âm AI trước, mã hóa trong công cụ CAQDAS của bạn, sau đó sửa lại 30–60 giây cụ thể xung quanh mỗi trích dẫn so với âm thanh trước khi nó bị xóa. Đó là quy trình hầu hết người dùng nhà nghiên cứu của chúng tôi sử dụng.

Tải lên một phỏng vấn. Xem liệu phiên bản ghi âm mã hóa theo cách bạn muốn mã hóa nó.

30 phút miễn phí mỗi tháng. Không có thẻ. Chế độ trích dẫn chính xác, 100+ ngôn ngữ, DOCX sẵn sàng CAQDAS, âm thanh xóa trong 24 giờ.

Bắt đầu miễn phí