Phiên ghi âm nhóm tập trung.Mỗi người nói được gắn nhãn, từng từ.

Tải lên một tập tin ghi âm nhóm tập trung với 6, 8, thậm chí 10 giọng nói. Nhận phiên ghi từng chữ từng lời với mỗi thành viên được gắn nhãn, tiếng nói chồng gắn thẻ, và DOCX tải trực tiếp vào NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Xem kết quả ra được

8 thành viên đưa vào. Từng từ được gắn nhãn ra ngoài.

Nhóm tập trung là trường hợp khó nhất trong hàng đợi của chúng tôi — nhân khẩu học tương tự, giọng nói tương tự, tiếng nói chồng lấp thường xuyên. Chúng tôi gắn thẻ chồng lấp trong dòng thay vì bỏ nó, sau đó bạn đổi tên Speaker 3 → 'Participant_F2' một lần và nó sẽ tự động cập nhật khắp nơi. Thậm chí với tiếng nói chồng lấp chồng lấp tiếng nói thường xuyên, phương pháp này vẫn hoạt động tốt.

Tập tin ghi âm nhóm tập trungREC Người dẫn dắc + 7 thành viên · 1:23:14
tự động phát hiện en-US44 kHz boundary mic · WAV
~90s
Phiên ghi · phát trực tuyến91% độ chính xác · 8 người nói
S1

Nên khi bạn lần đầu mở gói — hãy kể cho tôi biết bạn nhận thấy gì.

S2

Thực sự? Điều đầu tiên tôi nhận thấy là mùi. Giống như mùi bệnh viện, kiểu lạnh lùng —

S3

Vâng, tôi cũng thế. Tôi nghĩ nó phải là cái có mùi hoa oải hương.

S2

Đúng vậy, và nhãn nói hoa oải hương nhưng nó thực sự không —

91% với phòng 8 người nói dùng mic tổng hợpDOCX (sẵn sàng cho QDA) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Ba lựa chọn thực tế · so sánh trung thực

Rev thủ công. AI chung chung. Hay là chúng tôi.

Các nhà nghiên cứu thường chọn giữa việc trả tiền cho một người ghi âm thủ công (chậm, chính xác, đắt tiền) hoặc chạy tập tin qua một công cụ AI chung chung không được xây dựng cho các phòng 8 giọng nói. Chúng tôi ở giữa — tốc độ của AI, diarization điều chỉnh cho ghi âm nghiên cứu, và DOCX có thể đưa vào NVivo mà không cần sửa chữa.

Option 01

Rev ghi âm thủ công từng chữ từng lời

Con người gõ phím. Độ chính xác cao, nhưng cần 24 giờ để hoàn thành và giá tăng tuyến tính theo số giờ.

Độ chính xác~99% (con người)
Thời gian hoàn thành12–24 giờ thường gặp
Tiếng nói chồngĐược đánh dấu [crosstalk]
Xuất QDADOCX, sửa chữa thủ công
Chi phí · mỗi phút$1.50 từng chữ từng lời
Nhóm 90 phút~$135
Best forCông việc luận văn hoặc nghiên cứu được quy định nơi mọi sai lầm phát âm phải được xác minh bởi con người.
Option 02

Transcription.Solutions

Diarization điều chỉnh cho 6-10 giọng nói, tiếng nói chồng gắn thẻ trong dòng, xuất DOCX được chuẩn bị cho NVivo, ATLAS.ti, và Dedoose.

Độ chính xác88–94% với âm thanh nhóm
Thời gian hoàn thành~1× thời gian thực
Tiếng nói chồngGắn thẻ, không bỏ
Xuất QDADOCX với lượt người nói
Chi phí · mỗi phút$0.03
Nhóm 90 phút~$2.70
Best forCác nhà nghiên cứu chạy nhiều nhóm cần phiên ghi first-pass trong NVivo vào sáng hôm sau, không phải tuần tới.
Option 03

Otter / Sonix

AI chung xây dựng cho cuộc họp. Khá tốt với 2-3 người nói, sụp đổ khi vượt quá 5 — và xuất không dự kiến cho phần mềm QDA.

Độ chính xácGiảm khi vượt quá 5 người nói
Thời gian hoàn thànhNhanh
Tiếng nói chồngThường bị bỏ
Xuất QDAKhông có định dạng NVivo gốc
Giới hạn người nóiGiới hạn mềm ~6
Chi phí$17–22/người dùng/tháng
Best forPhỏng vấn nhỏ và 1-1 nơi ghi âm có 2-3 giọng nói và nằm trong quy trình lịch.

Giá chính xác tính đến tháng 5 năm 2026. Phạm vi độ chính xác đến từ mẫu nội bộ của chúng tôi về tập tin nhóm tập trung của khách hàng, không phải tiêu chuẩn tổng hợp.

Cụ thể cho nhóm tập trung

Ba điều chia cắt các nhà nghiên cứu trên công cụ AI chung chung.

Bật đúng các cài đặt từ đầu và phiên ghi sẽ đưa vào NVivo mà không cần một cuối tuần sửa chữa.

Điều gì diễn ra sai

  1. 1Tiếng nói chồng bị bỏ. Hầu hết các công cụ người dùng chọn một người nói trong khi chồng lấp và loại bỏ phần còn lại. Bạn mất chính xác những khoảnh khắc nơi sự đồng thuận hoặc phản đối xảy ra.
  2. 2Người nói sụp đổ thành 3. Công cụ giả định các phòng kích thước cuộc họp và diarization giới hạn theo cụm thấp. 8 thành viên của bạn quay lại như 'Speaker 1' / 'Speaker 2' / 'Speaker 3'.
  3. 3Xuất là một bức tường văn bản. Không có phá vỡ đoạn văn cho mỗi lượt người nói, không có cấu trúc DOCX NVivo có thể tự động mã hóa khi nhập.

Điều cần bật ở đây

  1. 1Bật Tag tiếng nói chồng trong biểu mẫu công việc. Tiếng nói chồng nhận được các marker `[overlap]` trong dòng và cả hai người nói giữ lại các lời nói của họ.
  2. 2Đặt Số người nói dự kiến: 8-12 rõ ràng. Chúng tôi cấp số lượng cụm diarization để phù hợp thay vì đoán thấp.
  3. 3Chọn xuất DOCX (sẵn sàng cho QDA). Người nói lượt trở thành đoạn văn với tiền tố nhãn — NVivo, ATLAS.ti, và Dedoose đều tự động phát hiện định dạng này khi nhập.

Cài đặt công việc được khuyến nghị cho nhóm tập trung

Tải lên tập tin nhóm tập trung với mẫu 'nghiên cứu' và đây là lật bật theo mặc định. Ghi đè mỗi công việc từ biểu mẫu.

Diarization
Âm học · dự kiến 6-10 người nói
Chế độ từng chữ từng lời
Đầy đủ — disfluencies giữ lại
Xử lý chồng lấp
Gắn thẻ trong dòng [overlap]
Từ vựng tùy chỉnh
Tên sản phẩm / thương hiệu từ screener
Nhãn người nói
Có thể chỉnh sửa sau công việc, lan rộng tất cả
Xuất
DOCX (sẵn sàng cho QDA) · TXT có dấu thời gian

Accuracy · real-world numbers

94% với lavalier trên mỗi thành viên. Duy trì 82% với một mic phòng duy nhất.

Độ chính xác của nhóm tập trung bị giới hạn bởi cấu trúc micrô, không phải mô hình. Một lavalier trên mỗi thành viên cung cấp cho chúng tôi các kênh sạch cho mỗi người nói — diarization trở nên tầm thường. Một mic ranh giới trên bàn hội nghị với 8 giọng nói là trường hợp khó. Những con số dưới đây đến từ ghi âm nghiên cứu thực tế trong pipeline của chúng tôi.

94%
Lavalier trên mỗi thành viên

Mỗi thành viên trên track riêng của họ, trộn thành WAV đa track. Diarization bị bỏ qua — lỗi chỉ văn bản. Trường hợp tốt nhất cho công việc cấp luận văn.

91%
Mic hội nghị, 4-6 thành viên

Mic ranh giới căn giữa trên bàn, xử lý phòng vừa phải. Giọng nói có thể phân biệt, thỉnh thoảng nhầm lẫn giữa thành viên cùng giới tính có độ tuổi tương tự.

86%
Một mic phòng duy nhất, 7-10 thành viên

Tiếng nói chồng thường xuyên, giọng nói tương tự hợp nhất dưới diarization âm học. Mong đợi một lượt đổi tên và hợp nhất 10 phút trên các chip người nói trước khi phân tích.

82%
Nhóm từ xa trên mono Zoom

Hỗn hợp mono nén, không có chia tách per-channel có sẵn. Từ vẫn có thể sử dụng được để mã hóa chủ đề, nhưng các yêu cầu từng chữ từng lời cấp disfluency yếu đi ở đây.

Câu hỏi thường gặp

8 điều mọi người hỏi về phiên ghi âm nhóm tập trung.

01Tôi có thể đổi tên Speaker 1 thành tên hoặc ID thực của người tham gia không?+
Có. Nhấp vào bất kỳ chip người nói nào trong trình chỉnh sửa, gõ tên hoặc ID screener (ví dụ 'P04_F_34'), và nó sẽ lan rộng đến mỗi lượt từ người nói đó trong phiên ghi. Xuất DOCX sử dụng các nhãn đã đổi tên.
02Bạn xử lý tiếng nói chồng và tiếng nói chồng lấp như thế nào?+
Chúng tôi gắn thẻ nó trong dòng với các marker `[overlap]` và giữ lại các lời nói của cả hai người nói trong phiên ghi. Các công cụ chung thường chọn một giọng nói và bỏ cái kia — chúng tôi không, bởi vì các khoảnh khắc chồng lấp thường là nơi động lực nhóm tập trung thực tế sống.
03DOCX thực sự nhập sạch vào NVivo và ATLAS.ti không?+
Có. Chúng tôi xuất với nhãn người nói dưới dạng tiêu đề kiểu đoạn, mà NVivo tự động mã hóa trong quá trình nhập và ATLAS.ti công nhận là lượt người nói. Dedoose chấp nhận DOCX tương tự qua đường dẫn nhập phiên ghi của nó.
04Bạn có thể diarize bao nhiêu người nói trong một tập tin?+
Giới hạn mềm khoảng 12. Vượt quá điều đó, cụm âm học bắt đầu hợp nhất giọng nói tương tự — điều này thường có nghĩa là một lượt đổi tên 10-15 phút ở phía bạn. Đặt 'Số người nói dự kiến' rõ ràng trong biểu mẫu công việc để có kết quả tốt nhất.
05Từng chữ từng lời hoặc làm sạch — tôi có thể chọn không?+
Cả hai. Chế độ từng chữ từng lời giữ lại mỗi 'um', khởi đầu sai, và từ lặp lại để phân tích diễn ngôn. Làm sạch loại bỏ disfluencies để dễ đọc. Bạn chọn mỗi công việc; mặc định cho mẫu nghiên cứu là từng chữ từng lời.
06Điều gì về các yêu cầu IRB và bí mật của người tham gia?+
Các tập tin được xử lý trong cơ sở hạ tầng của chúng tôi, không được gửi đến API bên thứ ba. Chúng tôi cung cấp cờ xóa tự động sau N ngày cho mỗi công việc để tuân thủ IRB. Chúng tôi SOC 2 Type II và tuân thủ GDPR; DPA nằm trên trang pháp lý nếu IRB của bạn cần nó.
07Tôi có nên ghi video hay chỉ ghi âm?+
Chỉ âm thanh là được — chúng tôi không sử dụng video để diarization. Nếu bạn có video để xác định người tham gia, giữ nó cục bộ cho mã hóa của riêng bạn; chỉ tải lên track âm thanh nhanh hơn và rẻ hơn.
08Chi phí so với Rev ghi âm thủ công từng chữ từng lời như thế nào?+
Một nhóm tập trung 90 phút chạy khoảng $2.70 ở đây so với khoảng $135 trên Rev verbatim. Sự đánh đổi là độ chính xác: chúng tôi arrive ở 86-94% tùy thuộc vào cài đặt mic, các nhân viên ghi âm con người của Rev đạt ~99%. Hầu hết các nhà nghiên cứu sử dụng chúng tôi cho lần đầu tiên và chỉ nâng cấp các nhóm cụ thể lên con người nếu cần.

Tải lên tập tin ghi âm nhóm tập trung. Xem phiên ghi trong NVivo vào ngày mai.

30 phút miễn phí mỗi tháng. Không cần thẻ. Nhãn người nói, gắn thẻ tiếng nói chồng, xuất DOCX sẵn sàng cho QDA có trong mỗi kế hoạch.

Bắt đầu miễn phí