Phiên ghi âm nhóm tập trung — ghi âm nhóm tập trung với nhãn người nói cho mỗi thành viên

Phiên ghi âm nhóm tập trung.Mỗi người nói được gắn nhãn, từng từ.

Tải lên một tập tin ghi âm nhóm tập trung với 6, 8, thậm chí 10 giọng nói. Nhận phiên ghi từng chữ từng lời với mỗi thành viên được gắn nhãn, tiếng nói chồng gắn thẻ, và DOCX tải trực tiếp vào NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

8 thành viên đưa vào. Từng từ được gắn nhãn ra ngoài.

Nhóm tập trung là trường hợp khó nhất trong hàng đợi của chúng tôi — nhân khẩu học tương tự, giọng nói tương tự, tiếng nói chồng lấp thường xuyên. Chúng tôi gắn thẻ chồng lấp trong dòng thay vì bỏ nó, sau đó bạn đổi tên Speaker 3 → 'Participant_F2' một lần và nó sẽ tự động cập nhật khắp nơi. Thậm chí với tiếng nói chồng lấp chồng lấp tiếng nói thường xuyên, phương pháp này vẫn hoạt động tốt.

Tập tin ghi âm nhóm tập trungREC Người dẫn dắc + 7 thành viên · 1:23:14

tự động phát hiện en-US44 kHz boundary mic · WAV

~90s

Phiên ghi · phát trực tuyến91% độ chính xác · 8 người nói

Nên khi bạn lần đầu mở gói — hãy kể cho tôi biết bạn nhận thấy gì.

Thực sự? Điều đầu tiên tôi nhận thấy là mùi. Giống như mùi bệnh viện, kiểu lạnh lùng —

Vâng, tôi cũng thế. Tôi nghĩ nó phải là cái có mùi hoa oải hương.

Đúng vậy, và nhãn nói hoa oải hương nhưng nó thực sự không —

91% với phòng 8 người nói dùng mic tổng hợpDOCX (sẵn sàng cho QDA) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev thủ công. AI chung chung. Hay là chúng tôi.

Các nhà nghiên cứu thường chọn giữa việc trả tiền cho một người ghi âm thủ công (chậm, chính xác, đắt tiền) hoặc chạy tập tin qua một công cụ AI chung chung không được xây dựng cho các phòng 8 giọng nói. Chúng tôi ở giữa — tốc độ của AI, diarization điều chỉnh cho ghi âm nghiên cứu, và DOCX có thể đưa vào NVivo mà không cần sửa chữa.

Option 01

Rev ghi âm thủ công từng chữ từng lời

Con người gõ phím. Độ chính xác cao, nhưng cần 24 giờ để hoàn thành và giá tăng tuyến tính theo số giờ.

Độ chính xác~99% (con người)

Thời gian hoàn thành12–24 giờ thường gặp

Tiếng nói chồngĐược đánh dấu [crosstalk]

Xuất QDADOCX, sửa chữa thủ công

Chi phí · mỗi phút$1.50 từng chữ từng lời

Nhóm 90 phút~$135

Best forCông việc luận văn hoặc nghiên cứu được quy định nơi mọi sai lầm phát âm phải được xác minh bởi con người.

Option 02

Transcription.Solutions

Diarization điều chỉnh cho 6-10 giọng nói, tiếng nói chồng gắn thẻ trong dòng, xuất DOCX được chuẩn bị cho NVivo, ATLAS.ti, và Dedoose.

Độ chính xác88–94% với âm thanh nhóm

Thời gian hoàn thành~1× thời gian thực

Tiếng nói chồngGắn thẻ, không bỏ

Xuất QDADOCX với lượt người nói

Chi phí · mỗi phút$0.03

Nhóm 90 phút~$2.70

Best forCác nhà nghiên cứu chạy nhiều nhóm cần phiên ghi first-pass trong NVivo vào sáng hôm sau, không phải tuần tới.

Option 03

Otter / Sonix

AI chung xây dựng cho cuộc họp. Khá tốt với 2-3 người nói, sụp đổ khi vượt quá 5 — và xuất không dự kiến cho phần mềm QDA.

Độ chính xácGiảm khi vượt quá 5 người nói

Thời gian hoàn thànhNhanh

Tiếng nói chồngThường bị bỏ

Xuất QDAKhông có định dạng NVivo gốc

Giới hạn người nóiGiới hạn mềm ~6

Chi phí$17–22/người dùng/tháng

Best forPhỏng vấn nhỏ và 1-1 nơi ghi âm có 2-3 giọng nói và nằm trong quy trình lịch.

Giá chính xác tính đến tháng 5 năm 2026. Phạm vi độ chính xác đến từ mẫu nội bộ của chúng tôi về tập tin nhóm tập trung của khách hàng, không phải tiêu chuẩn tổng hợp.

94% với lavalier trên mỗi thành viên. Duy trì 82% với một mic phòng duy nhất.

Độ chính xác của nhóm tập trung bị giới hạn bởi cấu trúc micrô, không phải mô hình. Một lavalier trên mỗi thành viên cung cấp cho chúng tôi các kênh sạch cho mỗi người nói — diarization trở nên tầm thường. Một mic ranh giới trên bàn hội nghị với 8 giọng nói là trường hợp khó. Những con số dưới đây đến từ ghi âm nghiên cứu thực tế trong pipeline của chúng tôi.

8 điều mọi người hỏi về phiên ghi âm nhóm tập trung.

01Tôi có thể đổi tên Speaker 1 thành tên hoặc ID thực của người tham gia không?+

Có. Nhấp vào bất kỳ chip người nói nào trong trình chỉnh sửa, gõ tên hoặc ID screener (ví dụ 'P04_F_34'), và nó sẽ lan rộng đến mỗi lượt từ người nói đó trong phiên ghi. Xuất DOCX sử dụng các nhãn đã đổi tên.

02Bạn xử lý tiếng nói chồng và tiếng nói chồng lấp như thế nào?+

Chúng tôi gắn thẻ nó trong dòng với các marker `[overlap]` và giữ lại các lời nói của cả hai người nói trong phiên ghi. Các công cụ chung thường chọn một giọng nói và bỏ cái kia — chúng tôi không, bởi vì các khoảnh khắc chồng lấp thường là nơi động lực nhóm tập trung thực tế sống.

03DOCX thực sự nhập sạch vào NVivo và ATLAS.ti không?+

Có. Chúng tôi xuất với nhãn người nói dưới dạng tiêu đề kiểu đoạn, mà NVivo tự động mã hóa trong quá trình nhập và ATLAS.ti công nhận là lượt người nói. Dedoose chấp nhận DOCX tương tự qua đường dẫn nhập phiên ghi của nó.

04Bạn có thể diarize bao nhiêu người nói trong một tập tin?+

Giới hạn mềm khoảng 12. Vượt quá điều đó, cụm âm học bắt đầu hợp nhất giọng nói tương tự — điều này thường có nghĩa là một lượt đổi tên 10-15 phút ở phía bạn. Đặt 'Số người nói dự kiến' rõ ràng trong biểu mẫu công việc để có kết quả tốt nhất.

05Từng chữ từng lời hoặc làm sạch — tôi có thể chọn không?+

Cả hai. Chế độ từng chữ từng lời giữ lại mỗi 'um', khởi đầu sai, và từ lặp lại để phân tích diễn ngôn. Làm sạch loại bỏ disfluencies để dễ đọc. Bạn chọn mỗi công việc; mặc định cho mẫu nghiên cứu là từng chữ từng lời.

06Điều gì về các yêu cầu IRB và bí mật của người tham gia?+

Các tập tin được xử lý trong cơ sở hạ tầng của chúng tôi, không được gửi đến API bên thứ ba. Chúng tôi cung cấp cờ xóa tự động sau N ngày cho mỗi công việc để tuân thủ IRB. Chúng tôi SOC 2 Type II và tuân thủ GDPR; DPA nằm trên trang pháp lý nếu IRB của bạn cần nó.

07Tôi có nên ghi video hay chỉ ghi âm?+

Chỉ âm thanh là được — chúng tôi không sử dụng video để diarization. Nếu bạn có video để xác định người tham gia, giữ nó cục bộ cho mã hóa của riêng bạn; chỉ tải lên track âm thanh nhanh hơn và rẻ hơn.

08Chi phí so với Rev ghi âm thủ công từng chữ từng lời như thế nào?+

Một nhóm tập trung 90 phút chạy khoảng $2.70 ở đây so với khoảng $135 trên Rev verbatim. Sự đánh đổi là độ chính xác: chúng tôi arrive ở 86-94% tùy thuộc vào cài đặt mic, các nhân viên ghi âm con người của Rev đạt ~99%. Hầu hết các nhà nghiên cứu sử dụng chúng tôi cho lần đầu tiên và chỉ nâng cấp các nhóm cụ thể lên con người nếu cần.