Rev ghi âm thủ công từng chữ từng lời
Con người gõ phím. Độ chính xác cao, nhưng cần 24 giờ để hoàn thành và giá tăng tuyến tính theo số giờ.
Tải lên một tập tin ghi âm nhóm tập trung với 6, 8, thậm chí 10 giọng nói. Nhận phiên ghi từng chữ từng lời với mỗi thành viên được gắn nhãn, tiếng nói chồng gắn thẻ, và DOCX tải trực tiếp vào NVivo.
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ Xem kết quả ra được
Nhóm tập trung là trường hợp khó nhất trong hàng đợi của chúng tôi — nhân khẩu học tương tự, giọng nói tương tự, tiếng nói chồng lấp thường xuyên. Chúng tôi gắn thẻ chồng lấp trong dòng thay vì bỏ nó, sau đó bạn đổi tên Speaker 3 → 'Participant_F2' một lần và nó sẽ tự động cập nhật khắp nơi. Thậm chí với tiếng nói chồng lấp chồng lấp tiếng nói thường xuyên, phương pháp này vẫn hoạt động tốt.
Nên khi bạn lần đầu mở gói — hãy kể cho tôi biết bạn nhận thấy gì.
Thực sự? Điều đầu tiên tôi nhận thấy là mùi. Giống như mùi bệnh viện, kiểu lạnh lùng —
Vâng, tôi cũng thế. Tôi nghĩ nó phải là cái có mùi hoa oải hương.
Đúng vậy, và nhãn nói hoa oải hương nhưng nó thực sự không —
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
Ba lựa chọn thực tế · so sánh trung thực
Các nhà nghiên cứu thường chọn giữa việc trả tiền cho một người ghi âm thủ công (chậm, chính xác, đắt tiền) hoặc chạy tập tin qua một công cụ AI chung chung không được xây dựng cho các phòng 8 giọng nói. Chúng tôi ở giữa — tốc độ của AI, diarization điều chỉnh cho ghi âm nghiên cứu, và DOCX có thể đưa vào NVivo mà không cần sửa chữa.
Con người gõ phím. Độ chính xác cao, nhưng cần 24 giờ để hoàn thành và giá tăng tuyến tính theo số giờ.
Diarization điều chỉnh cho 6-10 giọng nói, tiếng nói chồng gắn thẻ trong dòng, xuất DOCX được chuẩn bị cho NVivo, ATLAS.ti, và Dedoose.
AI chung xây dựng cho cuộc họp. Khá tốt với 2-3 người nói, sụp đổ khi vượt quá 5 — và xuất không dự kiến cho phần mềm QDA.
Giá chính xác tính đến tháng 5 năm 2026. Phạm vi độ chính xác đến từ mẫu nội bộ của chúng tôi về tập tin nhóm tập trung của khách hàng, không phải tiêu chuẩn tổng hợp.
Cụ thể cho nhóm tập trung
Bật đúng các cài đặt từ đầu và phiên ghi sẽ đưa vào NVivo mà không cần một cuối tuần sửa chữa.
Tải lên tập tin nhóm tập trung với mẫu 'nghiên cứu' và đây là lật bật theo mặc định. Ghi đè mỗi công việc từ biểu mẫu.
Accuracy · real-world numbers
Độ chính xác của nhóm tập trung bị giới hạn bởi cấu trúc micrô, không phải mô hình. Một lavalier trên mỗi thành viên cung cấp cho chúng tôi các kênh sạch cho mỗi người nói — diarization trở nên tầm thường. Một mic ranh giới trên bàn hội nghị với 8 giọng nói là trường hợp khó. Những con số dưới đây đến từ ghi âm nghiên cứu thực tế trong pipeline của chúng tôi.
Mỗi thành viên trên track riêng của họ, trộn thành WAV đa track. Diarization bị bỏ qua — lỗi chỉ văn bản. Trường hợp tốt nhất cho công việc cấp luận văn.
Mic ranh giới căn giữa trên bàn, xử lý phòng vừa phải. Giọng nói có thể phân biệt, thỉnh thoảng nhầm lẫn giữa thành viên cùng giới tính có độ tuổi tương tự.
Tiếng nói chồng thường xuyên, giọng nói tương tự hợp nhất dưới diarization âm học. Mong đợi một lượt đổi tên và hợp nhất 10 phút trên các chip người nói trước khi phân tích.
Hỗn hợp mono nén, không có chia tách per-channel có sẵn. Từ vẫn có thể sử dụng được để mã hóa chủ đề, nhưng các yêu cầu từng chữ từng lời cấp disfluency yếu đi ở đây.
Câu hỏi thường gặp
30 phút miễn phí mỗi tháng. Không cần thẻ. Nhãn người nói, gắn thẻ tiếng nói chồng, xuất DOCX sẵn sàng cho QDA có trong mỗi kế hoạch.
Bắt đầu miễn phí