포커스 그룹 전사.모든 화자, 모든 단어까지.

6명, 8명, 심지어 10명이 말하는 포커스 그룹 녹음을 올려보세요. 참가자마다 라벨이 붙고, 겹쳐 말한 부분은 태그로 표시되며, NVivo로 바로 불러올 수 있는 DOCX를 받게 됩니다.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 결과물 미리 보기

참가자 8명 입력. 라벨 붙은 축어식 출력.

포커스 그룹은 저희 큐에서 가장 어려운 화자 분리 케이스입니다 — 비슷한 인구통계, 비슷한 목소리, 잦은 겹쳐 말하기까지. 저희는 겹친 부분을 누락시키지 않고 인라인으로 태그를 달고, Speaker 3 → 'Participant_F2'로 한 번만 이름을 바꾸면 전체에 자동 반영됩니다.

포커스 그룹 녹음REC 진행자 + 참가자 7명 · 1:23:14
자동 감지: en-US44 kHz 경계 마이크 · WAV
~90s
전사본 · 스트리밍 중정확도 91% · 화자 8명
S1

포장을 처음 열었을 때 — 어떤 점이 눈에 띄었는지 말씀해 주세요.

S2

솔직히요? 제일 먼저 느껴진 건 냄새였어요. 병원 같은, 좀 임상적인 느낌이었는데 —

S3

네, 저도요. 라벤더 향이라고 들었던 것 같은데요.

S2

맞아요, 라벨에는 라벤더라고 적혀 있는데 실제로는 전혀 —

8인 룸 마이크 환경에서 91%DOCX (QDA 호환) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

현실적인 세 가지 선택지 · 솔직한 비교

Rev 사람 작업자. 범용 AI. 또는 저희.

연구자들은 보통 사람 전사가(느리고 정확하지만 비쌈)에게 비용을 지불하거나, 8명짜리 룸 환경을 위해 만들어지지 않은 범용 AI 도구에 파일을 돌리는 두 가지 사이에서 선택합니다. 저희는 그 중간에 있습니다 — AI의 속도, 리서치 녹음에 맞춰 튜닝된 화자 분리, 그리고 별다른 손질 없이 NVivo로 바로 들어가는 DOCX.

Option 01

Rev 사람 축어식

사람이 직접 타이핑합니다. 정확도는 높지만 24시간 소요, 시간당 비용이 선형으로 늘어납니다.

정확도~99% (사람)
소요 시간보통 12–24시간
겹쳐 말하기[crosstalk] 표기
QDA 내보내기DOCX, 수동 정리 필요
분당 비용축어식 $1.50
90분 그룹~$135
Best for모든 비유창성까지 사람이 검증해야 하는 학위 논문이나 규제 대상 연구.
Option 02

Transcription.Solutions

6~10명에 맞춰 튜닝된 화자 분리, 겹쳐 말하기 인라인 태깅, NVivo·ATLAS.ti·Dedoose에 맞는 DOCX 내보내기.

정확도그룹 오디오에서 88–94%
소요 시간실시간 대비 ~1배
겹쳐 말하기누락 없이 태그 처리
QDA 내보내기화자 차례별 DOCX
분당 비용$0.03
90분 그룹~$2.70
Best for여러 그룹을 진행하면서 다음 주가 아닌 내일 아침까지 NVivo에서 1차 전사본이 필요한 연구자.
Option 03

Otter / Sonix

회의용으로 만들어진 범용 AI. 화자 2~3명에는 괜찮지만 5명을 넘으면 흐트러지고 — 내보내기도 QDA 소프트웨어를 염두에 두지 않았습니다.

정확도화자 5명 넘으면 하락
소요 시간빠름
겹쳐 말하기자주 누락됨
QDA 내보내기NVivo 네이티브 포맷 없음
화자 한도소프트 리밋 ~6
비용사용자당 월 $17–22
Best for녹음에 2~3명만 등장하고 캘린더 워크플로에 묶여 있는 소규모 인터뷰 및 1:1 미팅.

가격은 2026년 5월 기준입니다. 정확도 범위는 합성 벤치마크가 아니라 고객 포커스 그룹 파일 내부 샘플에서 산출했습니다.

포커스 그룹 전용

에서 연구자를 괴롭히는 세 가지. 범용 AI 도구

처음에 올바른 설정만 켜두면 주말을 정리 작업에 쓰지 않고도 전사본이 NVivo로 들어갑니다.

무엇이 잘못되는가

  1. 1겹쳐 말하기가 누락됩니다. 대부분의 일반 도구는 발화가 겹칠 때 한 화자만 골라내고 나머지는 버립니다. 정작 합의나 반박이 일어나는 순간을 통째로 잃게 됩니다.
  2. 2화자가 3명으로 뭉뚱그려집니다. 도구가 회의 규모의 방을 가정하고 화자 분리 클러스터 수를 낮게 잡습니다. 참가자 8명이 'Speaker 1' / 'Speaker 2' / 'Speaker 3'로 돌아옵니다.
  3. 3내보내기가 거대한 텍스트 한 덩어리입니다. 화자 차례별 단락 구분도, NVivo가 가져올 때 자동 코딩할 수 있는 DOCX 구조도 없습니다.

여기서 무엇을 켜야 하나

  1. 1작업 폼에서 겹쳐 말하기 태그를 켜세요. 겹친 부분에 인라인 `[overlap]` 표기가 붙고 두 화자의 발화가 모두 보존됩니다.
  2. 2예상 화자 수: 8~12를 명시적으로 설정하세요. 클러스터 수를 낮게 어림짐작하지 않고 거기에 맞춰 화자 분리 규모를 잡습니다.
  3. 3DOCX (QDA 호환) 내보내기를 선택하세요. 화자 차례가 라벨 접두어가 붙은 단락으로 만들어지고 — NVivo, ATLAS.ti, Dedoose 모두 가져올 때 이 포맷을 자동 인식합니다.

포커스 그룹 권장 작업 설정

'research' 템플릿으로 포커스 그룹 파일을 올리면 아래 항목들이 기본으로 켜집니다. 작업별로 폼에서 재정의할 수 있습니다.

화자 분리
음향 기반 · 예상 화자 6~10명
축어식 모드
전체 — 비유창성 유지
겹침 처리
인라인 [overlap] 태그
사용자 사전
스크리너에서 가져온 제품·브랜드명
화자 라벨
작업 후 편집 가능, 일괄 반영
내보내기
DOCX (QDA 호환) · 타임스탬프 TXT

Accuracy · real-world numbers

참가자별 라발리에 마이크에서 94%. 단일 룸 마이크에서도 82% 유지.

포커스 그룹 정확도는 모델이 아니라 마이크 구성에서 병목이 생깁니다. 참가자마다 라발리에 마이크를 달면 화자별로 깨끗한 채널이 확보되어 화자 분리가 거의 자명해집니다. 8명이 둘러앉은 회의 테이블 위 경계 마이크 하나가 가장 어려운 케이스죠. 아래 수치는 저희 파이프라인을 거친 실제 리서치 녹음에서 나온 값입니다.

94%
참가자별 라발리에 마이크

각 참가자가 자기 트랙에 녹음되어 멀티트랙 WAV로 믹스됩니다. 화자 분리는 건너뛰고 — 텍스트 오류만 남습니다. 학위 논문급 작업에 최적의 조건.

91%
회의용 마이크, 참가자 4~6명

테이블 중앙에 놓인 경계 마이크, 적당한 룸 처리. 목소리가 구분되며, 같은 성별·비슷한 나이대 참가자 사이에서 가끔 혼동이 발생합니다.

86%
단일 룸 마이크, 참가자 7~10명

겹쳐 말하기가 잦고, 음향 기반 화자 분리에서 비슷한 목소리가 병합됩니다. 분석 전에 화자 칩 이름 변경과 병합 작업에 10분 정도가 필요할 수 있습니다.

82%
모노 Zoom 원격 그룹

압축된 모노 믹스, 채널별 분리 불가. 주제 코딩 용도로는 단어가 쓸 만하지만, 비유창성 수준의 축어식 주장은 여기서 약해집니다.

자주 묻는 질문

자주 듣는 8가지 질문. 포커스 그룹 전사에 대해

01Speaker 1을 참가자의 실제 이름이나 ID로 바꿀 수 있나요?+
네. 에디터에서 아무 화자 칩이나 클릭해 이름이나 스크리너 ID(예: 'P04_F_34')를 입력하면, 전사본에서 그 화자의 모든 차례에 자동 반영됩니다. DOCX 내보내기도 변경된 라벨을 사용합니다.
02겹쳐 말하기와 동시 발화는 어���게 처리하나요?+
인라인으로 `[overlap]` 태그를 달고 두 화자의 발화를 모두 전사본에 남깁니다. 일반 도구는 보통 한쪽 목소리만 골라내고 다른 쪽을 버리는데 — 저희는 그러지 않습니다. 정작 그 겹침의 순간에 포커스 그룹의 진짜 역학이 살아있기 때문입니다.
03DOCX가 정말 NVivo와 ATLAS.ti로 깔끔하게 들어가나요?+
네. 화자 라벨을 단락 스타일 헤딩으로 내보내며, NVivo는 가져올 때 자동 코딩하고 ATLAS.ti는 화자 차례로 인식합니다. Dedoose도 같은 DOCX를 전사본 가져오기 경로로 받아들입니다.
04한 파일에서 화자는 몇 명까지 분리할 수 있나요?+
소프트 상한은 12명 정도입니다. 그 이상이면 음향 클러스터링이 비슷한 목소리를 병합하기 시작하고 — 보통 사용자 쪽에서 10~15분의 이름 변경 작업이 필요합니다. 최선의 결과를 위해 작업 폼에서 '예상 화자 수'를 명시적으로 설정하세요.
05축어식이나 정리된 형태, 선택할 수 있나요?+
둘 다 가능합니다. 축어식 모드는 'um', 잘못 시작한 말, 반복된 단어까지 담��� 분석용으로 모두 유지합니다. 정리(Cleaned)는 가독성을 위해 비유창성을 제거합니다. 작업별로 선택할 수 있고, research 템플릿의 기본값은 축어식입니다.
06IRB 요건이나 참가자 기밀 유지는 어떻게 되나요?+
파일은 외부 API로 보내지 않고 저희 인프라에서 처리합니다. IRB 프로토콜을 위해 작업별 N일 후 자동 삭제 플래그를 제공합니다. SOC 2 Type II와 GDPR을 준수하며, IRB가 요구할 경우 DPA는 법무 페이지에 있습니다.
07영상으로 녹화해야 하나요, 음성만 녹음해도 되나요?+
음성만으로 충분합니다 — 저희는 화자 분리에 영상을 사용하지 않습니다. 참가자 식별용 영상이 있다면 본인 코딩 작업을 위해 로컬에 보관하시고, 업로드는 오디오 트랙만 올리는 편이 더 빠르고 저렴합니다.
08Rev 사람 축어식과 비용 차이는 어떤가요?+
90분짜리 포커스 그룹이 여기서는 약 $2.70, Rev 축어식은 대략 $135 정도입니다. 트레이드오프는 정확도입니다 — 저희는 마이크 구성에 따라 86~94%, Rev의 사람 전사가는 ~99%에 도달합니다. 대부분의 ��구자는 1차 전사에 저희를 쓰고, 필요한 그룹만 사람 작업으로 에스컬레이션합니다.

포커스 그룹 녹음을 올려보세요. 내일이면 NVivo에서 전사본을 볼 수 있습니다.

매월 무료 30분. 카드 등록 없음. 화자 라벨, 겹쳐 말하기 태깅, QDA 호환 DOCX 내보내기는 모든 플랜에 기본 포함.

무료로 시작하기