포커스 그룹 전사 — 참가자별 화자 라벨로 포커스 그룹을 전사하세요

포커스 그룹 전사.모든 화자, 모든 단어까지.

6명, 8명, 심지어 10명이 말하는 포커스 그룹 녹음을 올려보세요. 참가자마다 라벨이 붙고, 겹쳐 말한 부분은 태그로 표시되며, NVivo로 바로 불러올 수 있는 DOCX를 받게 됩니다.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

참가자 8명 입력. 라벨 붙은 축어식 출력.

포커스 그룹은 저희 큐에서 가장 어려운 화자 분리 케이스입니다 — 비슷한 인구통계, 비슷한 목소리, 잦은 겹쳐 말하기까지. 저희는 겹친 부분을 누락시키지 않고 인라인으로 태그를 달고, Speaker 3 → 'Participant_F2'로 한 번만 이름을 바꾸면 전체에 자동 반영됩니다.

포커스 그룹 녹음REC 진행자 + 참가자 7명 · 1:23:14

자동 감지: en-US44 kHz 경계 마이크 · WAV

~90s

전사본 · 스트리밍 중정확도 91% · 화자 8명

포장을 처음 열었을 때 — 어떤 점이 눈에 띄었는지 말씀해 주세요.

솔직히요? 제일 먼저 느껴진 건 냄새였어요. 병원 같은, 좀 임상적인 느낌이었는데 —

네, 저도요. 라벤더 향이라고 들었던 것 같은데요.

맞아요, 라벨에는 라벤더라고 적혀 있는데 실제로는 전혀 —

8인 룸 마이크 환경에서 91%DOCX (QDA 호환) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev 사람 작업자. 범용 AI. 또는 저희.

연구자들은 보통 사람 전사가(느리고 정확하지만 비쌈)에게 비용을 지불하거나, 8명짜리 룸 환경을 위해 만들어지지 않은 범용 AI 도구에 파일을 돌리는 두 가지 사이에서 선택합니다. 저희는 그 중간에 있습니다 — AI의 속도, 리서치 녹음에 맞춰 튜닝된 화자 분리, 그리고 별다른 손질 없이 NVivo로 바로 들어가는 DOCX.

Option 01

Rev 사람 축어식

사람이 직접 타이핑합니다. 정확도는 높지만 24시간 소요, 시간당 비용이 선형으로 늘어납니다.

정확도~99% (사람)

소요 시간보통 12–24시간

겹쳐 말하기[crosstalk] 표기

QDA 내보내기DOCX, 수동 정리 필요

분당 비용축어식 $1.50

90분 그룹~$135

Best for모든 비유창성까지 사람이 검증해야 하는 학위 논문이나 규제 대상 연구.

Option 02

Transcription.Solutions

6~10명에 맞춰 튜닝된 화자 분리, 겹쳐 말하기 인라인 태깅, NVivo·ATLAS.ti·Dedoose에 맞는 DOCX 내보내기.

정확도그룹 오디오에서 88–94%

소요 시간실시간 대비 ~1배

겹쳐 말하기누락 없이 태그 처리

QDA 내보내기화자 차례별 DOCX

분당 비용$0.03

90분 그룹~$2.70

Best for여러 그룹을 진행하면서 다음 주가 아닌 내일 아침까지 NVivo에서 1차 전사본이 필요한 연구자.

Option 03

Otter / Sonix

회의용으로 만들어진 범용 AI. 화자 2~3명에는 괜찮지만 5명을 넘으면 흐트러지고 — 내보내기도 QDA 소프트웨어를 염두에 두지 않았습니다.

정확도화자 5명 넘으면 하락

소요 시간빠름

겹쳐 말하기자주 누락됨

QDA 내보내기NVivo 네이티브 포맷 없음

화자 한도소프트 리밋 ~6

비용사용자당 월 $17–22

Best for녹음에 2~3명만 등장하고 캘린더 워크플로에 묶여 있는 소규모 인터뷰 및 1:1 미팅.

가격은 2026년 5월 기준입니다. 정확도 범위는 합성 벤치마크가 아니라 고객 포커스 그룹 파일 내부 샘플에서 산출했습니다.

참가자별 라발리에 마이크에서 94%. 단일 룸 마이크에서도 82% 유지.

포커스 그룹 정확도는 모델이 아니라 마이크 구성에서 병목이 생깁니다. 참가자마다 라발리에 마이크를 달면 화자별로 깨끗한 채널이 확보되어 화자 분리가 거의 자명해집니다. 8명이 둘러앉은 회의 테이블 위 경계 마이크 하나가 가장 어려운 케이스죠. 아래 수치는 저희 파이프라인을 거친 실제 리서치 녹음에서 나온 값입니다.

자주 듣는 8가지 질문. 포커스 그룹 전사에 대해

01Speaker 1을 참가자의 실제 이름이나 ID로 바꿀 수 있나요?+

네. 에디터에서 아무 화자 칩이나 클릭해 이름이나 스크리너 ID(예: 'P04_F_34')를 입력하면, 전사본에서 그 화자의 모든 차례에 자동 반영됩니다. DOCX 내보내기도 변경된 라벨을 사용합니다.

02겹쳐 말하기와 동시 발화는 어��게 처리하나요?+

인라인으로 `[overlap]` 태그를 달고 두 화자의 발화를 모두 전사본에 남깁니다. 일반 도구는 보통 한쪽 목소리만 골라내고 다른 쪽을 버리는데 — 저희는 그러지 않습니다. 정작 그 겹침의 순간에 포커스 그룹의 진짜 역학이 살아있기 때문입니다.

03DOCX가 정말 NVivo와 ATLAS.ti로 깔끔하게 들어가나요?+

네. 화자 라벨을 단락 스타일 헤딩으로 내보내며, NVivo는 가져올 때 자동 코딩하고 ATLAS.ti는 화자 차례로 인식합니다. Dedoose도 같은 DOCX를 전사본 가져오기 경로로 받아들입니다.

04한 파일에서 화자는 몇 명까지 분리할 수 있나요?+

소프트 상한은 12명 정도입니다. 그 이상이면 음향 클러스터링이 비슷한 목소리를 병합하기 시작하고 — 보통 사용자 쪽에서 10~15분의 이름 변경 작업이 필요합니다. 최선의 결과를 위해 작업 폼에서 '예상 화자 수'를 명시적으로 설정하세요.

05축어식이나 정리된 형태, 선택할 수 있나요?+

둘 다 가능합니다. 축어식 모드는 'um', 잘못 시작한 말, 반복된 단어까지 담�� 분석용으로 모두 유지합니다. 정리(Cleaned)는 가독성을 위해 비유창성을 제거합니다. 작업별로 선택할 수 있고, research 템플릿의 기본값은 축어식입니다.

06IRB 요건이나 참가자 기밀 유지는 어떻게 되나요?+

파일은 외부 API로 보내지 않고 저희 인프라에서 처리합니다. IRB 프로토콜을 위해 작업별 N일 후 자동 삭제 플래그를 제공합니다. SOC 2 Type II와 GDPR을 준수하며, IRB가 요구할 경우 DPA는 법무 페이지에 있습니다.

07영상으로 녹화해야 하나요, 음성만 녹음해도 되나요?+

음성만으로 충분합니다 — 저희는 화자 분리에 영상을 사용하지 않습니다. 참가자 식별용 영상이 있다면 본인 코딩 작업을 위해 로컬에 보관하시고, 업로드는 오디오 트랙만 올리는 편이 더 빠르고 저렴합니다.

08Rev 사람 축어식과 비용 차이는 어떤가요?+

90분짜리 포커스 그룹이 여기서는 약 $2.70, Rev 축어식은 대략 $135 정도입니다. 트레이드오프는 정확도입니다 — 저희는 마이크 구성에 따라 86~94%, Rev의 사람 전사가는 ~99%에 도달합니다. 대부분의 ��구자는 1차 전사에 저희를 쓰고, 필요한 그룹만 사람 작업으로 에스컬레이션합니다.