학술 연구자를 위한 전사.IRB 준수, CAQDAS 호환, 100+ 언어.

연구 인터뷰 또는 포커스 그룹 녹음을 업로드하세요. 발화자 라벨, 타임스탬프가 있는 텍스트가 NVivo, Atlas.ti, MaxQDA와 즉시 호환 — 24시간 이내 음성 자동 삭제.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ 결과 보기

현장 녹음 입력. 코딩 준비 완료 전사본 출력.

참여자 발언을 타임스탬프로 표시하고, 요청 시 필러 단어를 유지하며, CAQDAS 도구가 인식하는 발화자 스타일과 함께 DOCX를 내보냅니다.

반구조화 인터뷰 · .wavREC 2명 · 1:08:24
자동 감지: en-GB44.1 kHz mono · 라발리에 마이크
~90s
전사본 · 스트리밍94% 정확도 · 그대로 모드
S1

동네의 변화를 처음 느낀 순간부터 얘기해 줄 수 있을까요?

S2

음, 아마 2019년쯤이었나? 모퉁이 베이커리가 문을 닫았어요. 그때 이상한 느낌이 들었어요.

S1

그걸 지켜보면서 어떤 기분이 들었어요?

S2

솔직히? 30년 동안 알던 그 장소가 조금씩 사라지는 것 같았어요.

라발리에 인터뷰에서 94% 정확도DOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

3가지 실제 옵션 · 솔직한 비교

Rev 인간 전사. NVivo 전사. 또는 우리.

Rev의 인간 서비스는 학위논문 수준의 인용구를 위한 업계 표준입니다. NVivo는 CAQDAS 도구 내에 AI 전사를 번들로 제공합니다. 우리는 그 중간 — Rev보다 빠르고, NVivo 기본 도구보다 정확하고 IRB 친화적입니다.

Option 01

Rev (인간 전사)

사람이 입력합니다. 느리고 비싸지만 출판 가능한 그대로 전사의 업계 표준입니다.

소요 시간12–24시간 (일반적)
비용 · 분당$1.50 (인간) / $0.25 (AI)
발화자 라벨네, 수동 배치
음성 보관Rev 서버에 저장
언어영어 (인간) · ~30개 (AI)
CAQDAS 내보내기DOCX, TXT (수동)
Best for예산이 제약이 아니며, 게시된 논문에서 직접 인용될 단일 고위험 인터뷰용.
Option 02

Transcription.Solutions

분 단위 AI 전사, 24시간 내 음성 삭제, NVivo 및 Atlas.ti 임포트용 스타일된 DOCX.

소요 시간60분 파일 당 약 5분
비용 · 분당$0.03
발화자 라벨자동 감지, 앱 내 이름 변경
음성 보관24시간 이내 삭제
언어100+, 자동 감지
CAQDAS 내보내기DOCX 제목 스타일 + TXT
Best for20개 이상의 인터뷰를 진행하는 연구자 — 빠른 초안 전사 후 출판용 인용구 5%만 손으로 수정.
Option 03

NVivo Transcription / Otter

CAQDAS 도구 또는 노트 앱에 번들된 AI 전사. 편리하지만, 영어 중심, 제어 능력 제한.

소요 시간비슷함 (AI)
비용크레딧 팩 · 분당 약 $0.30
발화자 라벨음향 기반, 영어 최적화
음성 보관구독에 종속
언어비영어 정확도 낮음
CAQDAS 내보내기NVivo 네이티브만 가능
Best for한 CAQDAS 생태계 내에서 전적으로 영어로 작업하는 박사 학위 학생 — 단일 청구서 원할 때.

가격 및 기능 플래그는 2026년 현재 정확합니다. Rev의 AI/인간 분할 및 NVivo Transcription 크레딧 가격은 지역 및 학술 라이선스에 따라 다릅니다.

질적 연구 특화

연구자에게 문제를 일으키는 3가지. 일반 전사 도구가

업로드 전 올바른 설정을 전환하면 전사본이 CAQDAS 프로젝트로 바로 임포트됩니다.

뭐가 문제가 되나요

  1. 1필러 단어 자동 제거. 일반 AI는 "음", "좀", 거짓 시작을 제거합니다 — 회의 노트는 괜찮지만 담화 분석에는 치명적입니다.
  2. 2영역 용어 (이론적 구조, 약물명, 지명, 친족 용어)가 음성 그대로 전사됩니다. 코딩 때 찾기 및 바꾸기를 해야 합니다.
  3. 3음성이 판매사 서버에 무기한 보관됩니다. 대부분의 IRB 데이터 관리 계획은 삭제 또는 제어된 보관을 요구하지만 — 판매사는 이를 명확히 문서화하기 드뭅니다.

여기서 뭘 전환하나요

  1. 1작업 양식에서 그대로 모드로 전환하세요. 필러, 거짓 시작, 반복, 웃음 마커를 유지합니다 — 정제된 모드는 연구자용 기본이 아닌 선택입니다.
  2. 2코드북 용어와 고유명사를 Custom vocabulary에 붙여넣으세요. 하드 치환이 아닌 인식자 힌트로 전달하므로 문맥이 항상 우선입니다.
  3. 3음성은 작업 완료 후 24시간 내 삭제됩니다. 전사본은 계정에 남습니다. 요청 시 IRB 파일용 삭제 확인서를 발급할 수 있습니다.

연구 인터뷰의 권장 작업 설정

현장 녹음을 드롭하면 이들이 기본으로 켜집니다. 필요시 양식에서 작업별로 재정의하세요.

모드
그대로 (필러 + 거짓 시작 포함)
발화자 모델
인터뷰 · 2–8명
언어
자동 감지 · 발음 대응
타임스탬프
모든 발화자 발언
음성 보관
24시간 이내 삭제
내보내기
DOCX (CAQDAS 스타일) · TXT · SRT

Accuracy · real-world numbers

깨끗한 라발리에 인터뷰에서 94%. 현장 작업이 망쳐놓는 것에 대해 솔직합니다.

현장 음성은 전사의 어려운 케이스입니다 — 개방된 공간, 비원어민 발음, 포커스 그룹의 겹치는 말. 라발리에 마이크 일대일 인터뷰가 최고 성능이고, 주변 현장 녹음과 대규모 포커스 그룹은 빠르게 저하됩니다. 아래 숫자는 실제 연구자 업로드에서 나온 것이지 합성 벤치마크가 아닙니다.

95%
1대1, 라발리에 또는 USB 마이크

조용한 방, 단일 L2 또는 원어민 발화자, 테이블 위의 녹음기. 반구조화 인터뷰의 최고 케이스 — 대부분의 일대일 연구가 여기에 해당합니다.

91%
휴대용 녹음기, 2–3명 발화자

Zoom H4n 또는 테이블 중앙의 휴대폰 녹음기. 발화자 위치는 방향으로 식별됩니다. 5분 라벨 재검토 예상.

85%
현장 인터뷰, 주변 소음

카페, 시장, 이동 중 인터뷰. 배경 잡음과 교통 소리가 짧은 응답에 영향을 미치지만, 주요 발언은 여전히 코딩 가능합니다.

80%
포커스 그룹, 5–8명 참여자

겹치는 말과 공용 마이크. 음성 분리는 조용한 목소리를 병합할 것입니다 — 코딩 시간에 명확히 해야 합니다.

자주 묻는 질문

연구자가 묻는 8가지. 학술 전사에 대해

01일반적인 IRB 데이터 관리 계획에서 승인받을 수 있나요?+
우리가 본 대부분의 계획은 이 두 가지를 읽으면 우리를 승인합니다: 음성은 작업 완료 후 24시간 내 삭제되고, 전사본은 연구자 계정에만 남습니다. 우리는 IRB가 아닙니다 — 최종 승인은 귀사의 위원회가 합니다 — 하지만 요청 시 프로토콜용 처리 설명서를 발급할 수 있습니다.
02인터뷰 음성을 보관하나요?+
아니요. 음성 파일은 작업 완료 후 24시간 내 삭제됩니다. 계정에는 전사본만 남고, 언제든 삭제할 수 있습니다. 우리는 연구 음성을 모델 훈련에 사용하지 않습니다.
03필러, 거짓 시작, 겹침을 포함한 진정한 그대로 전사를 할 수 있나요 — 담화 분석용?+
네. 작업 양식에서 그대로 모드를 켜면 "음", "어", 반복, 거짓 시작, 웃음 토큰을 유지합니다. 겹침은 발언 경계에 중괄호로 표시됩니다. Jefferson 표기법은 자동으로 하지 않습니다 — 그건 여전히 사람이 해야 합니다.
04DOCX가 NVivo, Atlas.ti, MaxQDA에 깔끔하게 임포트되나요?+
네. 우리 DOCX는 각 도구가 발화자별 자동 코딩을 위해 기대하는 제목과 발화자 스타일을 사용합니다. NVivo에서는 파일 → 임포트 → 전사본을 사용하세요. Atlas.ti와 MaxQDA에서는 발화자 단락 구조가 보존되어 발화자별 자동 코딩이 바로 작동합니다.
05비원어민 영어나 다국어 인터뷰는 어떻게 처리하나요?+
우리는 한 녹음 내 코드 스위칭을 포함하여 100+ 언어를 자동 감지로 지원합니다. 심한 L2 발음은 깨끗한 음성에서 85–90% 정도입니다. 교육 데이터가 부족한 소수 언어(예: 일부 아프리카 및 토착 언어)는 정확도가 낮으며 언어 선택기에 이를 명시합니다.
066–8명의 포커스 그룹 — 음성 분리가 정말 작동하나요?+
부분적으로. 음향 음성 분리는 공용 마이크에서 4–5개의 구별되는 목소리를 안정적으로 분리합니다. 그 이상이면 가장 조용한 2명의 참여자가 병합될 것으로 예상하세요. 해결책은 전사 편집기에서 재라벨링 — 대부분의 포커스 그룹 전사본은 10–15분 정도의 정리가 필요합니다.
07공동 PI와 대학원생이 같은 프로젝트의 전사본에 접근할 수 있나요?+
네. 워크스페이스는 사용자별 권한이 있는 공유 폴더를 지원합니다 — PI는 모든 인터뷰를 볼 수 있고, RA는 할당된 집단만 봅니다. 한 학생이 다른 학생 데이터를 내보내는 걸 원하지 않는 다중 지역 연구에 유용합니다.
08출판 수준의 직접 인용구용으로 인간 검수 옵션이 있나요?+
아직 없고, 우리는 그렇다고 거짓말하지도 않습니다. 논문이나 논문에 들어갈 인용구는 이렇게 권장합니다: 먼저 AI 전사본을 실행하고, CAQDAS 도구에서 코딩한 후, 삭제 전 각 인용구 주변 30–60초를 음성으로 손수 검수하세요. 이게 우리 연구자 사용자들이 주로 사용하는 워크플로입니다.

한 인터뷰를 업로드하세요. 전사본이 코딩되는지 봅시다. 당신이 코딩하는 방식으로

매달 무료 30분. 카드 불필요. 그대로 모드, 100+ 언어, CAQDAS 호환 DOCX, 24시간 내 음성 삭제.

무료로 시작