최대 10시간 오디오 파일 변환 — 음성을 텍스트로, 시간 제한 없음

긴 오디오 파일을 변환하세요.최대 10시간. 시간 제한 없음.

긴 오디오 파일 — 최대 10시간, Business에서 5GB — 을 업로드하세요. 청크를 병렬로 분할하고, 발언자 ID를 처음부터 끝까지 일관되게 유지하며, 번호가 매겨진 폴더 대신 하나의 변환본을 제공합니다.

오디오 또는 비디오를 드롭하세요

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

브라우저에서 직접 녹음

가입은 30초면 충분합니다. 녹음은 가입 후 대시보드에서 바로 열립니다.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXT파일 24시간 내 자동 삭제

진행 중. 깔끔한 파일 하나로 완성.

대부분의 도구는 90분 정도에서 시간 초과되거나 긴 기록을 번호가 매겨진 부분으로 분할하여 직접 조합해야 합니다. 12분의 겹치는 윈도우로 청크를 분할하고, 병렬로 처리한 뒤 전역 발언자 패스로 재조립합니다.

보드 전략 회의REC 3명 발언자 · 5:14:22 · 3.1 GB

자동 감지 en-GB44.1 kHz 스테레오 · 192 kbps

~90s

변환본 · 단일 파일92% 정확도 · t=3:14:08

3시간이 지났는데, 오전 세션의 공급망 포인트로 돌아가 봅시다.

맞아, 베트남 제조 전환. 리드타임 리스크를 너무 가볍게 넘어간 것 같아.

관세 변경 후 리드타임이 14일에서 31일로 늘었습니다.

그리고 롱비치 항구 정체는 아직 고려하지 않은 것입니다.

전체 5시간 파일에서 92%DOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

요약 5텍스트 변환 결과 1,420화자 2내보내기

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

핵심 요점

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

액션 아이템

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

긴 파일을 기록당 4시간으로 제한합니다. 발언자 표시가 2시간 후 흔들립니다.

최대 파일 길이4시간 (Pro 요금제)

최대 파일 크기~1.5 GB 업로드

처음부터 끝까지 발언자 ID2시간 후 흔들림

긴 파일 출력단일 문서, 한계에서 자름

비용$16.99/사용자/월

재개 가능 업로드아니오

Best for2시간 미만의 짧은 회의. 종일 기록에서 작동하지 않습니다.

Option 02

Transcription.Solutions

파일당 10시간. 병렬 청크 분할, 전역 발언자 패스, DOCX 하나로 출력.

최대 파일 길이10시간 (Pro & Business)

최대 파일 크기Pro 2GB · Business 5GB

처음부터 끝까지 발언자 ID전역 임베딩 패스

긴 파일 출력단일 파일 · DOCX/SRT/TXT

비용 · 분당길이 상관없이 $0.03 정액

재개 가능 업로드멀티파트, 연결 끊김 허용

Best for종일 워크숍, 증거 기록, 보드 회의, 구술 역사 — 90분 벽을 넘는 모든 것.

Option 03

Whisper API + DIY 청크 분할

분당 가장 저렴합니다. 청크 분할기, 발언자 조합, 재시도 로직을 직접 구축합니다.

최대 파일 길이요청당 25MB (~25분)

최대 파일 크기25MB 하드 제한

처음부터 끝까지 발언자 ID없음 — 음성 인식 불가

긴 파일 출력번호가 매겨진 부분, 직접 조합

비용 · 분당$0.006 (OpenAI Whisper)

엔지니어링 시간파이프라인당 몇 시간에서 며칠

Best for청크당 원본 텍스트를 원하고 발언자, 요약본 또는 단일 출력이 필요 없는 엔지니어.

가격 및 한계는 2026년 5월 기준 정확합니다. Otter Pro 길이 제한은 공개 가격 책정 페이지에서 마지막으로 확인되었습니다.

5시간 파일에서 92% 유지. 시간별로 품질이 일정합니다.

긴 오디오의 어려운 부분은 모델이 아니라 1분부터 600분까지 정확도를 일정하게 유지하는 것입니다. 발언자 흔들림과 청크 경계 오류가 대부분의 파이프라인을 망칩니다. 아래 숫자는 처음 10분이 아닌 전체 길이 고객 파일에서 측정되었습니다.

사람들이 묻는 8가지. 긴 오디오 변환에 관해

01실제 파일 길이 및 크기 한계는?+

Pro 및 Business 모두에서 파일당 10시간. Pro는 파일 크기를 2GB로, Business를 5GB로 제한합니다. 10시간보다 긴 것이 있으면 자연스러운 끝에서 한 번 분할하세요 — 같은 프로젝트에 한 번에 업로드하면 발언자 ID를 일관되게 유지합니다.

02하나의 변환본 또는 번호가 매겨진 부분의 폴더를 받나요?+

하나의 파일. 항상. DOCX, SRT, TXT 또는 JSON — 선택할 수 있습니다. 타임스탬프는 모든 청크 경계에서 재설정되지 않고 00:00:00부터 기록 끝까지 연속됩니다.

036시간 파일은 얼마나 걸려서 돌아오나요?+

Pro 큐에서 약 18-25분, Business 우선순위에서 8-12분. 12분 청크를 병렬로 처리하므로 소요 시간은 파일 길이에 따라 선형적이 아니라 부분적으로 확장됩니다.

04발언자 ID가 처음부터 끝까지 일관되게 유지되나요?+

그렇습니다. 청크별 음성 인식 후 전역 임베딩 패스가 전체 파일에서 음성을 클러스터링합니다. 12분의 발언자 3이 487분의 발언자 3과 같은 사람입니다. 이것이 DIY Whisper 파이프라인이 잘못 얻는 주요 것입니다.

054GB 파일의 3시간 업로드 후 연결이 끊기면?+

재개 가능 멀티파트 업로드는 마지막 완료된 부분에서 다시 선택됩니다. 처음 3GB를 재업로드하지 않습니다. 불안정한 호텔 Wi-Fi와 셀룰러 테더링에서 작동합니다 — 둘 다 테스트했습니다.

06Whisper API가 긴 파일에서 작동을 멈추는 이유?+

OpenAI의 Whisper 엔드포인트는 요청당 25MB 하드 제한을 가지고 있습니다 — 약 25분의 압축 오디오. 더 길면 청크, 병렬로 변환, 변환본 및 발언자 정렬을 직접 조합해야 합니다. 우리는 모든 것을 서버 측에서 수행합니다.

07분당 가격이 10시간 파일과 10분 파일에서 같나요?+

그렇습니다. 분당 $0.03 정액, 길이 상관없음. 10시간 파일은 $18입니다. Rev처럼 긴 파일에 추가 요금을 부과하지 않습니다 ($1.50/분 인간 × 10시간 = $900).

08챕터 마커 또�� 시간마다 타임스탬프를 받을 수 있나요?+

작업 양식에서 '시간 마커'를 활성화하면 DOCX는 60분마다 제목 나누기와 함께 내보내집니다. SRT는 연속 타임코드를 유지합니다. JSON은 둘 다 가지고 있습니다 — 챕터 배열과 단어 수준 타임스탬프.

긴 오디오 파일을 변환하세요.최대 10시간. 시간 제한 없음.

오디오 또는 비디오를 드롭하세요

Paste a link, we’ll fetch the audio

브라우저에서 직접 녹음

진행 중. 깔끔한 파일 하나로 완성.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro. DIY Whisper 청크 분할. 또는 우리.

Otter Pro

Transcription.Solutions

Whisper API + DIY 청크 분할

일반 도구가 세 가지 이유. 90분을 넘으면 작동하지 않는

뭐가 잘못되나

여기서 뭘 바꿀까

긴 파일을 위한 권장 작업 설정

5시간 파일에서 92% 유지. 시간별로 품질이 일정합니다.

사람들이 묻는 8가지. 긴 오디오 변환에 관해

긴 파일을 업로드하세요. 하나의 변환본을 받으세요.