무료로 시작

텍스트 변환
음성 녹음오디오와 영상YouTube 영상오디오 파일영상 파일MP4 영상Zoom 회의Microsoft TeamsGoogle Meet인터뷰팟캐스트강의TikTok 영상WhatsApp 음성음성 메모MP3 파일통화 녹음설교
를 텍스트로 변환합니다. 몇 초 만에

화자 레이블과 AI 요약이 포함된 깔끔한 텍스트 변환 결과를 실시간보다 빠르게 받아보세요.

오디오 또는 비디오를 드롭하세요

MP3 · MP4 · WAV · M4A · MOV · 파일당 최대 10시간

링크만 붙여넣으면 오디오를 가져와요

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50개 이상

브라우저에서 직접 녹음

가입은 30초면 충분합니다. 녹음은 가입 후 대시보드에서 바로 열립니다.

무료 30 min/mo카드 등록 없이100+ 100개 이상 언어화자 레이블 (프로 이상)파일 24시간 내 자동 삭제

무료 티어: 월 30분, 파일당 최대 30분. 카드 필요 없음.

100+
언어 자동 감지
자동 감지 및 수동 재정의 가능.
95%+
깨끗한 오디오 정확도
주요 언어 대부분, 1~2명 화자.
10h
비즈니스 요금제 최대 파일 길이
Pro 10시간 · Free 30분
~30×
실시간보다 빠름
60분 파일이 보통 2~3분 안에 완료됩니다.
이것이 대시보드입니다

클릭해 보세요. 실제 제품입니다

탭이 작동합니다. 액션 아이템을 전환할 수 있습니다. 작업이 완료된 후 계정에 로드되는 것과 정확히 동일한 레이아웃과 컨트롤입니다.

app.transcription.solutions / jobs / interview-ari-2026-04-26

요약

자동 스냅샷 · saved
TL;DR

창업자에게는 통화 후 콘텐츠가 필요하고, 단순한 텍스트 변환 결과가 아닙니다. 도구들이 5개의 앱을 직접 연결하도록 강제합니다.

318words2화자 · 58 / 425주제

핵심 요점 3

  • 01원본 녹음과 출시 가능한 콘텐츠 사이에 격차가 존재함
  • 02통화 종료 시점에 쇼 노트, 소셜 클립, 블로그 초안 등이 필요함
  • 03현재 도구는 5개 이상의 앱으로 분산되어 있음

액션 아이템 2

  • 5앱 연결 대신 단일 파이프라인 접근 방식 조사
  • 이 텍스트 변환 결과에서 쇼 노트 초안이 어떻게 보일지 모의 실험
주제창업자 워크플로우통화 후 콘텐츠도구 분산쇼 노트단일 파이프라인

화자 분리 텍스트 변환 결과

4줄 · 2명 화자 · 30초 클립
00:12화자 A제가 창업자들에게 계속 듣는 것은 원본 녹음과 실제로 출시할 수 있는 콘텐츠 사이의 격차입니다.
00:27화자 B맞아요. 아무도 또 다른 텍스트 변환 결과를 원하지 않아요. 통화가 끝날 때쯤이면 쇼 노트, 클립, 블로그 초안을 원하죠.
00:41화자 A맞습니다. 그리고 현재 도구들은 그걸 얻기 위해 다섯 개의 앱을 직접 연결하도록 강요합니다.
00:54화자 B하나의 파이프라인, 하나의 장소. 그게 저희의 승부수입니다.

화자 분석

스테레오 채널 분할 · 모노 화자 분리
화자 A
58% 발언 시간
2
Turns
14s
발언 시간
…원본 녹음과 실제로 출시할 수 있는 콘텐츠 사이의 격차입니다.
화자 B
42% 발언 시간
2
Turns
10s
발언 시간
하나의 파이프라인, 하나의 장소. 그게 저희의 승부수입니다.

내보내기 형식

모든 요금제, 모든 형식 · 7가지 출력 · 워터마크 없음 · TXT · SRT · MD · JSON · VTT · DOCX · PDF
TXT

일반 텍스트

깔끔한 텍스트 덤프 · 모든 요금제

SRT

SubRip 자막

타임스탬프 자막 · 모든 요금제

MD

Markdown

화자 헤더 + 요약 · 모든 요금제

JSON

구조화된 JSON

공개 스키마 · API 워크플로우용 · 모든 요금제

VTT

WebVTT 자막

HTML5 비디오 플레이어 형식 · 모든 요금제

DOCX

워드 문서

화자 헤더 + 타임스탬프 · 모든 요금제

PDF

브랜드 PDF

인쇄 준비 · 요약 및 화자 · 모든 요금제

데모 · 음소거
0:18 / 1:00
샘플 출력 · 팟캐스트 클립 30초

하나의 파일. 여덟 가지 결과물

각 출력 위에 마우스를 올리거나 탭하면 실제 모양을 볼 수 있습니다. 중앙에는 동일한 30초 팟캐스트 클립, 그로부터 파생된 8개의 아티팩트가 있습니다.

텍스트 변환 결과

구두점 · 타임스탬프

00:12 화자 A
제가 창업자들에게 계속 듣는 것은 이 격차입니다…
AI 요약

요약 · 핵심 요점

창업자에게는 통화 후 콘텐츠가 필요하고, 단순한 텍스트 변환 결과가 아닙니다. 도구들이 5개의 앱을 직접 연결하도록 강제합니다.
화자

화자 분리 · 프로 이상

2인 통화용 스테레오 채널 분할. 그 외에는 모노 화자 분리.
100개 이상 언어

자동 감지

연구 수준의 ASR. 자동 감지가 잘못된 언어를 선택하면 특정 언어를 강제로 지정할 수 있습니다.
interview-ari-2026-04-26.mp3
30초 클립 · 2명 화자
100개 이상 언어 · 자동 감지 · 95% 이상 정확도
텍스트 변환 결과 · 30초 창
00:12
A제가 창업자들에게 계속 듣는 것은 이 격차입니다.
00:14
A통화가 끝나면 실제 작업이 시작됩니다.
00:18
B맞아요 — 통화 후 작업이 하루를 잡아먹죠.
00:21
A도구들은 텍스트 변환 결과가 결과물이라고 가정합니다.
00:24
A그것은 입력입니다.
00:27
B그래서 다섯 개의 앱을 수동으로 연결합니다.
AI 요약
요약: 창업자에게는 통화 후 콘텐츠, 원본 텍스트 변환 결과가 아닙니다. 오늘날의 도구는 5앱 워크플로우를 강요합니다.
핵심 요점
  • 텍스트 변환 결과는 결과물이 아닌 입력입니다
  • 액션 아이템이 원시 텍스트보다 낫습니다
  • 하나의 파이프라인이 연결된 SaaS보다 낫습니다
화자 분리 · 2명의 화자 감지됨
화자 A
화자 B
0:000:150:30
스테레오 채널 분할 · 62% / 38% 발언 비율
언어 감지
영어 (미국)99.2%
다른 후보
en-GB 영어 (영국)0.6%
en-AU 영어 (호주)0.2%
업로드 시 감지 · 언제든지 재정의 · 100개 이상 언어
내보내기 · 7가지 형식 · 워터마크 없음
TXT interview-ari-2026-04-26.txt34 KB
SRT interview-ari-2026-04-26.srt52 KB
VTT interview-ari-2026-04-26.vtt51 KB
MD interview-ari-2026-04-26.md38 KB
JSON interview-ari-2026-04-26.json71 KB
DOCX interview-ari-2026-04-26.docx91 KB
PDF interview-ari-2026-04-26.pdf146 KB
URL 수집 · 1500개 이상 사이트 지원
youtube.com/watch?v=Hk8L4mD2pXv
메타데이터 가져오기0.3초
오디오 다운로드4.2 MB
음성 추출스테레오 · 44 kHz
ASR 대기열
REC00:42 / 60:00
iPhone의 Safari · 데스크톱의 Chrome
60분에서 자동 중단 — 더 긴 파일은 업로드하세요
실시간 작업 상태
업로드0:08
오디오 추출0:02
ASR · AssemblyAI U-247%
화자 분리대기 중
AI 요약대기 중
내보내기 렌더링대기 중
상태가 단계별로 푸시됨 · 새로고침 필요 없음
내보내기

7가지 형식 · 워터마크 없음

TXTSRTMDJSONVTTDOCXPDF
URL 수집

YouTube · TikTok · Instagram

모든 동영상 링크를 붙여넣으세요. 한 번 다운로드하여 텍스트 변환하고 원본은 폐기합니다.
브라우저 녹음

iPhone Safari · Chrome에서 마이크

녹음을 누르고, 말하고, 중지를 누르세요. 앱 설치 불필요. 녹음당 최대 60분.
실시간 진행 상황

WebSocket 작업 상태

업로드 → ASR → 화자 분리 → 완료까지 실시간 상태. 폴링 없음, 맹목적 대기 없음.
사용자층

실제로 작업을 수행하는 사람들을 위해 제작됨

매주 보이는 세 가지 패턴입니다. 파이프라인은 변하지 않습니다 — 그 후에 무엇을 출시하는지가 다릅니다.

01팟캐스터

에피소드 쇼 노트 출시

긴 인터뷰가 5줄 요약, 네 개의 챕터, 화자 레이블이 포함된 텍스트 변환 결과, 숏폼 클립용 SRT가 됩니다 — 하나의 작업으로 실제로 출시하는 모든 출력물을 얻습니다.

7가지 형식TXT · SRT · MD · JSON
VTT · DOCX · PDF
02연구자

장시간 인터뷰, 타임스탬프로 인용

두 목소리의 3시간 Zoom 녹음, 처음부터 끝까지. 프로 요금제의 화자 분리. DOCX 내보내기에서 타임스탬프로 인용하세요. 더 이상 "그 말을 어디서 했더라…" 검색할 필요가 없습니다.

95%+ASR 정확도
깨끗한 오디오 기준
03소규모 팀

녹음 → 액션 아이템 → 담당자

자동 참여 없음, 캘린더 권한 없음, "회의에 에이전트" 없음. 녹음을 드롭하고, 텍스트 변환 결과를 공유하세요. 액션 아이템이 추출되고, 이름이 지정되며, 분류 준비가 완료됩니다.

2,500월 분량
비즈니스 요금제 기준
허용되는 입력

파일 드롭, 링크 붙여넣기,
또는 API 호출

현재 작동 중인 여섯 가지 입력 방식입니다. 각 알약은 실제 프로덕션에서 작동 중인 수집 경로입니다.

YouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooks
가격

실제로 맞는
요금제

모든 요금제에는 화자 분리 품질의 ASR이 포함됩니다. 상위 티어는 더 큰 파일, 대기열 우선순위, AI 요약을 제공합니다.

월간연간 −50%
Free
$0영구 무료
카드 불필요 · 평가판 만료 없음

시험 사용, 가끔 한 번, 짧은 클립용.

  • 월 30분
  • 파일당 최대 30분
  • 7가지 내보내기 형식 모두 · 워터마크 없음
  • 낮은 우선순위 대기열
무료로 시작 →
이메일 인증 필요
가장 인기
Pro
$19$19/월
언제든지 취소 · 분당 $0.04 초과 요금

인터뷰, 팟캐스트, 반복적인 장시간 작업을 하는 분들을 위한 요금제입니다.

  • 월 600분
  • 파일당 최대 60분
  • 화자 레이블 + AI 요약
  • 액션 아이템 + 주제 태그
  • "읽기 쉽게" 단락 다듬기
  • 번역 · 웹훅 전달
  • 표준 대기열 우선순위
프로 선택 →
초과 요금 분당 $0.04 · 언제든지 취소 가능
비즈니스
$49$49/월
언제든지 취소 · 분당 $0.02 초과 요금

볼륨을 다루는 팀, 에이전시, 운영팀을 위한 요금제입니다.

  • 월 2,500분
  • 파일당 최대 4시간
  • 프로의 모든 기능 · 월 50회 번역
  • 높은 우선순위 대기열
  • 공용 REST API · 키별 속도 제한 티어
  • 우선 이메일 지원
비즈니스 선택 →
초과 요금 분당 $0.02 · 언제든지 취소 가능

연간 결제 시 할인 50% · 환불 정책 · 무료 요금제는 카드 불필요

동일한 오디오 · 두 가지 출력

무료는 단어만 제공합니다.
프로는 결과물을 제공합니다.

동일한 오디오, 동일한 모델. 차이점은 텍스트 변환이 완료된 후 우리가 하는 모든 것입니다.

무료 출력

제가 창업자들에게 계속 듣는 것은 원본 녹음과 실제로 출시할 수 있는 콘텐츠 사이의 격차입니다. 맞아요, 아무도 또 다른 텍스트 변환 결과를 원하지 않아요. 통화가 끝날 때쯤이면 쇼 노트, 클립, 블로그 초안을 원하죠. 맞습니다. 그리고 현재 도구들은 그걸 얻기 위해 다섯 개의 앱을 직접 연결하도록 강요합니다. 하나의 파이프라인, 하나의 장소. 그게 저희의 승부수입니다. 우리는 이 패턴을 몇 달 동안 봐왔습니다. 오디오는 깨끗하게 들어오지만, 다운스트림 워크플로우는 스크린샷과 Notion, Otter, Zapier 간의 복사-붙여넣기로 유지되고 있습니다. 통화가 끝나고 마감이 20분 남았을 때 다른 탭에 열려 있는 다른 모든 것들…

일반 텍스트 변환 결과화자 레이블 없음요약 없음7가지 형식 모두

다음: 어딘가에 붙여넣고, 구조화하고, 직접 요약을 작성하고, 액션 아이템을 수동으로 추출하세요.

프로 출력
TL;DR

창업자에게는 단순한 텍스트 변환 결과가 아니라 후처리가 필요합니다. 하나의 파이프라인이 다섯 개의 앱을 연결하는 것보다 낫습니다.

00:12 화자 A제가 창업자들에게 계속 듣는 것은 원본 녹음과 실제로 출시할 수 있는 콘텐츠 사이의 격차입니다.
00:27 화자 B맞아요. 아무도 또 다른 텍스트 변환 결과를 원하지 않아요. 통화가 끝날 때쯤이면 쇼 노트, 클립, 블로그 초안을 원하죠.
00:41 화자 A맞습니다. 그리고 현재 도구들은 그걸 얻기 위해 다섯 개의 앱을 직접 연결하도록 강요합니다.
00:54 화자 B하나의 파이프라인, 하나의 장소. 그게 저희의 승부수입니다.
액션 아이템 · 2개
  1. 통합 파이프라인을 사용해 보세요 — 오디오 입력, 노트 및 내보내기 출력, 하나의 작업.
  2. 다음 통화 전에 Otter + Notion + Zapier 스택을 교체하세요.
요약 · 1줄화자 · 화자 분리됨액션 아이템 · 2개"읽기 쉽게" 다듬기

다음: 요약을 Slack에 복사하고, DOCX를 이메일에 첨부하고, 클립을 출시하세요. 통화 노트가 식기 전에 완료됩니다.

— 동일한 오디오 · 동일한 모델 · 차이는 후처리에 있습니다 —

실제 사용 후기

사용자들이 입을 못 다는 about

요청하지 않은 리뷰입니다. 당사는 리뷰 인센티브 캠페인을 운영하지 않습니다. 마우스를 올리면 일시정지됩니다.

MR
Maya Reyes
@mayarcuts · 팟캐스터

팟캐스터가 에피소드 하나를 출시하기 위해 5개의 탭을 엽니다. 하나의 작업으로 — 쇼 노트, 텍스트 변환 결과, 클립 준비 SRT 출력. 그게 끝입니다.

4월 18일1개 작업
DA
Dr. Diego Alarcón
@diegoalarcon · 연구자

화자 분리를 통해 14개의 장시간 인터뷰. 깨끗한 오디오에서 DER 0.95는 진짜입니다. DOCX 내보내기가 바로 논문 초안으로 들어갑니다.

4월 22일깨끗한 오디오에서 DER 0.95는
SO
Sora Okafor
@sorawrites · 작가

26개의 음성 메모. 3개의 TikTok URL. 뉴스레터 초안 개요를 11분만에 완성했습니다. Otter로 해보세요 — 기다리겠습니다.

4월 19일11 min
MR
Maya Reyes
@mayarcuts · 팟캐스터

팟캐스터가 에피소드 하나를 출시하기 위해 5개의 탭을 엽니다. 하나의 작업으로 — 쇼 노트, 텍스트 변환 결과, 클립 준비 SRT 출력. 그게 끝입니다.

4월 18일1개 작업
DA
Dr. Diego Alarcón
@diegoalarcon · 연구자

화자 분리를 통해 14개의 장시간 인터뷰. 깨끗한 오디오에서 DER 0.95는 진짜입니다. DOCX 내보내기가 바로 논문 초안으로 들어갑니다.

4월 22일깨끗한 오디오에서 DER 0.95는
SO
Sora Okafor
@sorawrites · 작가

26개의 음성 메모. 3개의 TikTok URL. 뉴스레터 초안 개요를 11분만에 완성했습니다. Otter로 해보세요 — 기다리겠습니다.

4월 19일11 min
JV
Jules Verstappen
@julesverops · 운영

웹훅 + 액션 아이템 추출로 주간 요약 문서 작업이 사라졌습니다. 전체 루프가 이제 2분 입니다.

4월 23일2분 루프
RK
Rohan Kapoor
@rohan_legal · 법률 자문

증언 녹음 → 화자 분리 텍스트 변환 결과 → 인용된 PDF. 예전에는 이 작업을 해외에 아웃소싱했습니다. 이제는 한 번의 업로드.

입니다.1회 업로드
EM
Elena Marchetti
@elenamarch · 영업

이탈리아어 영업 통화 → 영어 요약. 제 팀이 이제서야 읽습니다. 작은 세부 사항이지만 큰 영향입니다.

4월 27일IT → EN
JV
Jules Verstappen
@julesverops · 운영

웹훅 + 액션 아이템 추출로 주간 요약 문서 작업이 사라졌습니다. 전체 루프가 이제 2분 입니다.

4월 23일2분 루프
RK
Rohan Kapoor
@rohan_legal · 법률 자문

증언 녹음 → 화자 분리 텍스트 변환 결과 → 인용된 PDF. 예전에는 이 작업을 해외에 아웃소싱했습니다. 이제는 한 번의 업로드.

입니다.1회 업로드
EM
Elena Marchetti
@elenamarch · 영업

이탈리아어 영업 통화 → 영어 요약. 제 팀이 이제서야 읽습니다. 작은 세부 사항이지만 큰 영향입니다.

4월 27일IT → EN
TN
Tomi Nakamura
@tominaka · 번역가

일본어 자동 감지가 잘 작동합니다. 하지만 이 사이트의 세리프 이탤릭체는 관련 없는 디자인 범죄이지만 존중합니다.

4월 21일자동 감지
PL
Priya Lakshmi
@priyalbuilds · 창업자

REST API + 키별 속도 제한 = 당사의 내부 음성 메모 파이프라인. 연결하는 데 30분 걸렸습니다. 팀 전체에 월 $19.

4월 25일$19/월
FA
Fatima Al-Rashid
@fatima_writes · 저널리스트

24시간 자동 삭제는 경쟁사의 모든 개인정보 페이지를 확인할 때까지 내가 원했는지 몰랐던 기능 입니다.

4월 26일24시간 삭제
TN
Tomi Nakamura
@tominaka · 번역가

일본어 자동 감지가 잘 작동합니다. 하지만 이 사이트의 세리프 이탤릭체는 관련 없는 디자인 범죄이지만 존중합니다.

4월 21일자동 감지
PL
Priya Lakshmi
@priyalbuilds · 창업자

REST API + 키별 속도 제한 = 당사의 내부 음성 메모 파이프라인. 연결하는 데 30분 걸렸습니다. 팀 전체에 월 $19.

4월 25일$19/월
FA
Fatima Al-Rashid
@fatima_writes · 저널리스트

24시간 자동 삭제는 경쟁사의 모든 개인정보 페이지를 확인할 때까지 내가 원했는지 몰랐던 기능 입니다.

4월 26일24시간 삭제
자주 묻는 질문

사람들이 실제로 ask

텍스트 변환 정확도는 어느 정도인가요?+

1~2명 화자의 깨끗한 오디오에서 주요 언어 대부분 95% 이상의 정확도에 도달합니다. 배경 소음, 심한 억양, 또는 말이 겹치는 경우 품질이 떨어집니다.

어떤 언어를 지원하나요?+

자동 감지 기능이 있는 100개 이상의 언어. 자동 감지가 잘못된 언어를 선택하면 특정 언어를 강제로 지정할 수도 있습니다. UI는 영어 전용입니다. 다국어 인터페이스는 계획 목록에 있습니다.

파일을 얼마나 오래 보관하나요?+

원본 미디어(업로드한 오디오/비디오)는 텍스트 변환이 완료된 후 24시간 이내에 당사 인프라에서 삭제됩니다. 텍스트 변환 결과와 요약은 귀하가 삭제할 때까지, 또는 계정 삭제 후 30일까지 계정에 남아 있습니다. 당사의 음성-텍스트 제공업체(주요: AssemblyAI, 대체: OpenAI)는 자체 보존 정책에 따라 오디오를 처리합니다. 전체 하위 처리업체 목록은 /privacy 에서 확인하세요.

내 녹음으로 모델을 훈련하나요?+

아니요. 당사의 상위 ASR 제공업체는 유료 엔드포인트에 대해 기본적으로 훈련 거부(opt-out)를 지원하며, 당사는 이를 사용합니다. 당사는 추가로 아무것도 하지 않습니다: 귀하의 텍스트 변환 결과로 훈련된 자체 모델, 섀도 분석 등이 없습니다.

작업이 실패하면 어떻게 되나요?+

사용 시간이 차감되지 않습니다. 대부분의 실패(비공개 URL, 너무 긴 파일, 지원되지 않는 코덱)는 명확한 오류 메시지와 재시도 안내와 함께 제공됩니다.

취소할 수 있나요?+

네 — Stripe 고객 포털에서 언제든지 가능합니다. 유료 기간 동안 요금제를 유지하고, 다음 갱신일이 되면 무료 요금제로 전환됩니다.

환불 정책은 어떻게 되나요?+

요금제 사용 시간의 10% 미만을 사용한 경우 7일 이내 전액 환불. 이후에는 사용하지 않은 부분에 대해 비례 환불. [email protected]로 이메일 보내주세요.

API가 있나요?+

네 — REST API가 이미 운영 중이며 웹훅도 있습니다. API 키 인증은 다음 업데이트 목록에 있습니다. 요금제 티어별 속도 제한. 계정이 있으면 /docs/api에서 문서를 확인하세요.

보안 및 개인정보

지루한 내용이지만, 처리되었습니다

SOC 2 스티커는 없습니다. 아직 제공하지 않는 통제 항목에 대해 배지를 붙이지 않습니다.

100%
자동 삭제
원본 파일을 24시간 이내에, 항상
0
추적기 · 광고 · 재판매 금지
귀하의 오디오는 모델 훈련에 절대 사용되지 않습니다
1×
클릭 한 번으로 삭제
계정 및 모든 데이터 30일 이내 삭제

원본 파일 24시간 내 삭제

업로드한 오디오 및 비디오는 작업 완료 후 24시간 이내에 사라집니다. 설정이 아닌 확실한 약속입니다.

데이터로 모델 훈련 금지

상위 ASR 제공업체는 기본적으로 훈련 거부(opt-out)를 지원하며, 당사는 해당 엔드포인트를 사용합니다. 추가로 아무것도 하지 않습니다.

AES-256 + TLS 1.3

저장 및 전송 중 암호화, 첫날부터 적용. HSTS 적용됨.

GDPR 준수

EU 접근/삭제/이전 권리 존중. 요청 시 DPA 제공.

원클릭 삭제

설정 → 계정 삭제. 모든 데이터 30일 이내 삭제. 지원 티켓 필요 없음.

하위 처리업체 목록

목적별 전체 공급업체 목록은 /privacy에서 확인하세요. 예상치 못한 공급업체는 없습니다.

— 준비가 되셨으면

파일을 드롭하세요.
커피가 식기 전에 텍스트 변환 결과를
받아보세요

월 30분 무료, 파일당 최대 30분. 신용카드 불필요, 체험 후 카드 등록 불필요, 별표 조건 없음. 요금제는 언제든지 한 번의 클릭으로 취소 가능.

무료 / 월30 min
언어100+
내보내기 형식7
MP3MP4WAVM4AMOVMKVWEBMYOUTUBETIKTOKINSTAGRAM브라우저 녹음