Interview transcription.Ibang recording, parehong resulta.

Phone memo, Zoom call, lavalier rig, o handheld field recorder — i-drop ang interview recording at makakuha ng speaker-labeled, timestamped text na pwede mong i-quote.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Tignan kung ano ang lalabas

Dalawang tingig, papasok. Dalawang tingig, lalabas, may label.

Karamihan ng interviews ay dalawang tao sa iisang device — isang phone sa mesa, isang recorder sa pagitan ninyo. Siniseparate namin ang interview audio sa reporter at source kahit mula sa iisang mono channel, tapos may timestamp bawat turn para sa citation.

Field recorder · WAVREC 2 speakers · 38:42
auto-detected en-US48 kHz mono · 1411 kbps
~90s
Transcript · streaming94% accuracy
S1

Can you walk me through what you saw the morning of the eighteenth?

S2

I got there around six. The loading bay door was already open, which it shouldn't have been.

S1

And you'd reported the door issue before — to whom?

S2

To Diane Okafor in facilities, twice in March. I have the emails.

94% on field WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tatlong tunay na option · honest na paghahambing

Rev human. Otter o Trint. O kami.

Ipinapadala ng Rev ang inyong audio sa human transcribers — mabagal at mahal pero high fidelity sa mahirap na audio. Ang Otter at Trint ay AI-first tulad namin, tuned para sa journalists at researchers. Nandito kung saan bagay ang bawat isa.

Option 01

Rev human transcription

Tunay na mga tao na nag-type ng inyong interview. Best sa mahirap na audio, pero naghihintay kayo at mahal.

Turnaround12–24 hours typical
Accuracy sa clean audio99% (claimed)
Speaker labelsManual, included
LanguagesEN human · 30+ AI
Cost · per min$1.50 human · $0.25 AI
PrivacyAudio sent to contractors
Best forCourt-bound o publication-critical interviews sa mahirap na audio kung saan kailangan ninyo ang human ear at may araw kayong maghintay.
Option 02

Transcription.Solutions

AI transcript, speaker-split, handa sa ilang minuto. Iisang engine para sa phone memo, Zoom, o field recorder.

Turnaround~3 min per hour of audio
Accuracy sa clean audio94–96%
Speaker labelsAuto · rename in editor
Languages99, auto-detected
Cost · per min$0.03
PrivacyAudio deleted in 24h · no training
Best forJournalists, researchers, at producers na gumagawa ng maraming interviews bawat linggo na kailangan ng mabilis, citable text nang walang pag-upload sa contractor.
Option 03

Otter / Trint

AI transcription na may research-oriented editor. English-strong, locked sa monthly plans.

TurnaroundReal-time to ~5 min
Accuracy sa clean audio~90–93%
Speaker labelsYes · EN-tuned
LanguagesOtter EN-only · Trint 30+
Cost$17–80/user/mo (subscription)
PrivacyStored in account by default
Best forMga teams na gusto ng hosted library ng bawat interview na nai-record at hindi nakikipag-alala sa monthly seat fee per user.

Pricing at feature flags accurate as of 2026. Human Rev turnaround varies by queue depth at audio length.

Specific sa interviews

Tatlong bagay na kagat ng mga tao sa generic transcription tools.

Ang interview audio ay bihirang clean. I-flip ang settings na ito at ang transcript ay tatag under quoting.

Ano ang napupunta nang maling likod

  1. 1Cross-talk sa iisang channel. Pagka-emphatic ng source at nagsasalita sila over ng question ninyo, ang generic diarization ay pinagsasama pareho sa iisang speaker block.
  2. 2Ang names at places ng source (Okafor, Tigray, Maranello) ay babalik na phonetic. Walang halaga para sa fact-checking laban sa transcript.
  3. 3Ang off-the-record moments ay nagtatapos sa iisang transcript tulad ng quotable material — walang paraan para i-mark ang region bilang redacted.

Ano ang i-flip dito

  1. 1Kung ang field recorder ninyo ay nag-write ng two-channel WAV (isang mic per track), i-upload ang file na iyon direkta. Nag-detect kami per-channel at nag-skip sa diarization buong.
  2. 2Paste ang prep notes ninyo — source names, organizations, place names — sa Custom vocabulary sa job form. Ang recognizer ay tinatrato sila bilang known proper nouns.
  3. 3Pagkatapos na dumating ang transcript, i-mark ang region bilang off-record sa editor. Ito ay nag-export bilang `[REDACTED 14:22–15:08]` sa DOCX at TXT, kasama ang source audio na nabura sa loob ng 24 hours regardless.

Recommended na job settings para sa interviews

I-drop ang interview file at ang mga ito ay nag-flip on by default. I-override per-job mula sa form.

Diarization
Per-channel kung stereo · acoustic else
Speaker model
Interview · 2–4 speakers
Language
Auto-detect · code-switch on
Filler words
Kept (verbatim mode)
Summary
Key quotes + topic index
Export
DOCX with timestamps · plain TXT · JSON

Accuracy · real-world numbers

96% sa magandang lav. Still readable pa sa cafe recording.

Ang interview accuracy ay bounded ng kung ano talaga ang narinig ng mic. Ang close-mic stereo sa bawat speaker ay ang ceiling; ang phone na nakatayo sa noisy table ay ang floor. Ang mga numero sa ibaba ay galing sa production interview files, hindi sa synthetic benchmarks.

96%
Dual lavalier · studio quiet

Isang mic per speaker, separate channels (Zoom H5/H6, Tascam DR-40). Ang diarization ay trivial — error ay text lang.

94%
Handheld recorder sa table

Single condenser sa pagitan ng dalawang speakers, quiet room. Ang acoustic diarization ay nagseseparate ng voices reliably under 4 ft.

90%
Phone voice memo · close

iPhone o Pixel voice memo sa mesa. Ang names at numbers ay kadaliang nawawala; ang cadence ay okay para sa pag-quote.

84%
Field recording · cafe o street

Espresso machines, traffic, third voices nearby. Worst case sa aming data — usable para sa navigation, i-verify ang quotes laban sa audio.

Mga karaniwan na tanong

8 bagay na itatanong ng mga tao tungkol sa interview transcription.

01Maaari ko bang gamitin ang mga transcript na ito sa published article nang hindi nag-verify laban sa audio?+
Para sa direct quotes — hindi, laging i-verify laban sa audio. Ang AI transcripts sa 94% accuracy ay nagmimis pa rin ng isang salita sa 17 on average, at ang maling salita sa quoted section ay isang correction. Ang transcript ay para sa navigation at drafting; ang audio ay ang source ng truth.
02Ang recorder ko ay nag-save ng stereo WAV na may isang mic per speaker. Ano ang gagawin ko?+
I-upload ang file na iyon direkta — huwag i-convert sa mono muna. Nag-detect kami ng dalawang channels at nag-route sa bawat isa sa sariling diarization track, na ito ang highest-accuracy path na mayroon kami. Magasahan ng 96%+ sa quiet room.
03Paano sa interviews na naka-record over phone call?+
Ang phone audio ay 8 kHz narrow-band, na nag-cap ng accuracy around 88% kahit sa clean line. Nag-split pa rin kami ng dalawang parties gamit ang channel separation kung ang recorder app ninyo ay nag-capture sa kanila separately (karamihan ay gumagawa). Ang VoIP calls over WhatsApp o Signal ay tumutunog ng kaunting mas maganda kaysa PSTN.
04Maaari ko bang i-redact ang off-the-record sections bago i-share ang transcript?+
Oo. Sa editor, piliin ang timestamp range at i-mark ito `[REDACTED]`. Ang export ay nagpalit sa text ng isang redaction marker pero pinapanatili ang timestamps upang ang document ay sumubaybay pa rin sa audio.
05Nag-train kayo ng models sa aking interview recordings?+
Hindi. Ang source audio ay nabubura mula sa aming infrastructure sa loob ng 24 hours mula sa completion, at hindi kami gumagamit ng customer recordings para sa model training under any plan. Ang transcript text ay nanatili sa inyong account hanggang sa i-delete ninyo ito.
06Tatlo o apat na tao sa panel interview — gumagana pa rin ang diarization?+
Hanggang sa labinlimang distinct voices, oo, pero ang accuracy sa speaker assignment ay bumababa sa bawat dinagdagdag na tao at nagiging mas malala kung ang dalawang speakers ay parang pareho ang tunog. Mag-plano ng 2–3 minute rename pass sa speaker chips pagkatapos ang transcript ay dating.
07Maaari ninyong i-transcribe ang interviews sa wika maliban sa English?+
99 languages, auto-detected. Ang code-switching (English source na sumusunod sa Spanish mid-sentence) ay hawak sa 12 language pairs. Ang accuracy ay nag-vary ng language — ang European languages ay tumutugma sa English; ang low-resource African at Central Asian languages ay tumatakbo 5–10 points na mas mababa.
08Nag-record ako sa Zoom call — dapat ba akong gumamit ng inyong Zoom page dito?+
Iisang engine, parehong resulta. Ang Zoom page ay sumasaklaw sa cloud-recording specifics (per-participant audio, dial-in degradation). Kung gumagawa kayo ng isang interview at isang oras over Zoom, alinman ang daan ay gumagana — i-drop ang MP4 dito at ang speaker labels ay lalabas pareho.

I-drop ang inyong interview recording. Tignan kung ano ang lalabas.

30 libreng minuto bawat buwan. Walang card. Speaker labels, 99 languages, lahat ng exports included.

Magsimula nang libre