Pagtranskribe sa interview.Lainlain na recording, pareho ang resulta.

Phone memo, Zoom call, lavalier rig, o handheld field recorder — i-drop ang interview recording at makakuha ng speaker-labeled, timestamped text na pwede mong i-quote.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Tignan kung ano ang lalabas

Dalawang boses papunta. Dalawang boses palabas, may label.

Karamihan ng interviews ay dalawang tao sa isang device — phone sa mesa, recorder sa pagitan ninyo. Hiwalay namin ang interview audio sa reporter at source kahit mula sa isang mono channel, tapos timestamp ang bawat turn para sa citation.

Field recorder · WAVREC 2 speakers · 38:42
auto-detected en-US48 kHz mono · 1411 kbps
~90s
Transcript · streaming94% accuracy
S1

Pwede mo bang sayaw sa akin kung ano ang nakita mo sa umaga ng ika-18?

S2

Dumating ako mga alas-sais. Ang loading bay door ay bukas na, na shouldn't be.

S1

At nag-report ka na ng door issue — sa sino?

S2

Sa Diane Okafor sa facilities, dalawang beses noong Marso. May emails ako.

94% sa field WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tatlong tunay na option · tapat na comparison

Rev human. Otter o Trint. O kami.

Ang Rev ay nagpapadala ng audio mo sa human transcribers — mabagal at mahal pero high fidelity sa tough audio. Otter at Trint ay AI-first tulad namin, tuned para sa journalists at researchers. Nandito kung saan akma ang bawat isa.

Option 01

Rev human transcription

Tunay na tao ang mag-type ng interview mo. Best sa hostile audio, pero maghihintay ka at magbabayad.

Turnaround12–24 hours typical
Accuracy sa clean audio99% (claimed)
Speaker labelsManual, included
WikaEN human · 30+ AI
Presyo · per min$1.50 human · $0.25 AI
PrivacyAudio sent sa contractors
Best forCourt-bound o publication-critical interviews sa bad audio kung saan kailangan mo ng human ear at may araw na mag-hintay.
Option 02

Transcription.Solutions

AI transcript, speaker-split, ready sa ilang minuto. Parehong engine para sa phone memo, Zoom, o field recorder.

Turnaround~3 min per hour ng audio
Accuracy sa clean audio94–96%
Speaker labelsAuto · rename sa editor
Wika99, auto-detected
Presyo · per min$0.03
PrivacyAudio deleted sa 24h · no training
Best forJournalists, researchers, at producers na gumagawa ng multiple interviews per week na kailangan ng mabilis, citable text nang walang contractor.
Option 03

Otter / Trint

AI transcription na may research-oriented editor. English-strong, locked sa monthly plans.

TurnaroundReal-time hanggang ~5 min
Accuracy sa clean audio~90–93%
Speaker labelsOo · EN-tuned
WikaOtter EN-only · Trint 30+
Presyo$17–80/user/mo (subscription)
PrivacyStored sa account by default
Best forTeams na gusto ng hosted library ng bawat interview na na-record at okay lang ang monthly seat fee per user.

Pricing at feature flags accurate starting 2026. Human Rev turnaround varies by queue depth at audio length.

Specific sa interviews

Tatlong bagay na kumakagat sa mga tao sa generic transcription tools.

Interview audio ay bihira na malinis. I-flip ang settings na ito at ang transcript ay tatag sa pag-quote.

Ano napapahiya

  1. 1Cross-talk sa isang channel. Kapag empatiko ang source mo at nagsasalita nang sabay sa tanong mo, generic diarization ay pinagsasama sa isang speaker block.
  2. 2Pangalan at lugar ng source (Okafor, Tigray, Maranello) ay bumabalik phonetically. Walang gamit para fact-check laban sa transcript.
  3. 3Off-the-record moments ay nagtatapos sa parehong transcript ng quotable material — walang paraan para markahan as redacted.

Ano i-flip dito

  1. 1Kung two-channel WAV ang field recorder mo (isang mic per track), i-upload lang directly. Kami ay nag-detect per-channel at skip diarization entirely.
  2. 2I-paste ang prep notes mo — pangalan ng source, organizations, place names — sa Custom vocabulary sa job form. Recognizer ay tinatrato sila bilang known proper nouns.
  3. 3Pagdating ng transcript, markahan as off-record sa editor. Ito ay nag-export bilang `[REDACTED 14:22–15:08]` sa DOCX at TXT, source audio deleted sa 24 hours regardless.

Recommended job settings para sa interviews

I-drop ang interview file at ang mga ito ay on by default. Override per-job mula sa form.

Diarization
Per-channel kung stereo · acoustic kung hindi
Speaker model
Interview · 2–4 speakers
Wika
Auto-detect · code-switch on
Filler words
Kept (verbatim mode)
Summary
Key quotes + topic index
Export
DOCX na may timestamps · plain TXT · JSON

Accuracy · real-world numbers

96% sa magandang lav. Mababasa pa rin sa cafe recording.

Ang interview accuracy ay bounded ng ano dingig ng mic. Ang close-mic stereo sa bawat speaker ay ceiling; ang phone on a noisy table ay floor. Ang numbers sa ibaba ay galing sa production interview files, hindi synthetic benchmarks.

96%
Dual lavalier · studio quiet

Isang mic per speaker, separate channels (Zoom H5/H6, Tascam DR-40). Diarization ay trivial — error ay text-only.

94%
Handheld recorder sa mesa

Single condenser sa pagitan ng dalawang speakers, quiet room. Acoustic diarization ay naghihiwalay ng voices reliably under 4 ft.

90%
Phone voice memo · malapit

iPhone o Pixel voice memo sa mesa. Pangalan at numbers minsan makaligtaan; cadence ay okay para mag-quote.

84%
Field recording · cafe o kalye

Espresso machines, traffic, third voices nearby. Worst case sa data namin — usable para sa navigation, verify quotes laban sa audio.

Mga common questions

8 bagay na itinatanong tungkol sa interview transcription.

01Pwede bang gamitin ang transcripts na ito sa published article nang hindi nag-verify laban sa audio?+
Para sa direct quotes — hindi, laging verify laban sa audio. AI transcripts sa 94% accuracy ay hindi pa rin nagbabasa ng isang word sa 17 average, at ang wrong word sa quote ay correction. Ang transcript ay para sa navigation at drafting; ang audio ay source of truth.
02Ang recorder ko ay nagsave ng stereo WAV na may isang mic per speaker. Ano gagawin?+
I-upload directly — huwag i-convert to mono. Kami ay nag-detect ng dalawang channels at nag-route sa separate diarization tracks, highest-accuracy path namin. Expect 96%+ sa quiet room.
03Paano sa interviews recorded over phone call?+
Phone audio ay 8 kHz narrow-band, caps accuracy sa around 88% kahit clean line. Kami pa rin ay nag-split ng dalawang parties gamit ang channel separation kung nag-capture ang recorder app separately (karamihan ay gumagawa). VoIP calls over WhatsApp o Signal ay mas okay kaysa PSTN.
04Pwede bang mag-redact ng off-the-record sections bago i-share ang transcript?+
Oo. Sa editor, piliin ang timestamp range at markahan `[REDACTED]`. Ang export ay nag-replace ng text na may redaction marker pero pinapanatili ang timestamps kaya ang document ay sumusubaybay pa rin sa audio.
05Nag-train ba kayo ng models sa interview recordings ko?+
Hindi. Source audio ay deleted mula sa infrastructure namin sa loob ng 24 hours pagkatapos completion, at hindi kami gumagamit ng customer recordings para model training under any plan. Ang transcript text ay nananatili sa account mo hanggang burahin mo.
06Tatlo o apat na speakers sa panel interview — gumagana pa ba ang diarization?+
Hanggang mga anim na distinct voices, oo, pero accuracy sa speaker assignment ay bumababa sa bawat added voice at nasasama kapag parehong tunog. Plan ng 2–3 minuto rename pass sa speaker chips pagkatapos dumating ang transcript.
07Pwede ba ninyong i-transcribe ang interviews sa ibang wika maliban English?+
99 languages, auto-detected. Code-switching (English source na sumusulpot sa Spanish mid-sentence) ay handled sa 12 language pairs. Accuracy ay nag-vary by language — European languages ay match English; low-resource African at Central Asian languages ay 5–10 points lower.
08Nag-record ako sa Zoom call — dapat ba gamitin ang Zoom page mo?+
Same engine, same result. Ang Zoom page ay sumasaklaw sa cloud-recording specifics (per-participant audio, dial-in degradation). Kung gumagawa ka ng one interview at a time over Zoom, either path ay okay — i-drop ang MP4 dito at ang speaker labels ay naglabas pareho.

I-drop ang interview recording mo. Tingnan kung ano ang lumalabas.

30 free minutes bawat buwan. No card. Speaker labels, 99 languages, lahat ng exports included.

Magsimula nang libre