Pagtranskripsiyon para sa academic researchers.IRB-aware, CAQDAS-ready, 100+ languages.

I-drop ang isang research interview o focus group recording. Makakuha ng speaker-labelled, timestamped text na handa para sa NVivo, Atlas.ti, o MaxQDA — na may audio deleted sa loob ng 24 oras.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Tingnan kung ano ang lalabas

Field recording sa input. Coding-ready na transcript sa output.

Tatanda namin ang bawat participant turn na may timestamp sa simula, panatilihin ang filler words kung hihilingin mo ang verbatim, at mag-export ng DOCX na may speaker styles na kinikilala na ng iyong CAQDAS tool.

Semi-structured interview · .wavREC 2 speakers · 1:08:24
auto-detected en-GB44.1 kHz mono · lavalier mic
~90s
Transcript · streaming94% accuracy · verbatim mode
S1

Can you walk me through the first time you noticed the change in the neighbourhood?

S2

Um, it was probably 2019 — the bakery on the corner shut, and, yeah, that's when it hit me.

S1

And what did that feel like, watching that happen over those months?

S2

Honestly? Like the place I'd known for thirty years was vanishing, piece by piece.

94% on lavalier interviewDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tatlong tunay na option · matapat na paghahambing

Rev human. NVivo Transcription. O kami.

Ang human service ng Rev ay ang historikal na default para sa dissertation-grade quotes. Nag-bundle ang NVivo ng AI transcription sa loob ng CAQDAS tool mismo. Kami ay nasa gitna — mas mabilis kaysa Rev, mas accurate at IRB-friendlier kaysa sa built-in ng NVivo.

Option 01

Rev (human transcription)

Nag-type mga tao. Mabagal, mahal, pero ang gold standard para sa publishable verbatim.

Turnaround12–24 hours (typical)
Cost · per min$1.50 human / $0.25 AI
Speaker labelsOo, manually placed
Audio retentionStored on Rev servers
LanguagesEN human · ~30 AI
CAQDAS exportDOCX, TXT (manual)
Best forMga single high-stakes interviews na para sa direktang sitasyon sa published paper, kung saan ang budget ay hindi ang constraint.
Option 02

Transcription.Solutions

AI transcript sa ilang minuto, audio deleted sa 24h, DOCX styled para sa NVivo at Atlas.ti import.

Turnaround~5 min para sa 60-min file
Cost · per min$0.03
Speaker labelsDiarized, rename sa app
Audio retentionDeleted sa loob ng 24h
Languages100+, auto-detected
CAQDAS exportDOCX heading styles + TXT
Best forMga researchers na tumatakbo ng 20+ interviews na kailangan ng mabilis na first-pass transcripts, pagkatapos ay manual na i-correct ang 5% ng quotes na para sa publication.
Option 03

NVivo Transcription / Otter

AI transcription bundle sa loob ng iyong CAQDAS tool o note-taker. Convenient, EN-leaning, mas kaunting kontrol.

TurnaroundComparable (AI)
CostCredit packs · ~$0.30/min
Speaker labelsAcoustic, EN-tuned
Audio retentionTied sa subscription
LanguagesNon-EN accuracy drops
CAQDAS exportNative sa NVivo lang
Best forMga solo PhD students na gumagana nang eksklusibo sa English sa loob ng isang CAQDAS ecosystem na gustong isang bill.

Pricing at feature flags accurate hanggang 2026. Ang Rev's AI/human split at NVivo Transcription credit pricing ay nag-vary ayon sa region at academic licensing.

Specific sa qualitative research

Tatlong bagay na problema sa mga researchers sa generic transcription tools.

I-flip ang tamang settings bago ka mag-upload at ang transcript ay direktang mag-import sa iyong CAQDAS project.

Ano ang napapahiya

  1. 1Filler words stripped nang tahimik. Ang generic AI ay nag-aalis ng "um", "like", false starts — okay para sa meeting notes, fatal para sa conversation analysis o discourse work.
  2. 2Domain terminology (theoretical frameworks, drug names, place names, kinship terms) ay nakakakuha ng phonetically transcribed. Ang coding ay kailangan ng find-and-replace pass.
  3. 3Audio ay umibot sa mga servers ng vendor nang walang hanggan. Ang karamihan ng IRB data management plans ay nangangailangan ng deletion o controlled retention — mga vendor ay bihirang mag-document nito nang malinaw.

Ano ang i-flip dito

  1. 1I-switch sa Verbatim mode sa job form. Pinapanatili namin ang fillers, false starts, repetitions, at laugh markers — ang clean mode ay opt-in, hindi default para sa researchers.
  2. 2I-paste ang iyong codebook terms at proper nouns sa Custom vocabulary. Ipinasa namin ito bilang recognizer hint, hindi hard substitution, kaya ang context ay nanalo pa rin.
  3. 3Ang audio ay deleted sa loob ng 24 oras ng job completion. Ang transcript ay nananatili sa iyong account. Maaari kaming mag-issue ng deletion confirmation para sa iyong IRB file on request.

Inirekomendang job settings para sa research interviews

I-drop ang field recording at ang mga ito ay nag-flip on nang default. Override per-job mula sa form.

Mode
Verbatim (fillers + false starts on)
Speaker model
Interview · 2–8 speakers
Language
Auto-detect · accent-tolerant
Timestamps
Every speaker turn
Audio retention
Delete sa loob ng 24h
Export
DOCX (CAQDAS styles) · TXT · SRT

Accuracy · real-world numbers

94% sa isang malinaw na lavalier interview. Matapat tungkol sa kung ano ang dadalhan ng fieldwork.

Ang field audio ay ang hard case sa transcription — open rooms, accented English, overlapping speech sa focus groups. Ang lavalier-mic dyadic interviews ay tumutukdo sa ceiling; ang ambient field recordings at malalaking focus groups ay bumababa nang mabilis. Ang mga numero sa ibaba ay nanggagaling sa tunay na researcher uploads, hindi synthetic benchmarks.

95%
1-on-1, lavalier o USB mic

Tahimik na kwarto, isang single L2 o native speaker, recorder sa mesa. Best case para sa semi-structured interviews — maraming dyadic studies ay nakarating dito.

91%
Handheld recorder, 2–3 speakers

Zoom H4n o phone recorder mid-table. Speaker chairs identified ng direction. Mag-plan ng 5-min relabel pass.

85%
Field interview, ambient noise

Café, market, walking interview. Background chatter at traffic ay nakakaapekto sa maikling responses; ang main turns ay nananatiling codable.

80%
Focus group, 5–8 participants

Overlapping speech at shared mic. Ang diarization ay mag-merge ng ilang quieter voices — mag-iwan para disambiguate sa coding time.

Mga pangkaraniwang katanungan

8 bagay na itinatanong ng researchers tungkol sa academic transcription.

01Ay ito ay acceptable sa loob ng isang typical na IRB data management plan?+
Karamihan ng mga plan na nakita namin ay nag-apruba sa amin kapag nabasa nila ang dalawang katotohanan: ang audio ay deleted sa loob ng 24 oras ng job completion, at ang mga transcript ay nanatili lamang sa account ng researcher. Hindi kami isang IRB — ang iyong board ay gumagawa ng final call — pero ibibigay namin ang isang written processing description para sa iyong protocol on request.
02Pinapanatili ninyo ba ang aking interview audio?+
Hindi. Ang audio file ay deleted sa loob ng 24 oras ng job finishing. Ang transcript lamang ang nananatili sa iyong account, at maaari mong ito burahin anumang oras. Hindi kami gumagamit ng research audio para mag-train ng models.
03Kaya ba ninyong gawin ang true verbatim — na may fillers, false starts, at overlaps — para sa conversation analysis?+
Oo. I-toggle ang Verbatim mode sa job form at papanatilihin namin ang "um", "uh", repetitions, false starts, at laugh tokens. Ang overlap ay nakatanda ng brace symbol sa turn boundary. Hindi kami gumagawa ng Jefferson notation nang automatic — yan ay isang human pass pa rin.
04Ang DOCX ba ay mag-import nang maayos sa NVivo, Atlas.ti, o MaxQDA?+
Oo. Ang aming DOCX ay gumagamit ng heading at speaker styles na inaasahan ng bawat tool para sa auto-coding ng speaker. Sa NVivo, gamitin ang File → Import → Transcripts. Sa Atlas.ti at MaxQDA, ang speaker-paragraph structure ay pinanatili kaya ang autocoding ng speaker ay gumagana agad.
05Paano nito hinahawakan ang accented English o multilingual interviews?+
Sinusuportahan namin ang 100+ languages na may auto-detection, kasama ang code-switching sa loob ng isang recording. Ang heavy L2 accents ay umabot sa 85–90% sa clean audio. Para sa minority languages na may sparse training data (e.g., ilang African at Indigenous languages), ang accuracy ay mas mababa at sinasabi namin ito sa language picker.
06Focus groups na may 6–8 na tao — gumagana ba talaga ang diarization?+
Bahagi pa lamang. Ang acoustic diarization ay maaasahang nagsaseparate ng 4–5 na distinct voices sa shared mic. Lampas doon, inaasahan na mag-merge ang model ng pinakamaingay na dalawang participants. Ang fix ay isang rename pass sa transcript editor — karamihan ng focus group transcripts ay kailangan ng 10–15 minuto ng cleanup.
07Kaya ba ng aking co-PI at grad students na mag-access ng transcripts sa parehong proyekto?+
Oo. Ang workspaces ay sumusuporta sa shared folders na may per-user permissions — ang PI ay makikita ang lahat ng interviews, ang RAs ay nakikita lamang ang kanilang assigned cohort. Kapaki-pakinabang para sa multi-site studies kung saan hindi mo alam kung gustong makita ng isang estudyante ang data ng iba.
08Para sa publication-grade na direktang quotes, nag-aalok ba kayo ng human pass?+
Hindi pa, at hindi kami magpapanggap na ginagawa namin. Para sa quotes na pupunta sa thesis o article, ang aming rekomendasyon ay: patakbuhin muna ang AI transcript, mag-code sa iyong CAQDAS tool, pagkatapos ay manual na i-correct ang specific 30–60 segundo sa paligid ng bawat quote laban sa audio bago ito mabusog. Yan ang workflow na ginagamit ng karamihan ng aming researcher users.

I-upload ang isang enterbyu. Tuklasin kung paano ang transkripsiyon ay nag-code sa paraang gusto mo.

30 libreng minuto bawat buwan. Walang card. Verbatim mode, 100+ languages, CAQDAS-ready DOCX, audio deleted sa 24h.

Simulan nang libre