Transcription para sa academic researchers.IRB-aware, CAQDAS-ready, 100+ na wika.

Maglagay ng research interview o focus group recording. Makakuha ng speaker-labelled, timestamped text na handa para sa NVivo, Atlas.ti, o MaxQDA — na may audio deleted sa loob ng 24 oras.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Panoorin kung ano ang lalabas

Field recording nasa loob. Coding-ready transcript nasa labas.

Iniwan namin ang bawat participant turn na may timestamp sa simula, pinapanatili ang filler words kung hihilingin mo ang verbatim, at i-export ang DOCX na may speaker styles na kinikilala na ng iyong CAQDAS tool.

Semi-structured interview · .wavREC 2 speakers · 1:08:24
auto-detected en-GB44.1 kHz mono · lavalier mic
~90s
Transcript · streaming94% accuracy · verbatim mode
S1

Maaari mo ba akong gabayan sa unang pagkakataon na napansin mo ang pagbabago sa neighborhood?

S2

Um, malamang na 2019 — ang bakery sa sulok ay tumitigil, at, yeah, doon ito humantong sa akin.

S1

At ano ang pakiramdam mo, sa pagtingin sa nangyari sa mga buwan na iyon?

S2

Honestly? Parang ang lugar na kilala ko sa loob ng tatlumpung taon ay naglalaho, piraso sa piraso.

94% sa lavalier interviewDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tatlong tunay na option · matapat na comparison

Rev human. NVivo Transcription. O kami.

Ang human service ng Rev ay ang historikal na default para sa dissertation-grade quotes. Nag-bundle ang NVivo ng AI transcription sa loob ng CAQDAS tool mismo. Kami ay nasa gitna — mas mabilis kaysa Rev, mas accurate at IRB-friendlier kaysa NVivo's built-in.

Option 01

Rev (human transcription)

Mga tao ang nag-type. Mabagal, mahal, pero ang gold standard para sa publishable verbatim.

Turnaround12–24 oras (typical)
Cost · per min$1.50 human / $0.25 AI
Speaker labelsOo, manually placed
Audio retentionStored sa Rev servers
LanguagesEN human · ~30 AI
CAQDAS exportDOCX, TXT (manual)
Best forMga single high-stakes interview na naglalayong direct quotation sa isang published paper, kung saan ang budget ay hindi ang constraint.
Option 02

Transcription.Solutions

AI transcript sa ilang minuto, audio deleted sa 24h, DOCX na styled para sa NVivo at Atlas.ti import.

Turnaround~5 min para sa 60-min file
Cost · per min$0.03
Speaker labelsDiarized, rename sa in-app
Audio retentionDeleted sa loob ng 24h
Languages100+, auto-detected
CAQDAS exportDOCX heading styles + TXT
Best forMga researcher na may 20+ interviews na kailangan ng mabilis na first-pass transcripts, tapos hand-correct ang 5% ng quotes na para sa publication.
Option 03

NVivo Transcription / Otter

AI transcription na bundled sa loob ng iyong CAQDAS tool o note-taker. Convenient, EN-leaning, mas kaunting control.

TurnaroundComparable (AI)
CostCredit packs · ~$0.30/min
Speaker labelsAcoustic, EN-tuned
Audio retentionTied sa subscription
LanguagesNon-EN accuracy drops
CAQDAS exportNative sa NVivo lang
Best forSolo PhD students na nagtatrabaho entirely sa English sa loob ng isang CAQDAS ecosystem na gustong iisang bill.

Pricing at feature flags accurate bilang ng 2026. Ang AI/human split ng Rev at NVivo Transcription credit pricing ay nagkakaiba-iba sa bawat rehiyon at academic licensing.

Specific sa qualitative research

Tatlong bagay na hindi kumikita sa mga generic transcription tools.

I-flip ang right settings bago ka mag-upload at ang transcript ay direktang mag-i-import sa iyong CAQDAS project.

Ano ang napupunta sa kalupitan

  1. 1Filler words stripped silently. Generic AI ay nag-remove ng "um", "like", false starts — okay para sa meeting notes, fatal para sa conversation analysis o discourse work.
  2. 2Domain terminology (theoretical frameworks, drug names, place names, kinship terms) ay nakukuha phonetically. Ang coding ay kailangan ng find-and-replace pass.
  3. 3Audio ay umuupo sa vendor's servers indefinitely. Karamihan ng IRB data management plans ay nangangailangan ng deletion o controlled retention — vendors ay bihira itong i-document ng malinaw.

Ano ang i-flip dito

  1. 1I-switch sa Verbatim mode sa job form. Pinapanatili namin ang fillers, false starts, repetitions, at laugh markers — clean mode ay opt-in, hindi default para sa researchers.
  2. 2I-paste ang iyong codebook terms at proper nouns sa Custom vocabulary. Ito ay ipinasa bilang recognizer hint, hindi hard substitution, kaya context pa rin ang panalo.
  3. 3Ang audio ay deleted sa loob ng 24 oras pagkatapos completion ng job. Ang transcript ay nananatili sa iyong account. Maaari naming i-issue ang deletion confirmation para sa iyong IRB file sa request.

Recommended job settings para sa research interviews

Maglagay ng field recording at ang mga ito ay i-flip on by default. I-override per-job mula sa form.

Mode
Verbatim (fillers + false starts on)
Speaker model
Interview · 2–8 speakers
Language
Auto-detect · accent-tolerant
Timestamps
Every speaker turn
Audio retention
Delete sa loob ng 24h
Export
DOCX (CAQDAS styles) · TXT · SRT

Accuracy · real-world numbers

94% sa isang clean lavalier interview. Matapat tungkol sa kung ano ang sinayang ng fieldwork.

Ang field audio ay ang hard case sa transcription — open rooms, accented English, overlapping speech sa focus groups. Lavalier-mic dyadic interviews ay umabot sa ceiling; ambient field recordings at malalaking focus groups ay nag-degrade na pinakamabilis. Ang mga numero sa ibaba ay mula sa actual researcher uploads, hindi synthetic benchmarks.

95%
1-on-1, lavalier o USB mic

Quiet room, single L2 o native speaker, recorder sa table. Best case para sa semi-structured interviews — karamihan ng dyadic studies ay lumalabas dito.

91%
Handheld recorder, 2–3 speakers

Zoom H4n o phone recorder mid-table. Speaker chairs identified ng direction. Planuhin ang 5-min relabel pass.

85%
Field interview, ambient noise

Café, market, walking interview. Background chatter at traffic ay nakakaapekto sa short responses; main turns ay nananatiling codable.

80%
Focus group, 5–8 participants

Overlapping speech at shared mic. Ang diarization ay magme-merge ng ilang quieter voices — maghanda na mag-disambiguate sa coding time.

Mga common na tanong

8 na bagay na tinatanong ng mga researcher tungkol sa academic transcription.

01Ito ba ay acceptable sa isang typical IRB data management plan?+
Karamihan ng mga plano na nakita namin ay nag-approve sa amin pagkatapos basahin ang dalawang facts: audio ay deleted sa loob ng 24 oras pagkatapos completion ng job, at transcripts ay nananatili lang sa account ng researcher. Hindi kami isang IRB mismo — ang iyong board ang gumagawa ng final call — pero kami ay mag-i-issue ng written processing description para sa iyong protocol sa request.
02Pinapanatili ba ninyo ang aking interview audio?+
Hindi. Ang audio file ay deleted sa loob ng 24 oras pagkatapos tapos ng job. Ang transcript lang ay nananatili sa iyong account, at maaari mong i-delete iyon anumang oras. Hindi namin ginagamit ang research audio para mag-train ng models.
03Kaya ninyo ba ang true verbatim — kasama ang fillers, false starts, at overlaps — para sa conversation analysis?+
Oo. I-toggle ang Verbatim mode sa job form at pinapanatili namin ang "um", "uh", repetitions, false starts, at laugh tokens. Ang overlap ay marked ng brace symbol sa turn boundary. Hindi namin inalauto ang Jefferson notation — iyan pa rin ay human pass.
04Mag-i-import ba ang DOCX cleanly sa NVivo, Atlas.ti, o MaxQDA?+
Oo. Ang aming DOCX ay gumagamit ng heading at speaker styles na inaasahan ng bawat tool para sa auto-coding by speaker. Sa NVivo, gamitin ang File → Import → Transcripts. Sa Atlas.ti at MaxQDA, ang speaker-paragraph structure ay preserver kaya autocoding by speaker ay gumagana out of the box.
05Paano nito hinahawakan ang accented English o multilingual interviews?+
Suportahan namin ang 100+ languages na may auto-detection, kasama ang code-switching sa loob ng iisang recording. Heavy L2 accents ay landing nangyayari around 85–90% sa clean audio. Para sa minority languages na may sparse training data (e.g., ilang African at Indigenous languages), ang accuracy ay mas mababa at sinasabi namin ito sa language picker.
06Focus groups na may 6–8 tao — gumagana ba talaga ang diarization?+
Partially. Ang acoustic diarization ay reliably na nagseparate ng 4–5 distinct voices sa isang shared mic. Lampas doon, maghanda na ang model ay mag-merge ng pinakaquiet na participants. Ang fix ay isang rename pass sa transcript editor — karamihan ng focus group transcripts ay nangangailangan ng 10–15 minuto ng cleanup.
07Maaari ba ang aking co-PI at grad students na mag-access ng transcripts sa parehong project?+
Oo. Ang workspaces ay sumusuporta sa shared folders na may per-user permissions — PI ay makikita ang lahat ng interviews, RAs ay makikita lang ang kanilang assigned cohort. Useful para sa multi-site studies kung saan hindi mo gusto ang isang student na mag-export ng data ng iba.
08Para sa publication-grade direct quotes, nag-aalok ba kayo ng human pass?+
Hindi pa, at hindi namin ito ipagkakait-kait. Para sa quotes na papunta sa thesis o article, ang aming rekomendasyon ay: patakbuhin ang AI transcript una, i-code sa iyong CAQDAS tool, tapos hand-correct ang specific 30–60 segundo around bawat quote laban sa audio bago ito ma-delete. Iyan ang workflow na ginagamit ng karamihan ng aming researcher users.

I-upload ang isang interview. Tingnan kung ang transcript ay nag-code ng paraan na iyong i-code ito.

30 free minutes bawat buwan. Walang card. Verbatim mode, 100+ languages, CAQDAS-ready DOCX, audio deleted sa 24h.

Magsimula ng libre