Transkripsi untuk peneliti akademik.Sadar IRB, siap CAQDAS, 100+ bahasa.

Unggah wawancara penelitian atau rekaman kelompok fokus. Dapatkan teks berlabel pembicara, bertanda waktu siap untuk NVivo, Atlas.ti, atau MaxQDA — dengan audio dihapus dalam 24 jam.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Lihat apa yang keluar

Rekaman lapangan masuk. Transkripsi siap dikode keluar.

Kami menandai setiap giliran peserta dengan cap waktu di awal, mempertahankan kata pengisi jika Anda meminta verbatim, dan mengekspor DOCX dengan gaya pembicara yang alat CAQDAS Anda sudah kenal.

Wawancara semi-terstruktur · .wavREC 2 pembicara · 1:08:24
otomatis terdeteksi en-GB44.1 kHz mono · mikrofon lavalier
~90s
Transkripsi · streamingAkurasi 94% · mode verbatim
S1

Bisakah Anda jelaskan waktu pertama kali Anda melihat perubahan di lingkungan?

S2

Um, mungkin dulu 2019 — toko roti di sudut tutup, dan, ya, saat itu rasanya.

S1

Dan rasanya seperti apa, menyaksikan itu terjadi selama berbulan-bulan itu?

S2

Jujur? Seperti tempat yang saya ketahui selama tiga puluh tahun menghilang, sedikit demi sedikit.

94% pada wawancara lavalierDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tiga pilihan nyata — perbandingan jujur

Rev manusia. NVivo Transcription. Atau kami.

Layanan manusia Rev adalah standar historis untuk kutipan tingkat disertasi. NVivo menggabungkan transkripsi AI di dalam alat CAQDAS itu sendiri. Kami berada di tengah — lebih cepat dari Rev, lebih akurat dan lebih ramah IRB daripada bawaan NVivo.

Option 01

Rev (transkripsi manusia)

Manusia mengetiknya. Lambat, mahal, tetapi standar emas untuk verbatim yang dapat dipublikasikan.

Waktu penyelesaian12–24 jam (biasanya)
Biaya · per menit$1.50 manusia / $0.25 AI
Label pembicaraYa, ditempatkan secara manual
Retensi audioDisimpan di server Rev
BahasaEN manusia · ~30 AI
Ekspor CAQDASDOCX, TXT (manual)
Best forWawancara high-stakes tunggal yang ditujukan untuk kutipan langsung dalam makalah terpublikasi, di mana anggaran bukan kendala.
Option 02

Transcription.Solutions

Transkripsi AI dalam hitungan menit, audio dihapus dalam 24 jam, DOCX bergaya untuk impor NVivo dan Atlas.ti.

Waktu penyelesaian~5 mnt untuk file 60 mnt
Biaya · per menit$0.03
Label pembicaraDiarisasi, rename dalam aplikasi
Retensi audioDihapus dalam 24 jam
Bahasa100+, auto-terdeteksi
Ekspor CAQDASGaya heading DOCX + TXT
Best forPeneliti menjalankan 20+ wawancara yang membutuhkan transkripsi pass pertama cepat, kemudian koreksi manual 5% kutipan yang ditujukan untuk publikasi.
Option 03

NVivo Transcription / Otter

Transkripsi AI yang digabungkan di dalam alat CAQDAS atau pembuat catatan Anda. Nyaman, EN-oriented, kontrol lebih sedikit.

Waktu penyelesaianSebanding (AI)
BiayaPaket kredit · ~$0,30/mnt
Label pembicaraAkustik, EN-tuned
Retensi audioTerikat ke langganan
BahasaAkurasi Non-EN menurun
Ekspor CAQDASAsli untuk NVivo saja
Best forMahasiswa PhD solo bekerja sepenuhnya dalam bahasa Inggris di dalam satu ekosistem CAQDAS yang menginginkan satu tagihan.

Harga dan flag fitur akurat per 2026. Pemisahan AI/manusia Rev dan harga kredit NVivo Transcription bervariasi menurut wilayah dan lisensi akademik.

Spesifik untuk penelitian kualitatif

Tiga hal yang menggigit peneliti pada alat transkripsi generik.

Balik pengaturan yang tepat sebelum Anda mengunggah dan transkripsi impor langsung ke proyek CAQDAS Anda.

Apa yang salah

  1. 1Kata pengisi dihilangkan dalam diam. AI generik menghapus "um", "like", awal palsu — baik untuk catatan rapat, fatal untuk analisis percakapan atau pekerjaan wacana.
  2. 2Terminologi domain (kerangka teoritis, nama obat, nama tempat, istilah kekeluargaan) ditranskripsi secara fonetis. Pengodean kemudian memerlukan pass temukan-dan-ganti.
  3. 3Audio duduk di server vendor tanpa batas. Kebanyakan rencana manajemen data IRB memerlukan penghapusan atau retensi terkontrol — vendor jarang mendokumentasikan ini dengan jelas.

Apa yang harus dibalik di sini

  1. 1Beralih ke mode Verbatim pada formulir pekerjaan. Kami menyimpan pengisi, awal palsu, pengulangan, dan penanda tawa — mode bersih adalah opt-in, bukan default untuk peneliti.
  2. 2Tempel istilah codebook dan nama diri Anda ke dalam kosakata khusus. Kami meneruskannya sebagai petunjuk pengenali, bukan substitusi keras, jadi konteks tetap menang.
  3. 3Audio dihapus dalam 24 jam setelah penyelesaian pekerjaan. Transkripsi tetap di akun Anda. Kami dapat mengeluarkan konfirmasi penghapusan untuk file IRB Anda atas permintaan.

Pengaturan pekerjaan yang direkomendasikan untuk wawancara penelitian

Jatuhkan rekaman lapangan dan ini beralih secara default. Ganti per-pekerjaan dari formulir.

Mode
Verbatim (pengisi + awal palsu aktif)
Speaker model
Wawancara · 2–8 pembicara
Bahasa
Auto-deteksi · toleran aksen
Tanda waktu
Setiap giliran pembicara
Retensi audio
Hapus dalam 24 jam
Ekspor
DOCX (gaya CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% pada wawancara lavalier yang bersih. Jujur tentang apa yang merusak pekerjaan lapangan.

Audio lapangan adalah kasus sulit dalam transkripsi — ruangan terbuka, bahasa Inggris dengan aksen, pidato yang tumpang tindih dalam kelompok fokus. Wawancara diadik lavalier-mic mencapai batasnya; rekaman lapangan ambient dan kelompok fokus besar merosot paling cepat. Angka di bawah berasal dari unggahan peneliti aktual, bukan benchmark sintetis.

95%
1-ke-1, mikrofon lavalier atau USB

Ruangan tenang, L2 tunggal atau pembicara asli, perekam di atas meja. Kasus terbaik untuk wawancara semi-terstruktur — sebagian besar studi diadik berakhir di sini.

91%
Perekam genggam, 2–3 pembicara

Zoom H4n atau perekam telepon di tengah meja. Kursi pembicara diidentifikasi berdasarkan arah. Rencanakan pass relabel 5 menit.

85%
Wawancara lapangan, kebisingan ambient

Kafe, pasar, wawancara berjalan. Obrolan latar belakang dan lalu lintas mempengaruhi respons singkat; giliran utama tetap dapat dikode.

80%
Kelompok fokus, 5–8 peserta

Pidato yang tumpang tindih dan mikrofon bersama. Diarisasi akan menggabungkan beberapa suara yang lebih tenang — harapkan disambiguasi pada waktu pengodean.

Pertanyaan umum

8 hal yang ditanyakan peneliti tentang transkripsi akademik.

01Apakah ini dapat diterima dalam rencana manajemen data IRB yang khas?+
Sebagian besar rencana yang telah kami lihat menyetujui kami setelah mereka membaca dua fakta: audio dihapus dalam 24 jam setelah penyelesaian pekerjaan, dan transkripsi hanya tetap di akun peneliti. Kami bukan IRB sendiri — dewan Anda membuat keputusan akhir — tetapi kami akan mengeluarkan deskripsi pemrosesan tertulis untuk protokol Anda atas permintaan.
02Apakah Anda menyimpan audio wawancara saya?+
Tidak. File audio dihapus dalam 24 jam setelah pekerjaan selesai. Hanya transkripsi yang tetap di akun Anda, dan Anda dapat menghapusnya kapan saja. Kami tidak menggunakan audio penelitian untuk melatih model.
03Bisakah Anda melakukan verbatim yang sebenarnya — dengan pengisi, awal palsu, dan tumpang tindih — untuk analisis percakapan?+
Ya. Alihkan mode Verbatim pada formulir pekerjaan dan kami menyimpan "um", "uh", pengulangan, awal palsu, dan token tawa. Tumpang tindih ditandai dengan simbol kurung kurawal di batas giliran. Kami tidak melakukan notasi Jefferson secara otomatis — itu masih pass manusia.
04Apakah DOCX akan impor dengan bersih ke NVivo, Atlas.ti, atau MaxQDA?+
Ya. DOCX kami menggunakan gaya heading dan pembicara yang setiap alat harapkan untuk auto-coding berdasarkan pembicara. Di NVivo, gunakan File → Import → Transcripts. Di Atlas.ti dan MaxQDA, struktur speaker-paragraph dipertahankan sehingga autocoding berdasarkan pembicara bekerja langsung dari kotak.
05Bagaimana penanganan bahasa Inggris beraksent atau wawancara multibahasa?+
Kami mendukung 100+ bahasa dengan auto-deteksi, termasuk code-switching dalam satu rekaman. Aksen L2 berat mendarat sekitar 85–90% pada audio bersih. Untuk bahasa minoritas dengan data pelatihan sedikit (misalnya, beberapa bahasa Afrika dan Pribumi), akurasi lebih rendah dan kami mengatakan demikian pada pemilih bahasa.
06Kelompok fokus dengan 6–8 orang — apakah diarisasi benar-benar berfungsi?+
Sebagian. Diarisasi akustik dengan andal memisahkan 4–5 suara berbeda pada mikrofon bersama. Selain itu, harapkan model untuk menggabungkan dua peserta yang lebih tenang. Perbaikannya adalah pass relabel di editor transkripsi — sebagian besar transkripsi kelompok fokus memerlukan 10–15 menit pembersihan.
07Bisakah co-PI saya dan mahasiswa lulusan mengakses transkripsi dalam proyek yang sama?+
Ya. Ruang kerja mendukung folder bersama dengan izin per-pengguna — PI dapat melihat semua wawancara, RA hanya melihat kriteria tugas mereka. Berguna untuk studi multi-situs di mana Anda tidak ingin satu siswa mengekspor data siswa lain.
08Untuk kutipan langsung tingkat publikasi, apakah Anda menawarkan pass manusia?+
Belum, dan kami tidak akan menyangkal itu. Untuk kutipan yang masuk ke tesis atau artikel, rekomendasi kami adalah: jalankan transkripsi AI terlebih dahulu, kode di alat CAQDAS Anda, kemudian koreksi manual spesifik 30–60 detik di sekitar setiap kutipan terhadap audio sebelum dihapus. Itu adalah alur kerja yang digunakan sebagian besar pengguna peneliti kami.

Unggah satu wawancara. Lihat apakah transkripsinya dikode seperti yang akan Anda lakukan.

30 menit gratis setiap bulan. Tanpa kartu. Mode verbatim, 100+ bahasa, DOCX siap CAQDAS, audio dihapus dalam 24 jam.

Mulai gratis