Transkripsi temubual.Perekaman berbeda, hasil sama.

Memo telepon, panggilan Zoom, rig lavalier, atau perekam lapangan genggam — lepaskan rekaman temubual dan dapatkan teks berlabel pembicara, berstempel masa yang dapat Anda sitir.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Lihat apa yang keluar

Dua suara masuk. Dua suara keluar, berlabel.

Sebagian besar temubual adalah dua orang di satu perangkat — telepon di meja, perekam di antara Anda. Kami memisahkan audio temubual menjadi pewawancara dan sumber bahkan dari saluran mono tunggal, lalu memberi stempel masa setiap giliran untuk sitasi.

Perekam lapangan · WAVREC 2 pembicara · 38:42
auto-terdeteksi en-US48 kHz mono · 1411 kbps
~90s
Transkripsi · streamingAkurasi 94%
S1

Bisakah Anda menunjukkan apa yang Anda lihat pagi hari tanggal delapan belas?

S2

Saya sampai sekitar jam enam. Pintu ruang muat sudah terbuka, padahal seharusnya tidak.

S1

Dan Anda sudah melaporkan masalah pintu sebelumnya — kepada siapa?

S2

Kepada Diane Okafor di fasilitas, dua kali di Maret. Saya punya email-nya.

94% pada WAV lapanganDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tiga pilihan nyata · perbandingan jujur

Rev manusia. Otter atau Trint. Atau kami.

Rev mengirim audio Anda ke petranskripsi manusia — lambat dan mahal tetapi kesetiaan tinggi pada audio sulit. Otter dan Trint adalah AI-first seperti kami, disetel untuk jurnalis dan peneliti. Berikut tempat masing-masing cocok.

Option 01

Transkripsi manusia Rev

Orang nyata mengetik temubual Anda. Terbaik pada audio bermusuhan, tetapi Anda menunggu dan membayar.

Waktu penyelesaian12–24 jam biasa
Akurasi pada audio bersih99% (diklaim)
Label pembicaraManual, termasuk
BahasaEN manusia · 30+ AI
Biaya · per menit$1.50 manusia · $0.25 AI
PrivasiAudio dikirim ke kontraktor
Best forTemubual yang terikat pengadilan atau penting publikasi pada audio buruk di mana Anda membutuhkan telinga manusia dan memiliki sehari untuk menunggu.
Option 02

Transcription.Solutions

Transkripsi AI, pemisahan pembicara, siap dalam hitungan menit. Mesin yang sama untuk memo telepon, Zoom, atau perekam lapangan.

Waktu penyelesaian~3 menit per jam audio
Akurasi pada audio bersih94–96%
Label pembicaraOtomatis · ubah nama di editor
Bahasa99, auto-terdeteksi
Biaya · per menit$0.03
PrivasiAudio dihapus dalam 24j · tidak ada pelatihan
Best forJurnalis, peneliti, dan produser yang melakukan banyak temubual seminggu membutuhkan teks cepat dan dapat disitir tanpa mengunggah ke kontraktor.
Option 03

Otter / Trint

Transkripsi AI dengan editor berorientasi riset. Kuat dalam bahasa Inggris, terkunci pada paket bulanan.

Waktu penyelesaianReal-time hingga ~5 menit
Akurasi pada audio bersih~90–93%
Label pembicaraYa · disetel EN
BahasaOtter EN-only · Trint 30+
Biaya$17–80/pengguna/bulan (langganan)
PrivasiDisimpan di akun secara default
Best forTim yang menginginkan perpustakaan tertaut setiap temubual yang pernah direkam dan tidak keberatan biaya kursi bulanan per pengguna.

Penetapan harga dan bendera fitur akurat per 2026. Waktu penyelesaian manusia Rev bervariasi menurut kedalaman antrian dan panjang audio.

Khusus untuk temubual

Tiga hal yang menggigit orang pada alat transkripsi generik.

Audio temubual jarang bersih. Balik pengaturan ini dan transkripsi tahan kutipan.

Apa yang salah

  1. 1Pembicaraan lintas di saluran tunggal. Ketika sumber Anda menjadi bersemangat dan berbicara lebih dari pertanyaan Anda, diarisasi generik menggabungkan keduanya ke dalam satu blok pembicara.
  2. 2Nama dan tempat sumber (Okafor, Tigray, Maranello) kembali fonetik. Tidak berguna untuk verifikasi fakta terhadap transkripsi.
  3. 3Momen off-the-record berakhir di transkripsi yang sama dengan materi yang dapat dikutip — tidak ada cara menandai wilayah sebagai diredaksi.

Apa yang dibalik di sini

  1. 1Jika perekam lapangan Anda menulis WAV dua saluran (satu mikrofon per trek), unggah file itu langsung. Kami mendeteksi per-saluran dan lewati diarisasi sepenuhnya.
  2. 2Tempel catatan persiapan Anda — nama sumber, organisasi, nama tempat — ke Kosakata Kustom pada formulir pekerjaan. Pengenali memperlakukan mereka sebagai nomina diri yang diketahui.
  3. 3Setelah transkripsi tiba, tandai wilayah sebagai off-record di editor. Ini diekspor sebagai `[REDACTED 14:22–15:08]` dalam DOCX dan TXT, dengan audio sumber dihapus dalam 24 jam terlepas dari apa pun.

Pengaturan pekerjaan yang disarankan untuk temubual

Lepaskan file temubual dan pengaturan ini hidup secara default. Ganti sesuka hati dari formulir.

Diarisasi
Per-saluran jika stereo · akustik sebaliknya
Model pembicara
Temubual · 2–4 pembicara
Bahasa
Auto-terdeteksi · code-switch on
Kata isian
Disimpan (mode verbatim)
Ringkasan
Kutipan kunci + indeks topik
Ekspor
DOCX dengan stempel masa · TXT biasa · JSON

Accuracy · real-world numbers

96% pada lav bagus. Masih dapat dibaca pada rekaman kafe.

Akurasi temubual dibatasi oleh apa yang benar-benar didengar mikrofon. Mikro dekat stereo di setiap pembicara adalah batasnya; telepon di meja bising adalah lantai. Angka di bawah berasal dari file temubual produksi, bukan patokan sintetis.

96%
Lavalier ganda · sunyi studio

Satu mikrofon per pembicara, saluran terpisah (Zoom H5/H6, Tascam DR-40). Diarisasi adalah sepele — kesalahan hanya teks.

94%
Perekam genggam di meja

Kondenser tunggal antara dua pembicara, ruangan sunyi. Diarisasi akustik memisahkan suara dengan andal di bawah 4 ft.

90%
Memo suara telepon · dekat

Memo suara iPhone atau Pixel di meja. Nama dan angka kadang-kadang terlewat; irama baik untuk dikutip.

84%
Rekaman lapangan · kafe atau jalan

Mesin espresso, lalu lintas, suara ketiga di dekatnya. Kasus terburuk dalam data kami — dapat digunakan untuk navigasi, verifikasi kutipan terhadap audio.

Pertanyaan umum

8 hal yang orang tanyakan tentang transkripsi temubual.

01Bisakah saya menggunakan transkripsi ini dalam artikel terbitan tanpa memverifikasi terhadap audio?+
Untuk kutipan langsung — tidak, selalu verifikasi terhadap audio. Transkripsi AI pada akurasi 94% masih salah membaca satu kata dalam 17 rata-rata, dan kata yang salah dalam kutipan adalah koreksi. Transkripsi untuk navigasi dan drafting; audio adalah sumber kebenaran.
02Perekam saya menyimpan WAV stereo dengan satu mikrofon per pembicara. Apa yang saya lakukan?+
Unggah file itu langsung — jangan ubah ke mono dulu. Kami mendeteksi dua saluran dan merutekan masing-masing ke trek diarisasinya sendiri, yang merupakan alur akurasi tertinggi yang kami miliki. Harapkan 96%+ di ruangan sunyi.
03Bagaimana dengan temubual yang direkam melalui panggilan telepon?+
Audio telepon adalah 8 kHz pita sempit, yang membatasi akurasi sekitar 88% bahkan di lini bersih. Kami masih membagi dua pihak menggunakan pemisahan saluran jika aplikasi perekam Anda menangkap mereka secara terpisah (sebagian besar melakukannya). Panggilan VoIP melalui WhatsApp atau Signal terdengar sedikit lebih baik daripada PSTN.
04Bisakah saya menghapus bagian off-the-record sebelum membagikan transkripsi?+
Ya. Di editor, pilih rentang stempel masa dan tandai `[REDACTED]`. Ekspor mengganti teks dengan penanda redaksi tetapi menyimpan stempel masa sehingga dokumen masih melacak audio.
05Apakah Anda melatih model pada rekaman temubual saya?+
Tidak. Audio sumber dihapus dari infrastruktur kami dalam 24 jam setelah selesai, dan kami tidak menggunakan rekaman pelanggan untuk pelatihan model di bawah paket apa pun. Teks transkripsi tetap di akun Anda sampai Anda menghapusnya.
06Tiga atau empat orang di temubual panel — apakah diarisasi masih berfungsi?+
Hingga sekitar enam suara berbeda, ya, tetapi akurasi pada penugasan pembicara menurun dengan setiap orang yang ditambahkan dan memburuk ketika dua pembicara terdengar serupa. Rencanakan melewati 2–3 menit pada chip pembicara setelah transkripsi tiba.
07Bisakah Anda mentranskrip temubual dalam bahasa selain bahasa Inggris?+
99 bahasa, auto-terdeteksi. Code-switching (sumber bahasa Inggris tergelincir ke bahasa Spanyol di tengah-kalimat) ditangani dalam 12 pasangan bahasa. Akurasi bervariasi menurut bahasa — bahasa Eropa cocok dengan bahasa Inggris; bahasa Afrika dan Asia Tengah dengan sumber daya rendah berjalan 5–10 poin lebih rendah.
08Saya merekam di panggilan Zoom — haruskah saya menggunakan halaman Zoom Anda?+
Mesin yang sama, hasil yang sama. Halaman Zoom mencakup spesifik cloud-recording (audio per-peserta, degradasi dial-in). Jika Anda melakukan satu temubual pada satu waktu melalui Zoom, kedua alur berfungsi — lepaskan MP4 di sini dan label pembicara keluar sama.

Lepaskan rekaman temubual Anda. Lihat apa yang keluar.

30 menit gratis setiap bulan. Tanpa kartu. Label pembicara, 99 bahasa, semua ekspor termasuk.

Mulai gratis