Transkripsi wawancara.Rekaman berbeda, hasil sama.

Voice memo telepon, panggilan Zoom, rig lav, atau field recorder genggam — unggah rekaman wawancara dan dapatkan teks berlabel pembicara, beresolususi timestamp yang bisa Anda kutip.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Lihat apa yang dihasilkan

Dua suara masuk. Dua suara keluar, berlabel.

Kebanyakan wawancara adalah dua orang pada satu perangkat — telepon di atas meja, rekorder di antara Anda. Kami memisahkan audio wawancara menjadi pewawancara dan sumber bahkan dari saluran mono tunggal, lalu memberikan timestamp setiap giliran untuk sitasi.

Field recorder · WAVREC 2 pembicara · 38:42
auto-detected en-US48 kHz mono · 1411 kbps
~90s
Transkripsi · streaming94% akurasi
S1

Bisakah Anda bercerita tentang apa yang Anda lihat pagi hari tanggal delapan belas?

S2

Saya tiba sekitar pukul enam. Pintu loading bay sudah terbuka, padahal seharusnya tidak.

S1

Dan Anda sudah melaporkan masalah pintu itu sebelumnya — kepada siapa?

S2

Kepada Diane Okafor di facilities, dua kali di bulan Maret. Saya punya emailnya.

94% pada WAV fieldDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tiga pilihan nyata · perbandingan jujur

Rev manusia. Otter atau Trint. Atau kami.

Rev mengirim audio Anda ke pentranskripsi manusia — lambat dan mahal tetapi setia tinggi pada audio sulit. Otter dan Trint adalah AI-first seperti kami, disempurnakan untuk jurnalis dan peneliti. Ini tempat masing-masing cocok.

Option 01

Rev transkripsi manusia

Orang asli mengetik wawancara Anda. Terbaik pada audio bermasalah, tetapi Anda menunggu dan membayar.

Waktu penyelesaian12–24 jam khas
Akurasi pada audio bersih99% (diklaim)
Label pembicaraManual, sudah termasuk
BahasaEN manusia · 30+ AI
Biaya · per menit$1.50 manusia · $0.25 AI
PrivasiAudio dikirim ke kontraktor
Best forWawancara terikat pengadilan atau kritis publikasi pada audio mutu rendah di mana Anda membutuhkan telinga manusia dan punya sehari untuk menunggu.
Option 02

Transcription.Solutions

Transkripsi AI, terpisah pembicara, siap dalam hitungan menit. Mesin sama untuk voice memo telepon, Zoom, atau field recorder.

Waktu penyelesaian~3 menit per jam audio
Akurasi pada audio bersih94–96%
Label pembicaraOtomatis · ganti nama di editor
Bahasa99, auto-detected
Biaya · per menit$0.03
PrivasiAudio dihapus dalam 24j · tanpa pelatihan
Best forJurnalis, peneliti, dan produser yang melakukan banyak wawancara seminggu memerlukan teks cepat, dapat dikutip tanpa mengunggah ke kontraktor.
Option 03

Otter / Trint

Transkripsi AI dengan editor berorientasi riset. Kuat bahasa Inggris, terkunci pada paket bulanan.

Waktu penyelesaianReal-time hingga ~5 menit
Akurasi pada audio bersih~90–93%
Label pembicaraYa · disempurnakan EN
BahasaOtter EN-only · Trint 30+
Biaya$17–80/pengguna/bln (langganan)
PrivasiDisimpan dalam akun secara default
Best forTim yang ingin perpustakaan hosted dari setiap wawancara yang pernah direkam dan tidak keberatan biaya tempat duduk bulanan per pengguna.

Harga dan bendera fitur akurat per 2026. Waktu penyelesaian manusia Rev bervariasi per kedalaman antrian dan panjang audio.

Khusus wawancara

Tiga hal yang sering dialami pengguna tools transkripsi generik.

Audio wawancara jarang bersih. Balik pengaturan ini dan transkripsi tahan uji kutipan.

Apa yang salah

  1. 1Cross-talk pada saluran tunggal. Ketika sumber Anda penuh semangat dan memotong pertanyaan Anda, diarization generik menggabungkan keduanya menjadi satu blok pembicara.
  2. 2Nama dan tempat sumber (Okafor, Tigray, Maranello) kembali fonetik. Sia-sia untuk fact-checking terhadap transkripsi.
  3. 3Momen off-the-record berakhir di transkripsi sama seperti materi quotable — tidak ada cara menandai region sebagai redacted.

Apa yang dibalik di sini

  1. 1Jika field recorder Anda menulis WAV dua saluran (satu mikrofon per track), unggah file itu langsung. Kami mendeteksi per-saluran dan lewati diarization sepenuhnya.
  2. 2Tempel catatan persiapan Anda — nama sumber, organisasi, nama tempat — ke Custom vocabulary pada formulir job. Recognizer menganggapnya sebagai proper noun yang dikenal.
  3. 3Setelah transkripsi tiba, tandai region sebagai off-record di editor. Ini mengekspor sebagai `[REDACTED 14:22–15:08]` dalam DOCX dan TXT, dengan audio sumber dihapus dalam 24 jam bagaimanapun.

Pengaturan job yang direkomendasikan untuk wawancara

Unggah file wawancara dan ini balik secara default. Override per-job dari formulir.

Diarization
Per-saluran jika stereo · akustik sebaliknya
Speaker model
Wawancara · 2–4 pembicara
Bahasa
Auto-detect · code-switch aktif
Filler words
Dipertahankan (mode verbatim)
Ringkasan
Kutipan kunci + indeks topik
Ekspor
DOCX dengan timestamp · TXT polos · JSON

Accuracy · real-world numbers

96% pada lav berkualitas. Tetap terbaca pada rekaman di kafe.

Akurasi wawancara dibatasi oleh apa yang mikrofon benar-benar dengar. Close-mic stereo pada setiap pembicara adalah ceiling; telepon duduk di atas meja bising adalah floor. Angka di bawah berasal dari file wawancara produksi, bukan benchmark sintetis.

96%
Dual lavalier · studio hening

Satu mikrofon per pembicara, saluran terpisah (Zoom H5/H6, Tascam DR-40). Diarization trivial — kesalahan hanya teks.

94%
Rekorder genggam di atas meja

Kondenser tunggal antara dua pembicara, ruangan hening. Diarization akustik memisahkan suara dapat diandalkan di bawah 4 kaki.

90%
Voice memo telepon · dekat

Voice memo iPhone atau Pixel di atas meja. Nama dan angka kadang hilang; cadence bagus untuk dikutip.

84%
Rekaman field · kafe atau jalan

Mesin espresso, lalu lintas, suara ketiga di dekat. Kasus terburuk dalam data kami — dapat digunakan untuk navigasi, verifikasi kutipan terhadap audio.

Pertanyaan umum

8 pertanyaan tentang transkripsi wawancara.

01Bisakah saya menggunakan transkripsi ini dalam artikel yang diterbitkan tanpa memverifikasi terhadap audio?+
Untuk kutipan langsung — tidak, selalu verifikasi terhadap audio. Transkripsi AI pada akurasi 94% masih salah membaca satu kata dari 17 rata-rata, dan kata yang salah dalam kutipan adalah koreksi. Transkripsi untuk navigasi dan drafting; audio adalah sumber kebenaran.
02Rekorder saya menyimpan WAV stereo dengan satu mikrofon per pembicara. Apa yang harus saya lakukan?+
Unggah file itu langsung — jangan ubah ke mono dulu. Kami mendeteksi dua saluran dan merutekan masing-masing ke track diarization sendiri, yang jalur akurasi tertinggi kami miliki. Harapkan 96%+ pada ruangan hening.
03Bagaimana dengan wawancara yang direkam melalui panggilan telepon?+
Audio telepon 8 kHz narrow-band, yang membatasi akurasi sekitar 88% bahkan pada garis bersih. Kami tetap memisahkan dua belah pihak menggunakan pemisahan saluran jika aplikasi rekorder Anda menangkap terpisah (kebanyakan melakukannya). Panggilan VoIP melalui WhatsApp atau Signal terdengar sedikit lebih baik daripada PSTN.
04Bisakah saya redact bagian off-the-record sebelum berbagi transkripsi?+
Ya. Di editor, pilih jangkauan timestamp dan tandainya `[REDACTED]`. Ekspor mengganti teks dengan penanda redaction tetapi menyimpan timestamp sehingga dokumen tetap melacak audio.
05Apakah Anda melatih model pada rekaman wawancara saya?+
Tidak. Audio sumber dihapus dari infrastruktur kami dalam 24 jam setelah penyelesaian, dan kami tidak menggunakan rekaman pelanggan untuk pelatihan model di bawah paket apa pun. Teks transkripsi tetap di akun Anda sampai Anda menghapusnya.
06Tiga atau empat orang pada wawancara panel — apakah diarization masih bekerja?+
Hingga sekitar enam suara berbeda, ya, tetapi akurasi pada penugasan pembicara turun dengan setiap orang tambahan dan semakin buruk ketika dua pembicara terdengar serupa. Rencanakan lintasan ganti nama 2–3 menit pada chip pembicara setelah transkripsi tiba.
07Bisakah Anda mentranskripsikan wawancara dalam bahasa selain Inggris?+
99 bahasa, auto-detected. Code-switching (sumber Inggris tergelincir ke Spanyol di tengah kalimat) ditangani dalam 12 pasangan bahasa. Akurasi bervariasi per bahasa — bahasa Eropa cocok Inggris; bahasa Afrika dan Asia Tengah akses rendah berjalan 5–10 poin lebih rendah.
08Saya merekam pada panggilan Zoom — haruskah saya menggunakan halaman Zoom Anda?+
Mesin sama, hasil sama. Halaman Zoom mencakup spesifik cloud-recording (audio per-peserta, degradasi dial-in). Jika Anda melakukan satu wawancara sekaligus melalui Zoom, jalur mana pun bekerja — unggah MP4 di sini dan label pembicara keluar sama.

Unggah rekaman wawancara Anda. Lihat hasilnya.

30 menit gratis setiap bulan. Tanpa kartu. Label pembicara, 99 bahasa, semua ekspor sudah termasuk.

Mulai gratis