บริการแปลเสียงสำหรับ ผู้วิจัยสาขาวิชาการคำนึงถึง IRB พร้อมใช้กับ CAQDAS รองรับภาษามากกว่า 100 ภาษา

วางบันทึกการสัมภาษณ์วิจัยหรือ การบันทึกกล่มสนทนา รับข้อความที่มีป้ายชื่อผู้พูดและมีเวลา พร้อมสำหรับ NVivo, Atlas.ti หรือ MaxQDA — พร้อมเสียงที่ถูกลบภายใน 24 ชั่วโมง

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ ดูว่าผลลัพธ์เป็นอย่างไร

บันทึกสนาม เข้า ข้อความแปลเสียงพร้อมสำหรับเข้ารหัส ออก

เราทำการทำเครื่องหมายแต่ละ ผู้พูดผู้เข้าร่วม ด้วยเวลาเริ่มต้น เก็บคำพูดเสริมหากคุณขอแบบค่อนข้างเป็นตัวตัด และส่วนออก DOCX ด้วยสไตล์ผู้พูดที่เครื่องมือ CAQDAS ของคุณยังรู้จักอยู่แล้ว

การสัมภาษณ์แบบกึ่งมีโครงสร้าง · .wavREC 2 ผู้พูด · 1:08:24
auto-detected en-GB44.1 kHz โมโน · ไมค์ lavalier
~90s
แปลเสียง · streamingความแม่นยำ 94% · โหมดค่อนข้างเป็นตัวตัด
S1

คุณสามารถบอกฉันได้ว่าครั้งแรกที่คุณสังเกตเห็นการเปลี่ยนแปลงในบริเวณใกล้เคียงนั้นคืออย่างไร

S2

อืม คงจะประมาณ 2019 — ร้านเบเกอรี่ที่มุมปิดตัวไป และใช่ พอถึงตอนนั้นฉันก็รู้สึกสักการณ์

S1

แล้วสิ่งนั้นรู้สึกเหมือนไร ที่มองเห็นสิ่งนั้นเกิดขึ้นตลอดหลายเดือน

S2

จริงๆ เหมือนว่าสถานที่ที่ฉันรู้จักมาสามสิบปีนั้นหายไปทีละน้อย

ความแม่นยำ 94% บนการสัมภาษณ์ lavalierDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

สามตัวเลือกจริง · การเปรียบเทียบที่ตรงไปตรงมา

Rev แบบมนุษย์ NVivo Transcription หรือเรา

บริการเชิงมนุษย์ของ Rev เป็นมาตรฐานมาตรฐานทางประวัติศาสตร์สำหรับใบเสร็จค่อนข้างเป็นตัวตัดระดับวิทยานิพนธ์ NVivo รวมการแปลเสียง AI ไว้ในเครื่องมือ CAQDAS เอง เราอยู่ตรงกลาง — เร็วกว่า Rev ความแม่นยำและเป็นมิตรกับ IRB มากกว่า NVivo ในตัวของมัน

Option 01

Rev (การแปลเสียงแบบมนุษย์)

มนุษย์พิมพ์มัน ช้า มีราคาแพง แต่เป็นมาตรฐานทองของการแปลเสียงค่อนข้างเป็นตัวตัดที่ใช้ได้ในการเผยแพร่

เวลาอัน12–24 ชั่วโมง (ทั่วไป)
ต้นทุน · ต่อนาที$1.50 มนุษย์ / $0.25 AI
ป้ายชื่อผู้พูดใช่ วางตำแหน่งด้วยตนเอง
การเก็บรักษาเสียงเก็บไว้บนเซิร์ฟเวอร์ Rev
ภาษาEN มนุษย์ · ~30 AI
ส่วนออก CAQDASDOCX, TXT (ด้วยตนเอง)
Best forการสัมภาษณ์ที่มีความเสี่ยงสูงเดี่ยวบุคคลที่จะอ้างอิงโดยตรงในเอกสารการตีพิมพ์ ซึ่งงบประมาณไม่ใช่ข้อจำกัด
Option 02

Transcription.Solutions

แปลเสียง AI ในหลายนาที เสียงถูกลบในอีก 24 ชั่วโมง DOCX สไตล์สำหรับการนำเข้า NVivo และ Atlas.ti

เวลาอัน~5 นาที สำหรับไฟล์ 60 นาที
ต้นทุน · ต่อนาที$0.03
ป้ายชื่อผู��พูดDiarized เปลี่ยนชื่อในแอป
การเก็บรักษาเสียงลบภายใน 24 ชั่วโมง
ภาษา100+ ตรวจหาอัตโนมัติ
ส่วนออก CAQDASสไตล์หัวข้อ DOCX + TXT
Best forผู้วิจัยที่เรียกใช้การสัมภาษณ์ 20+ ท่านที่ต้องการแปลเสียงช่วงแรกที่รวดเร็ว จากนั้นแก้ไขด้วยมือ 5% ของการอ้างอิงบุคคลที่จะเผยแพร่
Option 03

NVivo Transcription / Otter

การแปลเสียง AI รวมในเครื่องมือ CAQDAS หรือเครื่องมือจดบันทึกของคุณ สะดวก EN ใจแง่ มีการควบคุมน้อย

เวลาอันเปรียบเทียบได้ (AI)
ต้นทุนแพคเก็จเครดิต · ~$0.30/นาที
ป้ายชื่อผู้พูดหลักอะคูสติก EN ปรับแต่ง
การเก็บรักษาเสียงผูกปมกับการสมัครสมาชิก
ภาษาความแม่นยำ Non-EN ลดลง
ส่วนออก CAQDASดั้งเดิมเพื่อ NVivo เท่านั้น
Best forนักศึกษา PhD โสดผู้ที่ทำงานทั้งหมดในภาษาอังกฤษในระบบนิเวศ CAQDAS เดียวที่ต้องการบิลเดียว

ราคาและแฟลกฟีเจอร์ที่แม่นยำตั้งแต่ 2026 การแบ่งเปอร์เซ็นต์ AI/มนุษย์ของ Rev และราคาเครดิต NVivo Transcription แตกต่างกันตามภูมิภาคและใบอนุญาตด้านวิชาการ

เฉพาะการวิจัยเชิงคุณภาพ

สามสิ่งที่โจมตีผู้วิจัยบน เครื่องมือการแปลเสียงทั่วไป

พลิกการตั้งค่าที่ถูกต้องก่อนที่คุณอัปโหลด และแปลเสียงจะนำเข้าลงในโครงการ CAQDAS ของคุณได้โดยตรง

สิ่งที่ผิดพลาด

  1. 1คำพูดเสริมที่ถูกลบเงียบๆ AI ทั่วไปจะลบ "um" "like" การเริ่มต้นเท็จ — ดีสำหรับหมายเหตุการประชุม แต่เป็นอันตรายถึงชีวิตสำหรับการวิเคราะห์การสนทนาหรืองานวาทศิลป์
  2. 2คำศัพท์ในสาขาวิชา (กรอบทฤษฎี ชื่อยา ชื่อสถานที่ คำศัพ��์ที่เกี่ยวข้องกับสายเลือด) ถูกแปลเสียงเสียงเดียว คิดพิจารณาจึงต้อง pass หา-และ-แทนที่
  3. 3เสียงอยู่บนเซิร์ฟเวอร์ของผู้จำหน่ายวิเคราะห์ ไม่จำกัดเวลา แผนการจัดการข้อมูล IRB ส่วนใหญ่ต้องการการลบหรือการเก็บรักษาที่ควบคุม — ผู้จำหน่ายวิเคราะห์ไม่ค่อยได้บันทึกเอกสารนี้อย่างชัดเจน

สิ่งที่พลิกไปตรงนี้

  1. 1สลับไปที่ โหมดค่อนข้างเป็นตัวตัด บนแบบฟอร์มงาน เราเก็บตัวเติม การเริ่มต้นเท็จ การทำซ้ำ และเครื่องหมายหัวเราะ — โหมดสะอาดเป็น opt-in ไม่ใช่ค่าเริ่มต้นสำหรับผู้วิจัย
  2. 2วาง คำศัพท์ codebook และชื่อเฉพาะ ของคุณเข้าในคำศัพท์ที่เป็นรูปแบบการ เราส่งข้อมูลเป็นคำแนะนำตัวจำเพาะ ไม่ใช่การแทนที่แบบยาก ดังนั้นบริบทยังคงชนะ
  3. 3เสียงถูกลบภายใน 24 ชั่วโมง หลังจากเสร็จสิ้นงาน แปลเสียงอยู่ในบัญชีของคุณ เราสามารถออกใบรับรองการลบสำหรับไฟล์ IRB ของคุณตามคำขอ

การตั้งค่างานที่แนะนำสำหรับการสัมภาษณ์วิจัย

วางบันทึกภาคสนามและการตั้งค่าเหล่านี้พลิกเปิดตามค่าเริ่มต้น ยกเลิกอายการทำงานต่องานจากแบบฟอร์ม

Mode
ค่อนข้างเป็นตัวตัด (ตัวเติม + การเริ่มต้นเท็จเปิด)
โรงแรมผู้พูด
สัมภาษณ์ · ผู้พูด 2–8 คน
ภาษา
ตรวจหาอัตโนมัติ · ยอมรับสำเนียง
Timestamps
ผู้พูดทุกคน
การเก็บรักษาเสียง
ลบภายใน 24 ชั่วโมง
ส่วนออก
DOCX (สไตล์ CAQDAS) · TXT · SRT

Accuracy · real-world numbers

ความแม่นยำ 94% บนการสัมภาษณ์ lavalier ที่สะอาด ตรงไปตรงมาเกี่ยวกับสิ่งที่ทำให้งานภาคสนามเสีย

เสียงภาคสนามคือกรณีที่ยากในการแปลเสียง — ห้องเปิด ภาษาอังกฤษที่มีสำเนียง เสียงพูดที่ทับซ้อนในกล่มสนทนา การสัมภาษณ์แบบ dyadic ไมค์ lavalier ถึงเพดาน; บันทึกภาคสนามรอบด้านและกล่มสนทนาขนาดใหญ่เสื่อมสภาพเร็วที่สุด ตัวเลขด้านล่างมาจากการอัปโหลดของผู้วิจัยจริง ไม่ใช่เกณฑ์มาตรฐานสังเคราะห์

95%
แบบ 1 ต่อ 1 ไมค์ lavalier หรือ USB

ห้องเงียบ ผู้พูด L2 เดี่ยวหรือเจ้าของ เครื่องบันทึกบนโต๊ะ กรณีที่ดีที่สุดสำหรับการสัมภาษณ์แบบกึ่งมีโครงสร้าง — การศึกษา dyadic ส่วนใหญ่อยู่ที่นี่

91%
เครื่องบันทึกแบบถือพอร์ต ผู้พูด 2–3 คน

Zoom H4n หรือเครื่องบันทึกโทรศัพท์ตรงกลางโต๊ะ เก้าอี้ผู้พูดระบุโดยทิศทาง วางแผนสำหรับการส่งผ่าน 5 นาที

85%
สัมภาษณ์ภาคสนาม เสียงรบกวนโดยรอบ

คาเฟ่ ตลาด การสัมภาษณ์ขณะเดิน เสียงโต้ตอบและการจราจรในพื้นหลังส่งผลต่อการตอบสั้นๆ การเปลี่ยนแปลงหลักยังคงสามารถเข้ารหัสได้

80%
กล่มสนทนา ผู้เข้าร่วม 5–8 คน

เสียงพูดทับซ้อนและไมค์ร่วม Diarization จะรวมเสียงบางส่วนที่เงียบกว่า — คาดว่าจะแยกแยะให้ชัดลงในเวลาเข้ารหัส

คำถามทั่วไป

8 สิ่งที่ผู้วิจัยถาม เกี่ยวกับการแปลเสียงสำหรับการวิจัย

01นี่เป็นที่ยอมรับตามแผนการจัดการข้อมูล IRB ทั่วไปหรือไม่+
แผนส่วนใหญ่ที่เราเห็นอนุมัติเราเมื่อพวกเขาอ่านข้อเท็จจริงสองประการ: เสียงถูกลบภายใน 24 ชั่วโมงหลังจากเสร็จสิ้นงาน และแปลเสียงอยู่เฉพาะในบัญชีของผู้วิจัยเท่านั้น เราไม่ใช่ IRB เอง — คณะกรรมการของคุณตัดสินใจขั้นสุดท้าย — แต่เราจะออกคำอธิบายการประมวลผลลายลักษณ์อักษรสำหรับโปรโตคอลของคุณตามคำขอ
02คุณเก็บเสียงการสัมภาษณ์ของฉันไว้หรือไม่+
ไม่ไฟล์เสียงจะ ถูกลบภายใน 24 ชั่วโมง หลังจากเสร็จสิ้นงาน มีเพียงแปลเสียงที่อยู่ในบัญชีของคุณเท่านั้น และคุณสามารถลบได้ตลอดเวลา เราไม่ใช้เสียงวิจัยเพื่อฝึกอบรมรุ่น
03คุณสามารถทำการแปลเสียงจริงแบบค่อนข้างเป็นตัวตัด — ด้วยตัวเติม การเริ่มต้นเท็จ และการทับซ้อน — สำหรับการวิเคราะห์การสนทนา+
ใช่พลิกโหมดค่อนข้างเป็��ตัวตัดบนแบบฟอร์มงาน และเราเก็บ "um" "uh" การทำซ้ำ การเริ่มต้นเท็จ และเครื่องหมายหัวเราะ การทับซ้อนจะทำเครื่องหมายด้วยสัญลักษณ์วงเล็บที่ขอบเขตหันด้าน เราไม่ได้ทำสัญกรณ์เจฟเฟอร์สันโดยอัตโนมัติ — นี่ยังคงเป็นการผ่านมนุษย์
04DOCX จะนำเข้าอย่างสะอาดลงใน NVivo, Atlas.ti หรือ MaxQDA หรือไม่+
ใช่ DOCX ของเราใช้หัวข้อและสไตล์ผู้พูดที่เครื่องมือแต่ละท่านคาดหวังสำหรับการเข้ารหัสอัตโนมัติตามผู้พูด ใน NVivo ใช้ไฟล์ → นำเข้า → แปลเสียง ใน Atlas.ti และ MaxQDA โครงสร้างย่อหน้าผู้พูดจะถูกอนุรักษ์ไว้ดังนั้นการเข้ารหัสอัตโนมัติตามผู้พูดจะได้ผลนอกกล่อง
05มันจัดการภาษาอังกฤษที่มีสำเนียงหรือการสัมภาษณ์พหุภาษาได้อย่างไร+
เราสนับสนุนภาษา 100+ ด้วยการตรวจหาอัตโนมัติ รวมถึงการเปลี่ยนรหัสภายในการบันทึกเดียว L2 สำเนียงหนักลงประมาณ 85–90% บนเสียงสะอาด สำหรับภาษาชนกลุ่มน้อยที่มีข้อมูลการฝึกอบรมแบบไม่หนาแน่น (เช่น ภาษาแอฟริกันและเจ้าของบ้านบางประเทศ) ความแม่นยำต่ำกว่าและเราพูดเช่นนั้นบนตัวเลือกภาษา
06กล่มสนทนา 6–8 คน — diarization จริง ๆ ได้ผลหรือไม่+
บางส่วน Acoustic diarization แยกเสียงที่แตกต่างกัน 4–5 เสียงบนไมค์ร่วมได้อย่างน่าเชื่อถือ นอกเหนือจากนั้น คาดว่าจะรวมผู้เข้าร่วมสองคนที่เงียบกว่า ทางแก้คือ rename pass ในตัวแก้ไขแปลเสียง — แปลเสียงกล่มสนทนาส่วนใหญ่ต้องการการทำความสะอาด 10–15 นาที
07Co-PI และนักศึกษาบัณฑิตศึกษาของฉันสามารถเข้าถึงแปลเสียงในโครงการเดียวกันได้หรือไม่+
ใช่ workspace รองรับโฟลเดอร์ที่ใช้ร่วมกันด้วยสิทธิ์ต่อผู้ใช้ — PI สามารถดูการสัมภาษณ์ทั้งหมด RAs ดูเฉพาะกลุ่มที่ได้รับมอบหมายของพวกเขา มีประโยชน์สำหรับการศึกษาหลายไซต์ที่คุณไม่ต้องการให้นักเรียนคนหนึ่งส่งออกข้อมูลของอีกคนหนึ่ง
08สำหรับเอกสารเผยแพร่คุณ้นประโยค โปรดทำการผ่านมนุษย์+
ยังไม่ มีและเราจะไม่แกล้งทำ สำหรับการอ้างอิงเข้าไปในวิทยานิพนธ์หรือบทความ คำแนะนำของเราคือ: เรียกใช้แปลเสียง AI ก่อนอื่น เข้ารหัสในเครื่องมือ CAQDAS ของคุณ จากนั้นแก้ไขด้วยมือ 30–60 วินาทีที่เฉพาะเจาะจงรอบการอ้างอิงแต่ละครั้งเทียบกับเสียงก่อนที่จะลบมัน นั่นคือขั้นต��นการทำงานส่วนใหญ่ของผู้ใช้วิจัยของเรา

อัปโหลดการสัมภาษณ์หนึ่งรายการ ดูว่าแปลเสียงจะถูกเข้ารหัส ตามวิธีที่คุณจะเข้ารหัสมันอย่างไร

30 นาทีฟรีทุกเดือน ไม่มีบัตร โหมดค่อนข้างเป็นตัวตัด ภาษา 100+ DOCX พร้อมใช้กับ CAQDAS เสียงถูกลบใน 24 ชั่วโมง

เริ่มฟรี