अकादमिक शोधकर्ताओं के लिए ट्रांसक्रिप्शन।IRB-aware, CAQDAS-ready, 100+ भाषाएं।

एक रिसर्च इंटरव्यू या फोकस ग्रुप रिकॉर्डिंग ड्रॉप करें। स्पीकर-लेबल, टाइमस्टैम्पड टेक्स्ट पाएं जो NVivo, Atlas.ti या MaxQDA के लिए तैयार हो — ऑडियो 24 घंटों में हटा दी जाएगी।

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ देखें कि क्या निकलता है

फील्ड रिकॉर्डिंग इन। कोडिंग-रेडी ट्रांसक्रिप्ट आउट।

हम हर प्रतिभागी टर्न को शुरुआत में टाइमस्टैम्प के साथ मार्क करते हैं, अगर आप चाहें तो फिलर वर्ड रखते हैं, और DOCX निर्यात करते हैं जिसमें स्पीकर स्टाइल हों जो आपका CAQDAS टूल पहचानता है।

सेमी-स्ट्रक्चर्ड इंटरव्यू · .wavREC 2 स्पीकर · 1:08:24
ऑटो-डिटेक्टेड en-GB44.1 kHz mono · लैवलियर माइक
~90s
ट्रांसक्रिप्ट · स्ट्रीमिंग94% एक्यूरेसी · वर्बेटिम मोड
S1

क्या आप मुझे बता सकते हैं कि आपने पड़ोस में पहली बार बदलाव कब महसूस किया?

S2

उम, शायद 2019 था — कोने की बेकरी बंद हुई, और हां, तब मुझे जगा।

S1

और यह देखते हुए कैसा लगा कि यह उन महीनों में घट रहा है?

S2

सच कहूं तो? जैसे जगह जिसे मैं तीस साल से जानता था, वह टुकड़े-टुकड़े गायब हो रही थी।

लैवलियर इंटरव्यू पर 94%DOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

तीन असली विकल्प · ईमानदार तुलना

Rev मानव। NVivo Transcription। या हम।

Rev की मानव सेवा डिसर्टेशन-ग्रेड उद्धरणों के लिए ऐतिहासिक डिफ़ॉल्ट है। NVivo CAQDAS टूल के अंदर AI ट्रांसक्रिप्शन बंडल करता है। हम बीच में बैठते हैं — Rev से तेज़, NVivo के बिल्ट-इन से ज्यादा एक्यूरेट और IRB-फ्रेंडलियर।

Option 01

Rev (मानव ट्रांसक्रिप्शन)

मनुष्य इसे टाइप करत��� हैं। धीमा, महंगा, लेकिन प्रकाशन योग्य वर्बेटिम का सोना मानक।

टर्नअराउंड12–24 घंटे (सामान्य)
कॉस्ट · प्रति मिनट$1.50 मानव / $0.25 AI
स्पीकर लेबलहां, मैन्युअली प्लेस किया गया
ऑडियो रिटेंशनRev सर्वर पर स्टोर किया गया
भाषाएंEN मानव · ~30 AI
CAQDAS निर्यातDOCX, TXT (मैन्युअल)
Best forसिंगल हाई-स्टेक्स इंटरव्यूज़ जो प्रकाशित पेपर में सीधे उद्धरण के लिए हैं, जहां बजट बाधा नहीं है।
Option 02

Transcription.Solutions

मिनटों में AI ट्रांसक्रिप्ट, 24 घंटों में ऑडियो हटा दी, DOCX को NVivo और Atlas.ti इम्पोर्ट के लिए स्टाइल किया।

टर्नअराउंड~5 मिनट 60-मिनट फ़ाइल के लिए
कॉस्ट · प्रति मिनट$0.03
स्पीकर लेबलडायराइज़्ड, ऐप में रीनेम करें
ऑडियो रिटेंशन24 घंटों के अंदर हटा दिया
भाषाएं100+, ऑटो-डिटेक्टेड
CAQDAS निर्यातDOCX हेडिंग स्टाइल + TXT
Best forशोधकर्ता जो 20+ इंटरव्यूज़ चला रहे हैं और तेज़ फर्स्ट-पास ट्रांसक्रिप्ट चाहते हैं, फिर प्रकाशन के लिए उद्देश्य 5% उद्धरणों को हाथ से सही करें।
Option 03

NVivo Transcription / Otter

आपके CAQDAS टूल या नोट-टेकर के अंदर बंडल किया गया AI ट्रांसक्रिप्शन। सुविधाजनक, EN-लीनिंग, कम कंट्रोल।

टर्नअराउंडतुलनीय (AI)
कॉस्टक्रेडिट पैक्स · ~$0.30/मिनट
स्पीकर लेबलएकॉस्टिक, EN-ट्यून्ड
ऑडियो रिटेंशनसबस्क्रिप्शन से बंधा
भाषाएंगैर-EN एक्यूरेसी ड्रॉप होती है
CAQDAS निर्यातकेवल NVivo के लिए नेटिव
Best forसोलो PhD स्टूडेंट्स जो एक CAQDAS ईकोसिस्टम के अंदर पूरी तरह अंग्रेज़ी में काम कर रहे हैं और एक बिल चाहते हैं।

प्राइसिंग और फीचर फ्लैग्स 2026 तक एक्यूरेट हैं। Rev का AI/मानव स्प्लिट और NVivo Transcription क्रेडिट प्राइसिंग क्षेत्र और एकेडमिक लाइसेंसिंग के अनुसार अलग-अलग होते हैं।

क्वालिटेटिव रिसर्च के लिए स्पेसिफिक

तीन चीजें जो शोधकर्ताओं को सामान्य ट्रांसक्रिप्शन टूल पर काटती हैं।

अपलोड करने से पहले सही सेटिंग्स फ्लिप करें और ट्रांसक्रिप्ट सीधे आपके CAQDAS प्रोजेक्ट में इम्पोर्ट होगा।

क्या गलत होता है

  1. 1फिलर वर्ड्स साइलेंटली स्ट्रिप किए जाते हैं। जेनेरिक AI "um", "like", फॉल्स स्टार्ट्स निकाल देते हैं — मीटिंग नोट्स के लिए ठीक है, कनवरसेशन एनालिसिस के लिए फेटल है।
  2. 2डोमेन टर्मिनोलॉजी (थ्योरेटिकल फ्रेमवर्क्स, ड्रग नेम्स, प्लेस नेम्स, किनशिप टर्म्���) फोनेटिकली ट्रांसक्राइब किए जाते हैं। कोडिंग को फाइंड-एंड-रिप्लेस पास की जरूरत होती है।
  3. 3ऑडियो वेंडर के सर्वर पर बैठा रहता है अनिश्चितकाल तक। अधिकांश IRB डेटा मैनेजमेंट प्लान डिलीशन या कंट्रोल्ड रिटेंशन की जरूरत करते हैं — वेंडर्स यह दस्तावेज़ दुर्लभ ही करते हैं।

यहां क्या फ्लिप करें

  1. 1Verbatim मोड पर स्विच करें जॉब फॉर्म पर। हम फिलर्स, फॉल्स स्टार्ट्स, रीपिटिशन्स और लाफ मार्कर्स रखते हैं — क्लीन मोड ऑप्ट-इन है, शोधकर्ताओं के लिए डिफ़ॉल्ट नहीं।
  2. 2अपनी कोडबुक टर्म्स और प्रॉपर नाउन्स Custom vocabulary में पेस्ट करें। हम इसे recognizer hint के रूप में पास करते हैं, हार्ड सबस्टिट्यूशन नहीं, तो कॉन्टेक्स्ट अभी भी जीतता है।
  3. 3ऑडियो 24 घंटों के अंदर हटा दिया जाता है जॉब कंपलीशन के। ट्रांसक्रिप्ट आपके अकाउंट में रहता है। हम आपके IRB फाइल के लिए रिक्वेस्ट पर डिलीशन कन्फर्मेशन दे सकते हैं।

रिसर्च इंटरव्यूज़ के लिए अनुशंसित जॉब सेटिंग्स

एक फील्ड रिकॉर्डिंग ड्रॉप करें और ये डिफ़ॉल्ट पर चालू हो जाते हैं। फॉर्म से जॉब-दर-जॉब ओवरराइड करें।

मोड
Verbatim (फिलर्स + फॉल्स स्टार्ट्स चालू)
स्पीकर मॉडल
इंटरव्यू · 2–8 स्पीकर्स
भाषा
ऑटो-डिटेक्ट · एक्सेंट-टॉलरेंट
टाइमस्टैम्प्स
हर स्पीकर टर्न
ऑडियो रिटेंशन
24 घंटों में हटाएं
निर्यात
DOCX (CAQDAS स्टाइल्स) · TXT · SRT

Accuracy · real-world numbers

एक स्वच्छ लैवलियर इंटरव्यू पर 94%। यह ईमानदार कहना कि फील्डवर्क क्या तोड़ता है।

फील्ड ऑडियो ट्रांसक्रिप्शन में कठिन केस है — खुली जगहें, एक्सेंटेड अंग्रेज़ी, फोकस ग्रुप में ओवरलैपिंग स्पीच। लैवलियर-माइक डाइडिक इंटरव्यूज़ सीलिंग हिट करते हैं; एम्बिएंट फील्ड रिकॉर्डिंग और बड़े फोकस ग्रुप सबसे तेज़ी से डिग्रेड होते हैं। नीचे की संख्याएं सिंथेटिक बेंचमार्क्स नहीं, वास्तविक शोधकर्ता अपलोड्स से आती हैं।

95%
1-ऑन-1, लैवलियर या USB माइक

शांत कमरा, सिंगल L2 या नेटिव स्पीकर, टेबल पर रिकॉर्डर। सेमी-स्ट्रक्चर्ड इंटरव्यूज़ के लिए सर्वश्रेष्ठ केस — अधिकांश डाइडिक स्टडीज़ यहां उतरती हैं।

91%
हैंडहेल्ड रिकॉर्डर, 2–3 स्पीकर्स

Zoom H4n या फोन रिकॉर्डर मिड-टेबल। स्पीकर चेयर्स डायरेक्शन से आइडेंटिफाई किए जाते हैं। 5-मिनट रीलेबल पास प्लान करें।

85%
फील्ड इंटरव्यू, एम्बिएंट नॉइज़

कैफे, मार्केट, वॉकिंग इंटरव्यू। बैकग्राउंड चैटर और ट्रैफिक शॉर्ट रिस्पांसेस को प्रभावित करते हैं; मेन टर्न्स कोडेबल रहते हैं।

80%
फोकस ग्रुप, 5–8 प्रतिभागी

ओवरलैपिंग स्पीच और शेयर्ड माइक। डायराइज़ेशन कुछ शांत आवाज़ों को मर्ज करेगा — कोडिंग समय पर डिस्एम्बिगुएट करने की उम्मीद करें।

सामान्य प्रश्न

8 चीजें जो शोधकर्ता अकादमिक ट्रांसक्रिप्शन के बारे में पूछते हैं।

01क्या यह एक सामान्य IRB डेटा मैनेजमेंट प्लान के तहत स्वीकार्य है?+
अधिकांश प्लान्स जो हमने देखे हैं हमें स्वीकार करते हैं जब वे दो तथ्य पढ़ते हैं: ऑडियो जॉब कंपलीशन के 24 घंटें के अंदर हटा दिया जाता है, और ट्रांसक्रिप्ट केवल शोधकर्ता के अकाउंट में रहते हैं। हम खुद एक IRB नहीं हैं — आपका बोर्ड फाइनल कॉल करता है — लेकिन हम आपके प्रोटोकॉल के लिए रिक्वेस्ट पर एक लिखित प्रोसेसिंग डिस्क्रिप्शन जारी करेंगे।
02क्या आप मेरी इंटरव्यू ऑडियो रखते हो?+
नहीं। ऑडियो फाइल 24 घंटों के अंदर हटा दी जाती है जॉब समाप्त होने के। केवल ट्रांसक्रिप्ट आपके अकाउंट में रहता है, और आप इसे कभी भी हटा सकते हैं। हम मॉडल्स को ट्रेन करने के लिए रिसर्च ऑडियो का उपयोग नहीं करते हैं।
03क्या आप सच में वर्बेटिम कर सकते हैं — फिलर्स, फॉल्स स्टार्ट्स और ओवरलैप्स के साथ — कनवरसेशन एनालिसिस के लिए?+
हां। जॉब फॉर्म पर Verbatim मोड टॉगल करें और हम "um", "uh", रीपिटिशन्स, ��ॉल्स स्टार्ट्स और लाफ टोकन्स रखते हैं। ओवरलैप को टर्न बाउंड्री पर एक ब्रेस सिंबल के साथ मार्क किया जाता है। हम Jefferson नोटेशन ऑटोमेटिकली नहीं करते — वह अभी एक ह्यूमन पास है।
04क्या DOCX NVivo, Atlas.ti या MaxQDA में साफ-सुथरा इम्पोर्ट होगा?+
हां। हमारा DOCX हेडिंग और स्पीकर स्टाइल्स यूज़ करता है जो हर टूल ऑटो-कोडिंग स्पीकर के लिए एक्सपेक्ट करता है। NVivo में, File → Import → Transcripts यूज़ करें। Atlas.ti और MaxQDA में, स्पीकर-पैराग्राफ स्ट्रक्चर प्रिज़र्व किया जाता है तो स्पीकर के लिए ऑटोकोडिंग बॉक्स से बाहर काम करती है।
05यह एक्सेंटेड अंग्रेज़ी या मल्टीलिंगुअल इंटरव्यूज़ कैसे हैंडल करता है?+
हम 100+ भाषाएं सपोर्ट करते हैं ऑटो-डिटेक्शन के साथ, एक सिंगल रिकॉर्डिंग के अंदर कोड-स्विचिंग सहित। हेवी L2 एक्सेंट्स साफ ऑडियो पर 85–90% के आसपास पहुंचते हैं। स्पार्स ट्रेनिंग डेटा वाली माइनॉरिटी भाषाओं के लिए (जैसे कुछ अफ्रीकन और इंडिजिनस भाषाएं), एक्यूरेसी कम है और हम लैंग्वेज पिकर पर बताते हैं।
066–8 लोगों के फोकस ग्रुप्स — क्या डायराइज़ेशन वाकई काम करता है?+
आंशिक रूप से। एकॉस्टिक डायराइज़ेशन 4���5 डिस्टिंक्ट वॉयसेस को शेयर्ड माइक पर विश्वसनीयता से अलग करता है। उससे आगे, एक्सपेक्ट करें कि मॉडल सबसे शांत दो प्रतिभागियों को मर्ज करे। फिक्स ट्रांसक्रिप्ट एडिटर में एक रीनेम पास है — अधिकांश फोकस ग्रुप ट्रांसक्रिप्ट्स को 10–15 मिनट क्लीनअप की जरूरत है।
07क्या मेरे को-PI और ग्रैड स्टूडेंट्स एक ही प्रोजेक्ट में ट्रांसक्रिप्ट्स एक्सेस कर सकते हैं?+
हां। वर्कस्पेस शेयर्ड फोल्डर्स सपोर्ट करते हैं प्रति-यूज़र परमिशन्स के साथ — PI सभी इंटरव्यूज़ देख सकते हैं, RAs केवल उनके असाइन्ड कोहोर्ट देखते हैं। मल्टी-साइट स्टडीज़ के लिए उपयोगी जहां आप एक स्टूडेंट को दूसरे का डेटा एक्सपोर्ट नहीं करना चाहते हैं।
08पब्लिकेशन-ग्रेड डायरेक्ट उद्धरणों के लिए, क्या आप एक ह्यूमन पास ऑफर करते हो?+
अभी नहीं, और हम प्रिटेंड नहीं करेंगे कि करते हैं। थीसिस या आर्टिकल में जाने वाले उद्धरणों के लिए, हमारी रिकमेंडेशन है: पहले AI ट्रांसक्रिप्ट रन करें, स्पीकर CAQDAS टूल में कोड करें, फिर हर उद्धरण के आसपास स्पेसिफिक 30–60 सेकंड हाथ से सही करें ऑडियो के विरुद्ध इसके हटाए जाने से पहले। वह वर्क���़्लो है अधिकांश हमारे शोधकर्ता यूज़र्स यूज़ करते हैं।

एक इंटरव्यू अपलोड करें। देखें कि क्या ट्रांसक्रिप्ट आपकी तरह कोड करता है।

हर महीने 30 फ्री मिनट। कोई कार्ड नहीं। Verbatim मोड, 100+ भाषाएं, CAQDAS-रेडी DOCX, ऑडियो 24 घंटों में हटा दिया।

फ्री शुरू करें