एपिसोड → show notes → भेज दिया
एक लंबा इंटरव्यू 5-लाइन का summary, चार chapters, speaker labels वाला ट्रांसक्रिप्ट, और short-form clips के लिए SRT बन जाता है — एक job, हर output जो आप असल में ship करते हैं।
VTT · DOCX · PDF
ऑडियो और वीडियो के लिए speech-to-text और AI ट्रांसक्रिप्शन सॉफ़्टवेयर। MP3, MP4 या आवाज़ को टेक्स्ट में बदलें — स्पीकर लेबल और AI summary के साथ, अक्सर realtime से भी तेज़।
मुफ़्त plan: हर महीने 30 मिनट, हर फ़ाइल 30 मिनट तक। कार्ड की ज़रूरत नहीं।
Tabs काम करते हैं। Action items toggle होते हैं। Job पूरी होने पर आपके account में बिल्कुल यही लोड होता है — वही layout, वही कंट्रोल्स।
Founders को कॉल के बाद कंटेंट चाहिए, सिर्फ़ ट्रांसक्रिप्ट नहीं। टूल्स उन्हें 5 ऐप्स जोड़ने पर मजबूर करते हैं।
साफ़ टेक्स्ट dump · सभी plans
Timestamp वाला subtitle · सभी plans में
स्पीकर हेडर + समरी · सभी प्लान में
Public schema · API workflows के लिए · सभी plans
HTML5 वीडियो प्लेयर फ़ॉर्मैट · सभी प्लान्स में
स्पीकर हेडर + टाइमस्टैम्प · सभी प्लान्स में
प्रिंट-रेडी · summary और स्पीकर · सभी plans में
किसी भी आउटपुट पर hover या टैप करें और देखें वो असल में कैसा दिखता है। बीच में वही 30-सेकंड का पॉडकास्ट क्लिप, उससे निकले आठ आउटपुट।
en-GB अंग्रेज़ी (UK)0.6%en-AU अंग्रेज़ी (AU)0.2%हर हफ़्ते दिखने वाले तीन पैटर्न। पाइपलाइन वही रहती है — बदलता है वो जो आप उसके बाद डिलीवर करते हैं।
एक लंबा इंटरव्यू 5-लाइन का summary, चार chapters, speaker labels वाला ट्रांसक्रिप्ट, और short-form clips के लिए SRT बन जाता है — एक job, हर output जो आप असल में ship करते हैं।
तीन घंटे की Zoom रिकॉर्डिंग, दो आवाज़ें, एंड-टू-एंड। Pro पर स्पीकर डायराइज़ेशन। DOCX एक्सपोर्ट से टाइमस्टैम्प के साथ साइटेशन। "उन्होंने ये कब कहा था…" वाली स्क्रबिंग ख़त्म।
न ऑटो-जॉइन, न कैलेंडर परमिशन, न "आपकी मीटिंग में बैठा कोई एजेंट।" रिकॉर्डिंग ड्रॉप कीजिए, ट्रांसक्रिप्ट शेयर कीजिए। काम के पॉइंट्स निकाले हुए, नाम के साथ, ट्राइएज के लिए तैयार।
अंदर आने के छह रास्ते, आज ही चालू। हर pill एक असली ingest path है जो अभी प्रोडक्शन में चल रहा है।
सभी plans में diarization-क्वालिटी ASR शामिल है। ऊँचे tier पर बड़ी फ़ाइलें, queue priority और AI summary मिलते हैं।
ट्राई करने, कभी-कभार के काम, छोटे क्लिप्स के लिए।
उनके लिए जो इंटरव्यू, podcast, या लम्बे-फ़ॉर्मेट का काम लगातार करते हैं।
Volume पर चलने वाली टीमों, agencies और ops के लिए।
सालाना बिलिंग पर बचत 50% · रिफ़ंड पॉलिसी · Free के लिए कार्ड ज़रूरी नहीं
वही ऑडियो, वही मॉडल। फ़र्क इसमें है कि ट्रांसक्रिप्शन के बाद हम क्या-क्या करते हैं।
तो फ़ाउंडर्स से जो बात बार-बार सुनने को मिल रही है, वो है कच्ची रिकॉर्डिंग और जो कंटेंट वे असल में शिप कर सकें — उसके बीच का गैप। एकदम सही, किसी को और एक ट्रांसक्रिप्ट नहीं चाहिए, उन्हें कॉल ख़त्म होते-होते show notes, एक क्लिप, एक ब्लॉग ड्राफ़्ट चाहिए। हाँ, और अभी की tooling आपको वहाँ पहुँचने के लिए पाँच ऐप जोड़ने पर मजबूर करती है। एक pipeline, एक जगह। यही दाँव है। हम महीनों से यही पैटर्न देख रहे हैं — ऑडियो साफ़ आता है, लेकिन आगे का workflow स्क्रीनशॉट और Notion, Otter, Zapier के बीच copy-paste के सहारे चल रहा है और कॉल ख़त्म होने पर जो भी टैब खुला हो, और डेडलाइन बीस मिनट में…
आगे: कहीं पेस्ट करो, structure बनाओ, summary खुद लिखो, action items हाथ से निकालो।
फ़ाउंडर्स को ट्रांसक्रिप्ट नहीं चाहिए — पोस्ट-प्रोसेसिंग चाहिए। पाँच ऐप जोड़ने से अच्छा है एक पाइपलाइन।
आगे: TL;DR को Slack में पेस्ट करें, DOCX ईमेल से अटैच करें, क्लिप शिप करें। कॉल नोट्स ठंडे होने से पहले काम ख़त्म।
— वही ऑडियो · वही मॉडल · फ़र्क़ है पोस्ट-प्रोसेसिंग में —
साइन-इन यूज़र्स की बिना माँगे आई समीक्षाएँ। हम review-incentive कैम्पेन नहीं चलाते। रोकने के लिए hover करें।
एक एपिसोड भेजने के लिए podcaster 5 tab खोलता है। एक job अंदर — शो नोट्स, ट्रांसक्रिप्ट, क्लिप के लिए तैयार SRT बाहर। बस इतना।
14 लंबे इंटरव्यू, डायराइज़ेशन के साथ। DER 0.95 साफ़ ऑडियो पर बिल्कुल असली है। DOCX एक्सपोर्ट सीधे पेपर ड्राफ़्ट में जाता है।
26 वॉइस मेमो। 3 TikTok लिंक। न्यूज़लेटर ड्राफ़्ट का आउटलाइन, 11 मिनट। Otter में ऐसा करके दिखाओ — मैं इंतज़ार कर रहा हूँ।
एक एपिसोड भेजने के लिए podcaster 5 tab खोलता है। एक job अंदर — शो नोट्स, ट्रांसक्रिप्ट, क्लिप के लिए तैयार SRT बाहर। बस इतना।
14 लंबे इंटरव्यू, डायराइज़ेशन के साथ। DER 0.95 साफ़ ऑडियो पर बिल्कुल असली है। DOCX एक्सपोर्ट सीधे पेपर ड्राफ़्ट में जाता है।
26 वॉइस मेमो। 3 TikTok लिंक। न्यूज़लेटर ड्राफ़्ट का आउटलाइन, 11 मिनट। Otter में ऐसा करके दिखाओ — मैं इंतज़ार कर रहा हूँ।
Webhook + action-items एक्सट्रैक्शन ने हमारा हर हफ़्ते का recap-doc वाला झंझट ख़त्म कर दिया। पूरा loop है 2 मिनट अभी।
Deposition recordings → diarized ट्रांसक्रिप्ट → साइटेशन के साथ PDF। पहले यह बाहर outsource करते थे। अब यह एक अपलोड.
इतालवी सेल्स कॉल्स → अंग्रेज़ी समरी। मेरी टीम आख़िरकार उन्हें पढ़ता है। छोटी सी बात, बड़ा फ़र्क़।
Webhook + action-items एक्सट्रैक्शन ने हमारा हर हफ़्ते का recap-doc वाला झंझट ख़त्म कर दिया। पूरा loop है 2 मिनट अभी।
Deposition recordings → diarized ट्रांसक्रिप्ट → साइटेशन के साथ PDF। पहले यह बाहर outsource करते थे। अब यह एक अपलोड.
इतालवी सेल्स कॉल्स → अंग्रेज़ी समरी। मेरी टीम आख़िरकार उन्हें पढ़ता है। छोटी सी बात, बड़ा फ़र्क़।
जापानी ऑटो-डिटेक्ट बस काम करता है. वैसे, इस साइट का serif italic एक अलग ही डिज़ाइन-अपराध है, जिसका मैं सम्मान करता हूँ।
REST API + per-key rate-limit = हमारी अंदरूनी voice-memo पाइपलाइन। लगा 30 मिनट तक सब सेट। पूरी टीम के लिए $19/महीना।
24 घंटे में auto-delete — यही वो फ़ीचर है जो मुझे मुझे पता ही नहीं था कि मुझे चाहिए था जब तक मैंने हर competitor का privacy पेज नहीं पढ़ लिया।
जापानी ऑटो-डिटेक्ट बस काम करता है. वैसे, इस साइट का serif italic एक अलग ही डिज़ाइन-अपराध है, जिसका मैं सम्मान करता हूँ।
REST API + per-key rate-limit = हमारी अंदरूनी voice-memo पाइपलाइन। लगा 30 मिनट तक सब सेट। पूरी टीम के लिए $19/महीना।
24 घंटे में auto-delete — यही वो फ़ीचर है जो मुझे मुझे पता ही नहीं था कि मुझे चाहिए था जब तक मैंने हर competitor का privacy पेज नहीं पढ़ लिया।
साफ़ ऑडियो में, एक या दो speakers के साथ, ज़्यादातर बड़ी भाषाओं में accuracy 95%+ तक पहुँचती है। background noise, भारी accent, या ओवरलैपिंग बातचीत में क्वालिटी गिरती है।
100+ भाषाएँ, ऑटो-डिटेक्ट के साथ। अगर ऑटो-डिटेक्ट गलत भाषा चुने तो आप कोई एक भाषा फ़ोर्स भी कर सकते हैं। UI सिर्फ़ अंग्रेज़ी में है — मल्टी-लैंग्वेज इंटरफ़ेस प्लान में है।
आपकी सोर्स मीडिया (अपलोड किया ऑडियो/वीडियो) ट्रांसक्रिप्शन ख़त्म होने के 24 घंटे के अंदर हमारे infrastructure से हटा दी जाती है। Transcript और summary आपके अकाउंट में तब तक रहते हैं जब तक आप उन्हें ख़ुद न हटाएँ — या अकाउंट बंद करने के 30 दिन बाद। हमारे speech-to-text providers (AssemblyAI primary, OpenAI fallback) ऑडियो को अपनी retention पॉलिसी के तहत प्रोसेस करते हैं — देखें /privacy पूरी subprocessor लिस्ट के लिए।
नहीं। हमारे upstream ASR provider के paid endpoints पर training opt-out डिफ़ॉल्ट है — हम वही इस्तेमाल करते हैं। ऊपर से हम कुछ नहीं जोड़ते: न आपके transcripts पर ट्रेन किया अपना कोई मॉडल, न कोई छुपा हुआ analytics।
आपके मिनट नहीं कटते। ज़्यादातर फेल्योर (प्राइवेट URL, बहुत लंबी फ़ाइल, सपोर्ट न करने वाला कोडेक) के साथ साफ़ एरर मैसेज और रिट्राई गाइडेंस मिलती है।
हाँ — Stripe कस्टमर पोर्टल से कभी भी। आपका प्लान पेड पीरियड तक चलता रहेगा, और अगली रिन्यूअल तारीख़ पर Free पर आ जाएगा।
अगर आपने अपने plan के 10% मिनट से कम इस्तेमाल किए हैं तो 7 दिन के अंदर पूरा रिफ़ंड। उसके बाद, बचे हुए हिस्से का प्रो-रेटा रिफ़ंड। support@transcription.solutions पर ईमेल करें।
हाँ — REST API लाइव है, webhooks भी। API key auth अगली लिस्ट में है। Rate limits हर plan के हिसाब से। अकाउंट बनने के बाद डॉक्स /docs/api पर मिलेंगे।
कोई SOC 2 स्टिकर नहीं। जो control अभी नहीं है, उस पर हम badge नहीं लगाते।
आपका अपलोड किया ऑडियो और वीडियो job पूरा होने के 24 घंटे के अंदर हट जाता है। पक्का कॉन्ट्रैक्ट, कोई setting नहीं।
हमारा ASR provider डिफ़ॉल्ट रूप से training opt-out देता है — हम वही endpoints इस्तेमाल करते हैं। ऊपर से कुछ नहीं जोड़ते।
एन्क्रिप्शन — रेस्ट पर भी और ट्रांज़िट में भी, पहले दिन से। HSTS एनफ़ोर्स्ड।
EU access / deletion / portability अधिकार माने जाते हैं। DPA माँगने पर।
Settings → Delete account। पूरा डेटा 30 दिनों के अंदर मिटा दिया जाता है। सपोर्ट टिकट खोलने की ज़रूरत नहीं।
मक़सद के साथ पूरी वेंडर लिस्ट यहाँ /privacy। कोई छुपा हुआ vendor नहीं।
हर महीने 30 मुफ़्त मिनट, हर फ़ाइल 30 मिनट तक। न क्रेडिट कार्ड, न ट्रायल के बाद कार्ड, न कोई शर्त। कोई भी plan कभी भी एक क्लिक में बंद करें।