एपिसोड → शो नोट्स → शिप केलं
लांब interview चं 5-ओळींचं summary, चार chapters, speaker labels असलेला transcript आणि short-form clips साठी SRT — एकच job, तुम्हाला हवे ते सगळे outputs.
VTT · DOCX · PDF
ऑडिओ आणि व्हिडिओसाठी स्पीच-टू-टेक्स्ट आणि AI ट्रान्सक्रिप्शन सॉफ्टवेअर. MP3, MP4 किंवा आवाजाचं मजकुरात रूपांतर — वक्ता लेबल्स आणि AI सारांशासह, बहुतेक वेळा रिअलटाइमपेक्षा वेगाने.
विनामूल्य प्लॅन: महिन्याला ३० मिनिटं, प्रति फाइल ३० मिनिटांपर्यंत. कार्ड लागत नाही.
Tabs चालतात. कामांचा toggle चालतो. Job संपल्यावर तुमच्या account मध्ये नेमकं हेच load होतं — तोच layout, तेच controls.
Founders ना call नंतरचा content हवा असतो, नुसते transcripts नाही. Tools त्यांना 5 apps जोडायला भाग पाडतात.
स्वच्छ text dump · सर्व plans मध्ये
टाइमस्टॅम्पसह सबटायटल · सर्व प्लॅन्स
स्पीकर हेडर्स + सारांश · सर्व प्लॅन्समध्ये
Public schema · API workflows साठी · सर्व plans मध्ये
HTML5 व्हिडिओ प्लेयर फॉरमॅट · सर्व प्लॅन्समध्ये
स्पीकर हेडर्स + टाइमस्टॅम्प्स · सर्व प्लॅन्समध्ये
प्रिंट-रेडी · सारांश आणि स्पीकर्स · सर्व प्लॅन्समध्ये
कोणत्याही आउटपुटवर हॉव्हर करा किंवा टॅप करा — प्रत्यक्षात कसं दिसतं ते बघा. मध्यभागी तोच ३० सेकंदांचा पॉडकास्ट क्लिप, त्यातून तयार झालेले आठ आउटपुट.
en-GB इंग्रजी (UK)0.6%en-AU इंग्रजी (AU)0.2%दर आठवड्याला दिसणारे तीन पॅटर्न. पाइपलाइन तीच राहते — त्यानंतर तुम्ही काय शिप करता तेच बदलतं.
लांब interview चं 5-ओळींचं summary, चार chapters, speaker labels असलेला transcript आणि short-form clips साठी SRT — एकच job, तुम्हाला हवे ते सगळे outputs.
दोन आवाजांच्या तीन-तासांच्या Zoom रेकॉर्डिंग्ज, सुरुवातीपासून शेवटपर्यंत. Pro वर स्पीकर डायरायझेशन. DOCX एक्स्पोर्टमधून टाइमस्टॅम्पनुसार साइट करा. "त्यांनी ते नक्की कुठे म्हटलं होतं…" म्हणत स्क्रब करण्याची गरज नाही.
ऑटो-जॉइन नाही, कॅलेंडर परवानग्या नाहीत, मीटिंगमध्ये कुठलाही "एजंट" नाही. रेकॉर्डिंग टाका, ट्रान्सक्रिप्ट शेअर करा. काय करायचं ते मुद्दे काढलेले, नावांसह, ट्रायाजसाठी तयार.
आत येण्याचे सहा मार्ग, आजच कार्यरत. प्रत्येक पिल हा प्रॉडक्शनमध्ये आत्ता चालू असलेला खराखुरा इनगेस्ट पाथ आहे.
सर्व प्लॅन्समध्ये diarization-दर्जाचं ASR मिळतं. वरच्या प्लॅन्समध्ये मोठ्या फाइल्स, क्यू प्रायोरिटी आणि AI सारांश मिळतो.
ट्राय करायला, अधूनमधून एखादी फाइल, छोटे क्लिप्स.
मुलाखती, पॉडकास्ट किंवा वारंवार लांब काम करणाऱ्यांसाठी.
Volume वर चालणाऱ्या teams, agencies आणि ops साठी.
वार्षिक billing वर बचत 50% · रिफंड पॉलिसी · Free साठी कार्ड नको
तोच ऑडिओ, तोच मॉडेल. फरक आहे — ट्रान्सक्रिप्शन झाल्यानंतर आम्ही जे काही करतो त्यात.
तर मला फाउंडर्सकडून सतत हेच ऐकायला मिळतंय — कच्च्या रेकॉर्डिंग आणि प्रत्यक्ष शिप करता येणारा कंटेंट यांच्यात मोठी दरी आहे. अगदी बरोबर, कोणालाच आणखी एक ट्रान्सक्रिप्ट नकोय — कॉल संपेपर्यंत त्यांना शो नोट हवीय, क्लिप हवीय, ब्लॉगचा ड्राफ्ट हवाय. हो, आणि सध्याची साधनं तुम्हाला तिथपर्यंत पोहोचण्यासाठी पाच अॅप्स जोडायला लावतात. एक पाइपलाइन, एक ठिकाण. हाच आमचा डाव. हे पॅटर्न आम्ही महिन्यानुहिने पाहतोय — ऑडिओ स्वच्छ येतो, पण पुढचा वर्कफ्लो म्हणजे Notion, Otter आणि Zapier मध्ये स्क्रीनशॉट आणि कॉपी-पेस्टने जोडलेली एक भेळ कॉल संपताना दुसऱ्या टॅबमध्ये जे काही उघडं असेल ते… आणि डेडलाइन वीस मिनिटांवर…
पुढे: कुठेतरी paste करा, नीट लावा, summary स्वतः लिहा, कामं हाताने काढा.
फाउंडर्सना ट्रान्सक्रिप्ट नको — पोस्ट-प्रोसेसिंग हवं. पाच अॅप्स जोडण्यापेक्षा एक पाइपलाइन बरी.
पुढे: TL;DR Slack मध्ये पेस्ट, DOCX ईमेलला अटॅच, क्लिप शिप. कॉलच्या नोट्स थंड व्हायच्या आधीच काम झालं.
— तोच ऑडिओ · तेच मॉडेल · फरक आहे पोस्ट-प्रोसेसिंगमध्ये —
साइन-इन केलेल्या यूझर्सकडून आपोआप आलेली रिव्ह्यूज. आम्ही रिव्ह्यू-इन्सेन्टिव्ह कॅम्पेन चालवत नाही. थांबवायचं असेल तर होव्हर करा.
एक एपिसोड शिप करायला पॉडकास्टर 5 टॅब उघडतो. एकच काम टाका — शो नोट्स, ट्रान्सक्रिप्ट, क्लिप-रेडी SRT बाहेर. बस्स एवढंच.
१४ लांब मुलाखती, स्पीकरनुसार वेगळ्या केलेल्या. DER 0.95 क्लिअर ऑडिओवरची अचूकता खरोखर आहे. DOCX एक्स्पोर्ट थेट पेपरच्या ड्राफ्टमध्ये जातो.
२६ व्हॉइस मेमो. ३ TikTok लिंक्स. न्यूजलेटरचा ड्राफ्ट आउटलाइन — ११ मिनिटं. Otter ने हे जमवून दाखवा — मी थांबलोय.
एक एपिसोड शिप करायला पॉडकास्टर 5 टॅब उघडतो. एकच काम टाका — शो नोट्स, ट्रान्सक्रिप्ट, क्लिप-रेडी SRT बाहेर. बस्स एवढंच.
१४ लांब मुलाखती, स्पीकरनुसार वेगळ्या केलेल्या. DER 0.95 क्लिअर ऑडिओवरची अचूकता खरोखर आहे. DOCX एक्स्पोर्ट थेट पेपरच्या ड्राफ्टमध्ये जातो.
२६ व्हॉइस मेमो. ३ TikTok लिंक्स. न्यूजलेटरचा ड्राफ्ट आउटलाइन — ११ मिनिटं. Otter ने हे जमवून दाखवा — मी थांबलोय.
Webhook आणि action-items एक्स्ट्रॅक्शनने आमचं साप्ताहिक रीकॅप-डॉक प्रकरण मिटवलं. पूर्ण लूप 2 मिनिटं आत्ता.
Deposition recordings → diarized transcript → cited PDF. हे पूर्वी बाहेर outsource करायचो. आता ते एक अपलोड.
इटालियन सेल्स कॉल्स → इंग्रजी सारांश. माझी टीम शेवटी कोणीतरी वाचतं. छोटी गोष्ट, मोठा फरक.
Webhook आणि action-items एक्स्ट्रॅक्शनने आमचं साप्ताहिक रीकॅप-डॉक प्रकरण मिटवलं. पूर्ण लूप 2 मिनिटं आत्ता.
Deposition recordings → diarized transcript → cited PDF. हे पूर्वी बाहेर outsource करायचो. आता ते एक अपलोड.
इटालियन सेल्स कॉल्स → इंग्रजी सारांश. माझी टीम शेवटी कोणीतरी वाचतं. छोटी गोष्ट, मोठा फरक.
जपानी ऑटो-डिटेक्ट बिनधास्त चालतं. पण या साइटवरचा सेरिफ इटॅलिक हा वेगळाच डिझाइन-गुन्हा आहे — आणि तो मला आवडतो.
REST API + per-key rate-limit = आमची इंटर्नल व्हॉइस-मेमो पाइपलाइन. लागले फक्त 30 मिनिटं wire करायला. पूर्ण team साठी $19/महिना.
24 तासांत ऑटो-डिलीट हे फीचर मला हवं आहे हे माहीतच नव्हतं जोपर्यंत मी प्रत्येक स्पर्धकाचं प्रायव्हसी पेज तपासलं नव्हतं.
जपानी ऑटो-डिटेक्ट बिनधास्त चालतं. पण या साइटवरचा सेरिफ इटॅलिक हा वेगळाच डिझाइन-गुन्हा आहे — आणि तो मला आवडतो.
REST API + per-key rate-limit = आमची इंटर्नल व्हॉइस-मेमो पाइपलाइन. लागले फक्त 30 मिनिटं wire करायला. पूर्ण team साठी $19/महिना.
24 तासांत ऑटो-डिलीट हे फीचर मला हवं आहे हे माहीतच नव्हतं जोपर्यंत मी प्रत्येक स्पर्धकाचं प्रायव्हसी पेज तपासलं नव्हतं.
स्वच्छ audio आणि एक-दोन speakers असतील, तर बहुतेक मोठ्या भाषांमध्ये अचूकता 95%+ पर्यंत जाते. पार्श्वभूमीचा आवाज, जड accent किंवा एकमेकांवर बोलणं असेल तर quality कमी होते.
ऑटो-डिटेक्टसह १००+ भाषा. ऑटो-डिटेक्ट चुकीची भाषा निवडल्यास तुम्ही ठरवून एक भाषा सेट करू शकता. इंटरफेस सध्या फक्त इंग्रजीत आहे — बहुभाषिक UI प्लॅनवर आहे.
ट्रान्सक्रिप्शन पूर्ण झाल्यानंतर 24 तासांत स्रोत मीडिया (तुम्ही अपलोड केलेला ऑडिओ/व्हिडिओ) आमच्या इन्फ्रास्ट्रक्चरमधून डिलीट होतो. ट्रान्सक्रिप्ट आणि सारांश तुमच्या अकाउंटमध्ये राहतो — जोपर्यंत तुम्ही डिलीट करत नाही, किंवा अकाउंट डिलीट केल्यानंतर 30 दिवस. आमचे स्पीच-टू-टेक्स्ट प्रोव्हायडर्स (AssemblyAI मुख्य, OpenAI fallback) त्यांच्या स्वतःच्या रिटेन्शन पॉलिसीनुसार ऑडिओ प्रोसेस करतात — पाहा /privacy पूर्ण subprocessor यादीसाठी.
नाही. आमचा अपस्ट्रीम ASR प्रोव्हायडर पेड एंडपॉइंट्ससाठी डिफॉल्टनेच ट्रेनिंग ऑप्ट-आउट देतो — आम्ही तेच वापरतो. वर आम्ही काहीही जोडत नाही: तुमच्या ट्रान्सक्रिप्ट्सवर ट्रेन झालेली स्वतःची मॉडेल्स नाहीत, छुपं अॅनालिटिक्सही नाही.
तुमचे क्रेडिट्स कापले जात नाहीत. बहुतेक फेल्युअर्स (प्रायव्हेट URL, खूप मोठी फाइल, सपोर्ट नसलेला कोडेक) सोबत स्पष्ट एरर मेसेज आणि पुन्हा प्रयत्न कसा करायचा याची सूचना येते.
हो — Stripe कस्टमर पोर्टलमधून कधीही. पेड पीरियड संपेपर्यंत प्लॅन चालू राहतो, आणि पुढच्या रिन्यूअल तारखेला Free वर येतो.
जर तुम्ही प्लॅनच्या एकूण मिनिटांपैकी १०% पेक्षा कमी वापरली असतील, तर ७ दिवसांत पूर्ण रिफंड. त्यानंतर, न वापरलेल्या भागासाठी प्रमाणानुसार रिफंड. ईमेल support@transcription.solutions.
हो — REST API लाइव्ह आहे, webhooks पण. API की ऑथ पुढच्या यादीत आहे. प्रत्येक प्लॅनसाठी रेट लिमिट्स आहेत. अकाउंट बनवल्यावर /docs/api वर डॉक्स पाहा.
SOC 2 चा शिक्का नाही. एखादं control अजून आम्ही ship केलं नसेल, तर त्याचा badge लावत नाही.
तुम्ही अपलोड केलेला ऑडिओ-व्हिडिओ काम पूर्ण झाल्यानंतर 24 तासांत नाहीसा होतो. हा सेटिंग नाही — हे आमचं वचन आहे.
आमचा ASR प्रदाता डीफॉल्टनेच ट्रेनिंग opt-out देतो — आम्ही तेच endpoints वापरतो. वरून काहीच जोडत नाही.
पहिल्या दिवसापासून — डेटा रेस्टमध्ये आणि ट्रान्झिटमध्ये एनक्रिप्टेड. HSTS लागू.
EU अॅक्सेस / डिलीशन / पोर्टेबिलिटी हक्क पाळले जातात. विनंतीवरून DPA उपलब्ध.
Settings → Delete account. सगळा डेटा ३० दिवसांत मिटवला जातो. सपोर्ट तिकीट काढायची गरज नाही.
उद्देशासह संपूर्ण व्हेंडर यादी इथे /privacy. लपलेले व्हेंडर नाहीत.
महिन्याला ३० विनामूल्य मिनिटं, प्रति फाइल ३० मिनिटांपर्यंत. क्रेडिट कार्ड नाही, ट्रायलनंतर कार्ड नाही, कुठलंही फूटनोट नाही. कोणताही प्लॅन एका क्लिकवर कधीही कॅन्सल करा.