Twitter ट्रांसक्रिप्शन।Spaces, वीडियो, वॉयस नोट्स को टेक्स्ट में।

Twitter Space की MP3 ड्रॉप करें — या कोई वीडियो, या DM वॉयस नोट। स्पीकर लेबल्स, टाइमस्टैम्प्स, और 99 भाषाओं में SRT पाएं। X Premium की ज़रूरत नहीं।

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ देखें क्या बाहर निकलता है

Space रिकॉर्डिंग अंदर। Labeled ट्रांसक्रिप्ट बाहर।

X हर Space को एक मिक्स्ड mono MP3 के रूप में एक्सपोर्ट करता है — हर स्पीकर एक चैनल पर। हम 6-12 घूमते मइक होल्डर्स के लिए ट्यून किया गया acoustic diarization यूज़ करते हैं, यानी आम Space का शेप।

X Space रिकॉर्डिंग (MP3)REC 5 स्पीकर्स · 1:14:22
auto-detected en-US44.1 kHz mono · 96 kbps
~90s
ट्रांसक्रिप्ट · streaming92% accuracy
S1

सब लोगों को फिर स्वागत है — अब हमारे पास करीब 600 सुनने वाले हैं। Jess, आप Solana बात पर कूदना चाहते थे?

S2

हाँ, तो पिछले हफ्ते के throughput नंबर्स validator सेट पर context के बिना गुमराह करने वाले हैं।

S3

क्या मैं इस पर विरोध कर सकता हूँ? क्योंकि mainnet beta डेटा एक अलग कहानी बताता है।

S1

आगे बढ़ो, Mike — इसे टाइट रखो, हमारे पास queue में दो और स्पीकर्स हैं।

92% on Spaces MP3SRT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

तीन असली विकल्प · ईमानदार तुलना

X के अपने कैप्शन्स। Otter। या हम।

X ने 2023 में Spaces को live closed कैप्शन जोड़ा, लेकिन कोई ट्रांसक्रिप्ट एक्सपोर्ट नहीं है। Otter को ऑडियो को एक मीटिंग में मिरर करना पड़ता है। हम MP3 लेते हैं जो आप पहले से X से डाउनलोड कर चुके हैं और एक फ़ाइल देते हैं।

Option 01

X live कैप्शन्स

Spaces UI के अंदर real-time कैप्शन्स। डाउनलोड करने के लिए कुछ नहीं, search करने के लिए कुछ नहीं।

RequiresLive attendance
स्पीकर लेबल्सनहीं
भाषाएंEN + कुछ और
एक्सपोर्टकोई नहीं — सिर्फ कैप्शन्स
Space के बाद की accessSpace खत्म होने पर खो जाता है
कीमतX account के साथ फ्री
Best forसुनने वाले जिन्हें उस समय accessibility चाहिए और उसके बाद ट्रांसक्रिप्ट की परवाह नहीं।
Option 02

Transcription.Solutions

Space MP3 ड्रॉप करें या Space URL पेस्ट करें। स्पीकर लेबल्स, SRT, सारांश — हर प्लान में।

RequiresMP3 डाउनलोड या Space URL
स्पीकर लेबल्सAcoustic, 2-12 स्पीकर्स
भाषाएं99, auto-detected
एक्सपोर्टSRT · DOCX · TXT · JSON
AI सारांशमुख्य बिंदु + topic tags
कीमत · प्रति मिनट$0.03
Best forहोस्ट्स जो Spaces को blog पोस्ट्स, podcasts, या YouTube वीडियो्स में burned-in कैप्शन्स के साथ repurpose कर रहे हों।
Option 03

Otter / Fireflies

Zoom के लिए डिज़ाइन किए गए calendar bots। Space को capture करने के लिए आपको ऑडियो को fake मीटिंग में route करना पड़ता है।

Requiresऑडियो loopback rig
स्पीकर लेबल्सअक्सर एक में collapse हो जाते हैं
भाषाएंEN-tuned, दूसरी degrade होती हैं
एक्सपोर्टTXT, DOCX (paid)
AI सारांशPaid tier
कीमत$17/user/mo
Best forलोग जो पहले से Otter के लिए पेमेंट कर रहे हों और rough live capture चाहते हों, लेकिन setup friction की परवाह न करते हों।

May 2026 तक pricing और feature flags सटीक है। X Spaces caption rollout अभी भी क्षेत्र और account type के हिसाब से बदलता है।

X / Twitter के लिए specific

चार चीजें जो generic transcribers Spaces पर पहचानते हैं।

Spaces का एक शेप है: mono mix, rotating mic, crypto और tech jargon, बहुत से @handles। इसके लिए tune करें।

क्या गलत होता है

  1. 1Mono-only export। X आपको per-speaker channels नहीं देता Zoom की तरह — सब कोई एक track पर है। Stereo meetings के लिए tune किए गए tools underperform करते हैं।
  2. 2@handles और tickers (@balajis, $SOL, $ETH, gm, ngmi) को phonetically spell किया जाता है। Generic AI को लगता है ये typos हैं।
  3. 3Host intro music और stingers word detection को trip करते हैं और transcript के फ्रंट में gibberish जोड़ते हैं।

यहाँ क्या flip करना है

  1. 1Job form पर Spaces / panel speaker model pick करें। ये 4-12 mono speakers के लिए tune है rotating mic के साथ और voice merges को बेहतर tolerate करता है।
  2. 2अपनी guest list और ticker list को Custom vocabulary में पेस्ट करें। हम @handles, $TICKERS, और protocol names को recognizer को hints के रूप में pass करते हैं।
  3. 3skip non-speech intro turn करें। हम leading music को trim करते हैं और transcript को first detected voice पर start करते हैं — आम तौर पर 20-40 सेकंड में।

X Spaces के लिए recommended job settings

Space MP3 drop करें और ये default पर flip हो जाते हैं। हर job से form पर override करें।

Diarization
Acoustic · 4-12 स्पीकर्स
Speaker model
Spaces / panel
भाषा
Auto-detect · multi-lingual on
Filler words
Kept (Spaces conversational हैं)
सारांश
मुख्य बिंदु + topic tags
एक्सपोर्ट
SRT · DOCX · timestamped TXT

Accuracy · real-world numbers

क्लीन Spaces पर 92%। Bluetooth आए तो कम।

X हर Space को एक single mixed mono MP3 के रूप में एक्सपोर्ट करता है, तो ceiling इस बात पर निर्भर करता है कि हर स्पीकर कैसे connect हुआ। quiet room में wired mic सबसे अच्छा case है। car में Bluetooth earbuds सबसे बुरा है। नीचे के नंबर्स production में actual Spaces फ़ाइलों से आते हैं।

94%
2-3 स्पीकर्स, studio mic

छोटा Space, hosts USB या XLR mics पर। Diarization mono mix में भी आवाजों को cleanly अलग करता है।

92%
4-8 स्पीकर्स, mixed devices

आम Space। कुछ iPhone पर, कुछ laptop पर। Diarization hold करता है; speaker chips पर 2-min cleanup pass की उम्मीद करें।

87%
9-15 rotating स्पीकर्स

बड़ा Space mic पास के साथ। Acoustic model similar आवाजों को merge कर सकता है जब speakers जल्दी swap करते हैं।

81%
Bluetooth या noisy line

coffee shop में AirPods, AAC compression, wind। Text usable है; नंबर्स, नाम, और acronyms पहले degrade होते हैं।

आम सवाल

8 चीजें जो लोग Twitter ट्रांसक्रिप्शन के बारे में पूछते हैं।

01क्या आप एक ऐसे Space को ट्रांसक्राइब कर सकते हैं जो अभी लाइव है?+
Real time में नहीं। हम recording से काम करते हैं। Space खत्म होने का wait करें, अपने X dashboard से MP3 डाउनलोड करें (Spaces → Recorded → Download audio), फिर फ़ाइल ड्रॉप करें। अधिकांश Spaces के बाद 30 दिनों के लिए उपलब्ध हैं।
02क्या होता है अगर Space को record नहीं किया गया था?+
अगर host ने recording को toggle नहीं किया, X के पास कोई फ़ाइल नहीं है और न हमारे पास है। कुछ third-party tools externally Spaces को capture करते हैं — अगर आपके पास वह MP3 या MP4 है, हम इसे लेंगे।
03क्या आप सीधे Space URL से pull कर सकते हैं?+
हाँ, अगर Space X पर अभी भी public है और recording enable था। Job form पर URL पेस्ट करें। अगर X ने expire या unlist किया, आपको डाउनलोड की गई MP3 की ज़रूरत होगी।
04क्या आप X video posts और Vine-style clips को handle करते हैं?+
हाँ। MP4 ड्रॉप करें या post URL पेस्ट करें। 30 seconds से कम के short clips को हमारी 1-minute minimum पर charge किया जाता है। लंबे videos standard $0.03/min पर transcribe होते हैं।
05voice DMs के बारे में क्या?+
X DMs से voice notes काम करते हैं — conversation से audio फ़ाइल को export करें और ड्रॉप करें। ये आम तौर पर 30-60 seconds और एक speaker हैं, तो accuracy high है (94%+) और कीमत per-minute minimum है।
06स्पीकर लेबल्स कैसे काम करते हैं जब 10 लोग mic पर हों?+
हम acoustically generic लेबल्स assign करते हैं (Speaker 1, Speaker 2…)। Transcript load होने के बाद, आप उन्हें एक बार rename करते हैं — आम तौर पर Space की guest list के विरुद्ध 2-3 minute pass। Renames पूरी फ़ाइल में apply होते हैं।
07क्या AI summary crypto / Web3 terminology को catch करता है?+
ज्यादातर हाँ — protocol नाम, L1/L2, common tickers ($BTC, $ETH, $SOL) और slang (gm, wagmi) हमारी vocabulary में हैं। Obscure projects या नई launches के लिए, processing से पहले उन्हें Custom vocabulary में जोड़ें।
08क्या मैं Space को YouTube video के रूप में repurpose करने के लिए burned-in कैप्शन पा सकता हूँ?+
हम SRT या VTT return करते हैं, जिसे आप अपने editor (Descript, Premiere, CapCut, DaVinci) में import करते हैं। हम खुद burned-in MP4 render नहीं करते — SRT आपके वह video tool के लिए bridge है जो आप पहले से use करते हैं।

अपना Space MP3 ड्रॉप करें। देखें क्या बाहर निकलता है।

हर महीने 30 फ्री मिनट्स। कोई कार्ड नहीं। स्पीकर लेबल्स, 99 भाषाएं, SRT और DOCX शामिल।

फ्री शुरू करें