Twitter-Transkription.Spaces, Videos, Sprachnachrichten zu Text.

Lade die MP3 einer aufgezeichneten Twitter Space hoch — oder ein Video, oder eine Sprachnachricht aus einer DM. Erhalte Sprecherlabel, Zeitstempel und ein SRT in 99 Sprachen. Kein X Premium erforderlich.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Schau, was rauskommt

Space-Aufnahme rein. Transkript mit Sprecherlabeln raus.

X exportiert jede Space als einzelne gemischte Mono-MP3 — alle Sprecher auf einem Kanal. Wir nutzen akustische Diarisierung, optimiert für 6–12 rotierende Mikrofonhalter, die typische Space-Form.

X Space-Aufnahme (MP3)REC 5 Sprecher · 1:14:22
automatisch erkannt en-US44,1 kHz Mono · 96 kbps
~90s
Transkript · Streaming92% Genauigkeit
S1

Willkommen zurück zusammen — wir haben jetzt etwa 600 Hörer. Jess, du wolltest zum Solana-Punkt springen?

S2

Ja, also die Durchsatzzahlen von letzter Woche sind ohne Kontext zum Validator-Set irreführend.

S3

Darf ich da widersprechen? Weil die Mainnet-Beta-Daten erzählen eine andere Geschichte.

S1

Gerne, Mike — halte es kurz, wir haben noch zwei weitere Sprecher in der Warteschlange.

92% bei Spaces MP3SRT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Drei echte Optionen · ehrlicher Vergleich

X's eigene Untertitel. Otter. Oder wir.

X hat 2023 Live-Untertitel zu Spaces hinzugefügt, aber es gibt keinen Transkript-Export. Otter erfordert, dass du Audio in ein Treffen spiegelst. Wir nehmen die MP3, die du bereits von X heruntergeladen hast, und geben eine Datei zurück.

Option 01

X Live-Untertitel

Echtzeituntertitel in der Spaces-Oberfläche. Nichts herunterladen, nichts durchsuchen.

ErfordertLive-Teilnahme
SprecherlabelNein
SprachenEN + einige weitere
ExportKeine — nur Untertitel
Zugang nach SpaceGeht verloren, wenn Space endet
KostenKostenlos mit X-Konto
Best forHörer, die Barrierefreiheit im Moment benötigen und sich nicht um ein Transkript danach kümmern.
Option 02

Transcription.Solutions

Lade die Space-MP3 hoch oder füge die Space-URL ein. Sprecherlabel, SRT, Zusammenfassung — in jedem Plan.

ErfordertMP3-Download oder Space-URL
SprecherlabelAkustisch, 2–12 Sprecher
Sprachen99, automatisch erkannt
ExportSRT · DOCX · TXT · JSON
KI-ZusammenfassungHauptpunkte + Themen-Tags
Kosten · pro Min$0,03
Best forHosts, die Spaces in Blog-Posts, Podcasts oder YouTube-Videos mit eingebrannten Untertiteln neu verwerten.
Option 03

Otter / Fireflies

Kalender-Bots für Zoom entwickelt. Um eine Space zu erfassen, musst du Audio in ein Fake-Meeting leiten.

ErfordertAudio-Loopback-Rig
SprecherlabelKollabiert oft auf eins
SprachenEN-optimiert, andere verschlechtern sich
ExportTXT, DOCX (kostenpflichtig)
KI-ZusammenfassungKostenpflichtiger Plan
Kosten$17/Benutzer/Mo
Best forLeute, die bereits Otter bezahlen und eine grobe Live-Erfassung mögen und Setup-Reibung nicht stört.

Preise und Feature-Flags korrekt ab Mai 2026. X Spaces Caption Rollout variiert nach Region und Kontotyp.

Spezifisch für X / Twitter

Vier Dinge, die generische Transkriptoren bei Spaces übersehen.

Spaces haben eine Form: Mono-Mix, rotierendes Mikrofon, Crypto- und Tech-Jargon, viele @-Handles. Optimize dafür.

Was schiefgeht

  1. 1Nur Mono-Export. X gibt dir keine Einzelsprecher-Kanäle wie Zoom — alle sind auf einem Track. Tools, die für Stereo-Meetings optimiert sind, schneiden schlecht ab.
  2. 2@-Handles und Ticker (@balajis, $SOL, $ETH, gm, ngmi) werden phonetisch buchstabiert. Generische KI denkt, sie sind Tippfehler.
  3. 3Host-Intro-Musik und -Stinger stoßen Wort-Erkennung an und fügen Unsinn am Anfang des Transkripts hinzu.

Was man hier umschaltet

  1. 1Wähle das Spaces / Panel-Sprechermodell im Jobformular. Es ist für 4–12 Mono-Sprecher mit rotierendem Mikrofon optimiert und toleriert Voice-Merges besser.
  2. 2Füge deine Gästeliste und Ticker-Liste zu Custom Vocabulary hinzu. Wir geben @-Handles, $Ticker und Protokollnamen als Hinweise an den Recognizer.
  3. 3Schalte Skip Non-Speech Intro ein. Wir trimmen Startmusik und beginnen das Transkript bei erkanntem ersten Sprachsignal — normalerweise 20–40 Sekunden drin.

Empfohlene Job-Einstellungen für X Spaces

Lade eine Space-MP3 hoch und diese schalten standardmäßig an. Pro Job vom Formular überschreiben.

Diarisierung
Akustisch · 4–12 Sprecher
Sprechermodell
Spaces / Panel
Sprache
Automatische Erkennung · Mehrsprachigkeit an
Füllwörter
Behalten (Spaces sind Gesprächsstoff)
Zusammenfassung
Hauptpunkte + Themen-Tags
Export
SRT · DOCX · zeitgestempeltes TXT

Accuracy · real-world numbers

92% bei sauberen Spaces. Geringer, wenn Bluetooth dazukommt.

X exportiert jede Space als einzelne gemischte Mono-MP3, also hängt die Obergrenze davon ab, wie jeder Sprecher verbunden war. Kabelgebundenes Mikrofon in einem ruhigen Raum ist der beste Fall. Bluetooth-Kopfhörer im Auto ist der schlechteste. Die unten stehenden Zahlen stammen aus tatsächlichen Space-Dateien in der Produktion.

94%
2–3 Sprecher, Studio-Mikrofon

Kleine Space, Hosts mit USB- oder XLR-Mikrofonen. Diarisierung trennt Stimmen auch in Mono-Mix sauber.

92%
4–8 Sprecher, gemischte Geräte

Typische Space. Einige auf iPhone, einige auf Laptop. Diarisierung hält; erwarte einen 2-Min-Cleanup-Pass bei Sprecher-Übergaben.

87%
9–15 rotierende Sprecher

Große Space mit Mikrofon, das herumgereicht wird. Akustisches Modell kann ähnliche Stimmen mergen, wenn Sprecher schnell wechseln.

81%
Bluetooth oder laute Leitung

AirPods im Café, AAC-Kompression, Wind. Text ist nutzbar; Zahlen, Namen und Akronyme verschlechtern sich zuerst.

Häufige Fragen

8 Dinge, die Menschen fragen. über Twitter-Transkription

01Kannst du eine noch laufende Space transkribieren?+
Nicht in Echtzeit. Wir arbeiten von der Aufnahme. Warte darauf, dass die Space endet, lade die MP3 von deinem X-Dashboard herunter (Spaces → Recorded → Download audio), und lade dann die Datei hoch. Die meisten Spaces sind 30 Tage nach der Aufzeichnung verfügbar.
02Was ist mit einer Space, die nicht aufgezeichnet wurde?+
Wenn der Host die Aufnahme nicht angeschaltet hat, hat X keine Datei und wir auch nicht. Einige Third-Party-Tools erfassen Spaces extern — wenn du diese MP3 oder MP4 hast, nehmen wir sie.
03Kannst du direkt von einer Space-URL ziehen?+
Ja, wenn die Space noch öffentlich auf X ist und die Aufnahme aktiviert war. Füge die URL im Jobformular ein. Wenn X sie abgelaufen oder nicht gelistet hat, benötigst du stattdessen die heruntergeladene MP3.
04Bearbeitest du auch X-Video-Posts und Vine-ähnliche Clips?+
Ja. Lade die MP4 hoch oder füge die Post-URL ein. Kurze Clips unter 30 Sekunden werden mit unserem Minimum von 1 Minute berechnet. Längere Videos werden zum Standard von $0,03/Min transkribiert.
05Wie ist es mit Voice-DMs?+
Sprachnachrichten aus X-DMs funktionieren — exportiere die Audiodatei aus der Konversation und lade sie hoch. Sie sind normalerweise 30–60 Sekunden und ein Sprecher, daher ist die Genauigkeit hoch (94%+) und die Kosten betragen das Pro-Minuten-Minimum.
06Wie funktionieren Sprecherlabel, wenn 10 Leute am Mikrofon sind?+
Wir vergeben generische Label (Sprecher 1, Sprecher 2…) akustisch. Nach dem Laden des Transkripts benennst du sie einmal um — normalerweise eine 2–3-Minuten-Pass gegen die Space-Gästeliste. Umbenennungen gelten für die gesamte Datei.
07Erfasst die KI-Zusammenfassung Crypto- / Web3-Terminologie?+
Größtenteils ja — Protokollnamen, L1/L2, gängige Ticker ($BTC, $ETH, $SOL) und Slang (gm, wagmi) sind in unserem Vokabular. Für obskure Projekte oder neue Launches füge sie vor der Verarbeitung zu Custom Vocabulary hinzu.
08Kann ich eingebrannte Untertitel bekommen, um eine Space als YouTube-Video neu zu verwerten?+
Wir geben SRT oder VTT zurück, die du in deinen Editor importierst (Descript, Premiere, CapCut, DaVinci). Wir rendern selbst kein eingebranntes MP4 — das SRT ist die Brücke zu jedem Video-Tool, das du bereits verwendest.

Lade deine Space-MP3 hoch. Schau, was rauskommt.

30 kostenlose Minuten jeden Monat. Keine Karte. Sprecherlabel, 99 Sprachen, SRT und DOCX inklusive.

Kostenlos starten