Transkrypcja na Twitterze.Spaces, filmy, notatki głosowe na tekst.

Wrzuć MP3 z nagranego Twitter Space — lub wideo, albo notatkę głosową z DM. Etykiety mówców, znaczniki czasu i SRT w 99 językach. Nie potrzebujesz X Premium.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Obejrz co na tym wychodzi

Nagranie Space wchodzi. Transkrypcja z etykietami wychodzi.

X eksportuje każdy Space jako jeden mieszany mono MP3 — każdy mówca na jednym kanale. Używamy diaryzacji akustycznej dostosowanej do 6-12 obracających się użytkowników mikrofonu, typowy kształt Spaces.

Nagranie X Space (MP3)REC 5 mówców · 1:14:22
automatycznie wykryte en-US44,1 kHz mono · 96 kbps
~90s
Transkrypcja · przesyłanie92% dokładności
S1

Witajcie z powrotem — mamy teraz około 600 słuchaczy. Jess, chciałaś coś dodać na temat punktu Solana?

S2

Tak, liczby przepustowości z ubiegłego tygodnia są wprowadzające w błąd bez kontekstu validator set.

S3

Mogę to zakwestionować? Bo dane mainnet beta mówią inną historię.

S1

Proszę, Mike — bądź zwięzły, mamy jeszcze dwóch mówców w kolejce.

92% na Space MP3SRT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Trzy rzeczywiste opcje · uczciwe porównanie

Napisy X. Otter. Albo my.

X dodał napisy w czasie rzeczywistym do Spaces w 2023, ale brak eksportu transkrypcji. Otter wymaga, abyś lustrzał audio do spotkania. Bieremy MP3, który już pobrałeś z X i zwracamy plik.

Option 01

Napisy X w czasie rzeczywistym

Napisy w czasie rzeczywistym wewnątrz interfejsu Spaces. Nic do pobrania, nic do szukania.

WymagaObecności na żywo
Etykiety mówcówNie
JęzykiEN + kilka innych
EksportBrak — tylko napisy
Dostęp po SpaceZnika gdy Space się kończy
KosztBezpłatnie z X
Best forSłuchaczy, którzy potrzebują dostępności w danym momencie i nie interesuje ich transkrypcja później.
Option 02

Transcription.Solutions

Wrzuć Space MP3 lub wklej adres URL Space. Etykiety mówców, SRT, podsumowanie — w każdym planie.

WymagaPobrania MP3 lub URL Space
Etykiety mówcówAkustyczne, 2-12 mówców
Języki99, automatyczne wykrywanie
EksportSRT · DOCX · TXT · JSON
Podsumowanie AIGłówne punkty + tagi tematu
Koszt · za minutę$0.03
Best forProwadzących repurposujących Spaces do postów na blogu, podcastów lub filmów na YouTube z napisami wypalonymi.
Option 03

Otter / Fireflies

Boty kalendarza zaprojektowane dla Zoom. Aby przechwycić Space, musisz kierować audio do fałszywego spotkania.

WymagaKonfiguracji pętli audio
Etykiety mówcówCzęsto zwija się do jednego
JęzykiEN-strojone, inne się pogarszają
EksportTXT, DOCX (płatne)
Podsumowanie AIPłatny pakiet
Koszt$17/użytkownik/mies.
Best forOsób już płacących za Otter, które chcą przybliżonego przechwytywania na żywo i nie przeszkadza im tarcie konfiguracyjne.

Ceny i flagi funkcji dokładne na maj 2026. Wdrażanie napisów X Spaces różni się w zależności od regionu i typu konta.

Specyficzne dla X / Twittera

Cztery rzeczy, które generyczne transkrypcje pominęły na Spaces.

Spaces mają kształt: mono mix, rotujący mikrofon, żargon kryptograficzny i techniczny, wiele @handles. Dostosuj się do tego.

Co idzie nie tak

  1. 1Eksport tylko mono. X nie daje ci kanałów dla każdego mówcy jak Zoom — wszyscy są na jednym torze. Narzędzia dostrojone do rozmów stereo gorzej się radzą.
  2. 2@handles i tickers (@balajis, $SOL, $ETH, gm, ngmi) są literowane fonetycznie. Generyczna AI myśli, że to literówki.
  3. 3Muzyka intro i stingers hosta blokują detekcję słów i dodają bzdury na początek transkrypcji.

Co tu zmienić

  1. 1Wybierz model Spaces / panel na formularzu zadania. Jest dostrojony dla 4-12 mówców mono z rotującym mikrofonem i lepiej toleruje łączenie głosów.
  2. 2Wklej listę gości i listę tickerów do Custom vocabulary. Przekazujemy @handles, $TICKERS i nazwy protokołów jako wskazówki do rozpoznawania.
  3. 3Włącz skip non-speech intro. Obcinamy początkową muzykę i zaczynamy transkrypcję od pierwszego wykrytego głosu — zwykle 20-40 sekund.

Rekomendowane ustawienia zadania dla X Spaces

Wrzuć Space MP3 a te włączą się domyślnie. Zastąp per-job z formularza.

Diaryzacja
Akustyczna · 4-12 mówców
Model mówcy
Spaces / panel
Język
Automatyczne wykrywanie · wielojęzyczne włączone
Słowa wypełniające
Zachowywane (Spaces są konwersacyjne)
Podsumowanie
Główne punkty + tagi tematu
Eksport
SRT · DOCX · TXT z czasami

Accuracy · real-world numbers

92% na czystych Spaces. Mniej gdy pojawia się Bluetooth.

X eksportuje każdy Space jako jeden mieszany mono MP3, więc maksimum zależy od tego, jak każdy mówca się połączył. Mikrofon przewodowy w spokojnym pokoju to najlepszy scenariusz. Słuchawki Bluetooth w samochodzie to najgorsza sytuacja. Liczby poniżej pochodzą z rzeczywistych plików Spaces w produkcji.

94%
2-3 mówców, mikrofon studyjny

Mały Space, prowadzący na mikrofonach USB lub XLR. Diaryzacja czysto separuje głosy nawet w mieszance mono.

92%
4-8 mówców, mieszane urządzenia

Typowy Space. Niektórzy na iPhone'ie, niektórzy na laptopie. Diaryzacja się trzyma; oczekuj 2-minutowego przejścia czyszczącego na etykietach mówców.

87%
9-15 rotujących mówców

Duży Space z mikrofonem przekazywanym. Model akustyczny może łączyć podobne głosy, gdy mówcy szybko się zmieniają.

81%
Bluetooth lub połączenie halasliwe

AirPods w kawiarni, kompresja AAC, wiatr. Tekst użyteczny; liczby, nazwy i akronimy najpierw się pogarszają.

Częste pytania

8 najczęstszych pytań o transkrypcję Twittera.

01Czy możesz transkrybować działającą na żywo Space?+
Nie w czasie rzeczywistym. Pracujemy z nagraniem. Czekaj, aż Space się skończy, pobierz MP3 z twojego pulpitu X (Spaces → Recorded → Download audio), a następnie wrzuć plik. Większość Spaces jest dostępna przez 30 dni.
02A co z Space, która nie została nagrana?+
Jeśli host nie włączył nagrywania, X nie ma pliku i my też nie. Niektóre narzędzia stron trzecich przechwytują Spaces zewnętrznie — jeśli masz ten MP3 lub MP4, weźmiemy to.
03Czy możesz pobrać bezpośrednio z URL Space?+
Tak, jeśli Space jest wciąż publiczny na X i nagrywanie było włączone. Wklej URL na formularz zadania. Jeśli X wygasł lub unlisted, będziesz potrzebować pobranego MP3.
04Czy obsługujesz posty wideo X i klipy w stylu Vine?+
Tak. Wrzuć MP4 lub wklej URL posta. Krótkie klipy poniżej 30 sekund są pobierane za nasze minimum 1 minuty. Dłuższe filmy transkrybują się za standardowe $0.03/min.
05A co z głosowymi wiadomościami DM?+
Notatki głosowe z X DM działają — eksportuj plik audio z konwersacji i wrzuć go. Zwykle wynoszą 30-60 sekund i jeden mówca, więc dokładność jest wysoka (94%+) a koszt to minimum na minutę.
06Jak działają etykiety mówców, gdy 10 osób ma mikrofon?+
Przypisujemy generyczne etykiety (Speaker 1, Speaker 2…) akustycznie. Po załadowaniu transkrypcji przywołujesz je raz — zwykle 2-3 minutowe przejście względem listy gości Space. Zmiany nazw stosują się do całego pliku.
07Czy podsumowanie AI wychwytuje terminologię crypto / Web3?+
Większość tak — nazwy protokołów, L1/L2, popularne tickery ($BTC, $ETH, $SOL) i slang (gm, wagmi) są w naszym słownictwie. Dla niejasnych projektów lub nowych premier dodaj je do Custom vocabulary przed przetwarzaniem.
08Czy mogę uzyskać napisy wypalane do ponownego wykorzystania Space jako wideo na YouTube?+
Zwracamy SRT lub VTT, które importujesz do edytora (Descript, Premiere, CapCut, DaVinci). Sami nie renderujemy wypalonego MP4 — SRT to most do dowolnego narzędzia wideo, które już używasz.

Wrzuć swój Space MP3. Zobacz co wyjdzie.

30 bezpłatnych minut co miesiąc. Bez karty. Etykiety mówców, 99 języków, SRT i DOCX w zestawie.

Zacznij za darmo