Transkrypcja dla podcasterów.Notatki z odcinków i SRT w jednym przejściu.

Prześlij odcinek podcastu master — MP3, WAV, lub link YouTube. Uzyskaj transkrypcję z identyfikacją głosów, notatki AI ze wskazówkami kluczowymi i etykietami, plus SRT do wideo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Jeden plik wejścia, cztery artefakty na wyjściu

Master odcinka na wejściu. Transkrypcja, notatki, SRT, etykiety na wyjściu.

Większość podcastów przychodzi jako stereo MP3 po produkcji z hostem i gościem już zmixowanymi razem. Dzielimy je akustycznie, wykrywamy intro muzyki i zaczynamy transkrypcję od pierwszego wypowiedzianego słowa.

Master odcinka 142REC 2 głosy · 48:21 · MP3 192 kbps
auto-detected en-US44.1 kHz stereo · po miksie
~90s
Transkrypcja · streamingdokładność 95%
S1

Powrót do programu. Dzisiaj rozmawiam z Priyą Anand o jej nowej książce o łańcuchach dostaw.

S2

Dziękuję, że mnie zaproszono, Jordanie. Minęły szalone trzy lata, odkąd ostatnio rozmawialiśmy.

S1

Więc książka otwiera się blokadem Suez — dlaczego zacząć tam?

S2

Bo to był moment, w którym każdy non-logistyk nagle zainteresował się kontenerami.

dokładność 95% na stereo po produkcjiSRT · DOCX · TXT · Notatki z odcinków MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Trzy rzeczywiste opcje · szczera porównanie

Descript. Castmagic. Lub my.

Descript to edytor na pierwszym planie, transkrypcja na drugim. Castmagic to notatki z odcinków na pierwszym planie, transkrypcja na drugim. Skupiamy się na potoku: plik → transkrypcja → notatki i nie ingerujemy w Twój edytor.

Option 01

Descript

Edytor audio z wbudowaną transkrypcją. Świetny do przepływów pracy edycji tekstu, cięższy niż potrzebujesz, jeśli chcesz tylko transkrypcję.

Główne zastosowanieDAW + edycja tekstu
Identyfikacja głosówAkustyczna, EN-silna
Notatki z odcinkówDodatek Underlord AI
EksportSRT · TXT · plik projektu
Darmowy pakiet1 godz./mies transkrypcji
Koszt$24/użytkownik/mies (Creator)
Best forSolo podcasterzy, którzy edytują odcinki poprzez usuwanie słów z transkrypcji i chcą jedną aplikację do wszystkiego.
Option 02

Transcription.Solutions

Prześlij master odcinka. Transkrypcja, notatki, etykiety, SRT — wszystkie cztery w jednym przejściu. Bez edytora, bez blokady.

Główne zastosowanieTranskrypcja + notatki
Identyfikacja głosówAkustyczna + upload per-tor
Notatki z odcinkówDarmowe na każdym planie
EksportSRT · VTT · DOCX · MD · JSON
Darmowy pakiet30 min/mies, bez karty
Koszt · za minutę$0.03
Best forProgramy, które już mają edytor (Logic, Hindenburg, Reaper) i chcą czysty tekst + notatki po zmixowaniu odcinka.
Option 03

Castmagic

Notatki-z-odcinków-jako-usługa. Przeciągnij plik, uzyskaj elegancki pakiet zawartości. Transkrypcja to bardziej efekt uboczny.

Główne zastosowaniePonowne użycie zawartości
Identyfikacja głosówTak, dostrojona do EN
Notatki z odcinkówWiele szablonów, tylko płatne
EksportSRT · TXT · szablon MD
Darmowy pakietTylko próba
Koszt~$23+/mies (Starter)
Best forProgramy skoncentrowane na marketingu, które potrzebują 12 postów w mediach społecznych, 4 projektów biuletynu i karuzelę LinkedIn na odcinek.

Ceny przybliżone na 2026 r. i zmieniają się dla każdego dostawcy. Darmowe pakiety i dodatki AI zmieniają się regularnie.

Specyficzne dla podcastingu

Trzy rzeczy, które przycinają podcasterów w generycznych narzędziach transkrypcji.

Powiedz nam kilka rzeczy o odcinku przy uploaddzie, a wyjście przestanie wymagać przejścia czyszczącego.

Co się psuje

  1. 1Intro muzyki transkrybowane jako bełkot. Rozpoznawanie próbuje przeczytać tekst lub wzory humphów i wstawia nonsens, taki jak 'la la na' przez pierwsze 30 sekund.
  2. 2Imię gościa zapisane fonetycznie. 'Priya Anand' wychodzi 'Pria Anan' lub 'Prea Ahnand' — i to jest źle za każdym razem, kiedy się pojawia.
  3. 3Śmiech i gadatliwość są renderowane jako słowa wypełniające lub przypisywane nie temu głosowi, szczególnie podczas energicznych wymian.

Co tu przełączyć

  1. 1Włącz Pomiń intro/outro muzyki na formularzu zadania. Wykrywamy segmenty bez mowy i zaczynamy transkrypcję od pierwszego wypowiedzianego słowa — przesunięcia sygnatur czasowych dostosowują się automatycznie.
  2. 2Wklej imię gościa i wzmianki marek do Niestandardowego słownika. Przekazujemy go jako podpowiedź rozpoznającą, aby pisownia pozostała spójna w całym odcinku.
  3. 3Włącz Notatki z odcinków, aby uzyskać streszczenie 2-4 zdań, 3-7 głównych punktów, elementy działań i 3-8 etykiet tematycznych renderowanych w markdownie — wklej bezpośrednio do CMS.

Rekomendowane ustawienia zadań dla podcastów

Prześlij odcinek i te domyślne ustawienia się włączą. Zastąp per-zadanie z formularza.

Identyfikacja
Podział stereo, jeśli 2 głosy
Wykrywanie muzyki
Pomiń segmenty intro/outro
Słowa wypełniające
Usunięte domyślnie
Notatki z odcinków
Streszczenie + główne punkty + etykiety
Rozdziały
Generowane z głównych punktów
Eksport
SRT · DOCX · notatki MD

Accuracy · real-world numbers

97% na odcinkach ze studyjnym mikrofonem. Utrzymuje się również na zdalnych połączeniach z gośćmi.

Dokładność podcastu zależy głównie od jak został nagrany gość, nie od hosta. Host ze studia sparowany ze zwykłym gościem na Zoomie zachowuje się jak najgorszy składnik. Liczby poniżej pochodzą z rzeczywistych odcinków klientów, a nie z audycji laboratoryjnych.

97%
Upload per-tor (Riverside / SquadCast)

Każdy głos na osobnym pliku WAV. Traktujemy każdy tor niezależnie i pomijamy identyfikację. Najczystsza możliwy przypadek.

95%
Stereo po miksie, 2 głosy

Host po lewej, gość po prawej, po masteringu. Najczęstszy kształt podcastu. Identyfikacja jest zasadniczo darmowa ze względu na podział stereo.

91%
Mono miksy, 3-4 głosy

Programme okrągłego stołu lub format panelu mieszane do mono. Podobne głosy mogą się scalić jeden lub dwa razy na godzinę — przejście czyszczące o długości 2 minut to naprawia.

86%
Zdalny gość na telefonie / słaby mikrofon

Gość na AirPodsach przez hotelowe wifi. Liczby i nazwy własne cierpią najbardziej. Niestandardowy słownik odzyskuje większość z niego.

Częste pytania

8 rzeczy, które ludzie pytają o transkrypcję podcastów.

01Czy mogę po prostu wkleić swój link YouTube lub SoundCloud?+
Tak. Wklej publiczny adres URL YouTube lub link do odcinka hostowanego (SoundCloud, Buzzsprout, Transistor, Libsyn direct MP3) i pobieramy audio ze strony naszej. W przypadku prywatnych kanałów pobierz plik i prześlij go.
02Czy intro muzyki będzie transkrybowane jako 'la la la' nonsens?+
Nie, jeśli Pomiń intro/outro muzyki jest włączone (domyślnie jest). Wykrywamy audio bez mowy i zaczynamy transkrypcję od pierwszego wypowiedzianego słowa. Znaki czasu w SRT przesuwają się, aby napisy YouTube pozostały zsynchronizowane.
03Co dokładnie jest w pliku notatek z odcinków?+
Streszczenie odcinka 2-4 zdań, 3-7 głównych punktów jako lista punktów, elementy działań, jeśli zostały wymienione, i 3-8 etykiet tematycznych. Renderowane jako markdown, aby można było wkleić bezpośrednio do WordPress, Ghost, Substack, lub strony odcinka hosta podcastu.
04Czy możesz generować markery rozdziałów dla Apple Podcasts i Spotify?+
Tak — rozdziały są generowane z głównych punktów ze znakami czasu. Eksportuj jako osobny plik chapters.txt lub osadź w WAV/M4A. Zauważ, że Spotify honoruje rozdziały tylko na programach hostowanych na Anchor, więc plik txt jest Twoją rezerwą.
05Mam pliki per-tor z Riverside / SquadCast — czy powinienem je przesłać?+
Tak, proszę. Prześlij każdy plik WAV mówcy oddzielnie i oznacz je nazwami. Transkrybujemy każdy tor niezależnie i łączymy według sygnatury czasowej. Dokładność wynosi około 97% w tej konfiguracji — najczystsza przypadek, jaki widzieliśmy.
06Czy może oznaczyć odczyty sponsorów lub przerwy na reklamy?+
Nie automatycznie jeszcze — to jest na mapie drogowej. Na razie wstaw marker do edycji (krótka cisza lub dźwięk) i wyświetlimy go jako sygnaturę czasową w transkrypcji. Możesz również oznaczyć segmenty reklam, wklejając nazwę marki sponsora.
07Jak długi może być odcinek?+
Do 6 godzin na plik w jednym przesłaniu. Większość programów trwa 30-90 minut, co kończy się w 4-8 minut na zegarze ściennym. Dla 3-godzinnego odcinka wywiadów spodziewaj się około 12-15 minut od przesłania do czterech artefaktów gotowych.
08Czy SRT zastąpi czysto YouTube automatyczne napisy?+
Tak. SRT jest podzielony na linie ~42 znaki z właściwą interpunkcją i opcjonalnym prefiksem mówcy. Prześlij go w YouTube Studio → Napisy → Dodaj język → SRT. Całkowicie przesłania automatycznie generowany tor napisów.

Prześlij swój odcinek. Uzyskaj transkrypcję, notatki i SRT.

30 darmowych minut co miesiąc. Bez karty. Etykiety mówcy, notatki z odcinków, rozdziały i każdy eksport zawarty.

Zacznij bezpłatnie