Odcinek → show notes → wydane
Długi wywiad zamienia się w 5-linijkowe streszczenie, cztery rozdziały, transkrypcję z oznaczeniami mówców i SRT do krótkich klipów — jedno zadanie, każdy efekt, który faktycznie publikujesz.
VTT · DOCX · PDF
Oprogramowanie do transkrypcji audio i wideo z AI. Zamień MP3, MP4 lub głos na tekst z rozpoznawaniem mówców i podsumowaniem AI — zwykle szybciej niż w czasie rzeczywistym.
Plan Free: 30 minut miesięcznie, do 30 min na plik. Bez karty.
Zakładki działają. Przełącznik do zrobienia działa. Dokładnie to ładuje się na Twoim koncie po zakończeniu zadania — ten sam układ, te same kontrolki.
Założycielom potrzebne są treści po rozmowie, nie sama transkrypcja. Narzędzia zmuszają ich do sklejania pięciu aplikacji.
Czysty tekst · wszystkie plany
Napisy ze znacznikami czasu · wszystkie plany
Nagłówki mówców + podsumowanie · wszystkie plany
Publiczny schemat · do integracji przez API · wszystkie plany
Format odtwarzacza HTML5 video · we wszystkich planach
Nagłówki mówców + znaczniki czasu · we wszystkich planach
Gotowe do druku · podsumowanie i mówcy · we wszystkich planach
Najedź lub dotknij dowolny output, by zobaczyć, jak naprawdę wygląda. Ten sam 30-sekundowy fragment podcastu w środku, osiem artefaktów z niego wyciągniętych.
en-GB Angielski (UK)0.6%en-AU angielski (AU)0.2%Trzy scenariusze, które widzimy co tydzień. Sam proces się nie zmienia — zmienia się to, co z nim robisz.
Długi wywiad zamienia się w 5-linijkowe streszczenie, cztery rozdziały, transkrypcję z oznaczeniami mówców i SRT do krótkich klipów — jedno zadanie, każdy efekt, który faktycznie publikujesz.
Trzygodzinne nagrania z Zoom z dwoma głosami, od początku do końca. Rozpoznawanie mówców w planie Pro. Cytuj po znaczniku czasu z eksportu DOCX. Koniec ze scrollowaniem w stylu „gdzie oni to mówili…”.
Bez auto-dołączania, bez dostępu do kalendarza, bez „agenta na twoim spotkaniu”. Wrzuć nagranie, udostępnij transkrypcję. Zadania do zrobienia wyciągnięte, podpisane, gotowe do rozdzielenia.
Sześć dróg na wejście, wszystkie działają dziś. Każdy tag to realna ścieżka ingestu, która jest już w produkcji.
Wszystkie plany obejmują ASR z rozdzielaniem mówców. Wyższe plany odblokowują większe pliki, priorytet w kolejce i podsumowanie AI.
Do testów, okazjonalnych zadań, krótkich klipów.
Dla osób prowadzących wywiady, podcasty lub regularnie długie nagrania.
Dla zespołów, agencji i działów ops pracujących na dużych wolumenach.
Rozliczenie roczne oszczędza 50% · Polityka zwrotów · W planie Free karta nie jest wymagana
Ten sam dźwięk, ten sam model. Różnica to wszystko, co robimy po zakończeniu transkrypcji.
To, co ciągle słyszę od founderów, to luka między surowym nagraniem a contentem, który da się faktycznie wypuścić. No właśnie, nikt nie chce kolejnej transkrypcji — chcą show notes, klipa, draftu wpisu na bloga zaraz po zakończeniu rozmowy. I dziś narzędzia zmuszają, żeby zszyć pięć aplikacji w jedno. Jeden pipeline, jedno miejsce. O to gramy. Widzimy ten wzorzec od miesięcy — audio wchodzi czyste, ale dalszy workflow jest sklejony zrzutami ekranu i kopiuj-wklej między Notion, Otter, Zapier i cokolwiek akurat masz otwarte w innej karcie, gdy rozmowa się kończy, a deadline jest za dwadzieścia minut…
Dalej: wkleisz gdzieś, ustrukturyzujesz, sam napiszesz streszczenie, ręcznie wyciągniesz, co do zrobienia.
Founderzy nie potrzebują transkrypcji — potrzebują tego, co po niej. Jeden pipeline bije sklejanie pięciu apek.
Dalej: wrzuć TL;DR na Slacka, podepnij DOCX do maila, wyślij klip. Wszystko zanim notatki ze spotkania zdążą wystygnąć.
— Ten sam dźwięk · Ten sam model · Różnica jest w post-processingu —
Niezamówione opinie od zalogowanych użytkowników. Nie prowadzimy kampanii z nagrodami za recenzje. Najedź, aby zatrzymać.
Podcaster otwiera 5 zakładek, żeby wypuścić jeden odcinek. Jedno zadanie na wejściu — notatki do odcinka, transkrypcja, gotowy do cięcia SRT na wyjściu. Tyle.
14 długich wywiadów z diaryzacją. DER 0,95 na czystym dźwięku jest realna. Eksporty DOCX idą prosto do szkicu pracy.
26 notatek głosowych. 3 linki TikTok. Szkic newslettera w 11 minut. Spróbuj to pobić w Otter — poczekam.
Podcaster otwiera 5 zakładek, żeby wypuścić jeden odcinek. Jedno zadanie na wejściu — notatki do odcinka, transkrypcja, gotowy do cięcia SRT na wyjściu. Tyle.
14 długich wywiadów z diaryzacją. DER 0,95 na czystym dźwięku jest realna. Eksporty DOCX idą prosto do szkicu pracy.
26 notatek głosowych. 3 linki TikTok. Szkic newslettera w 11 minut. Spróbuj to pobić w Otter — poczekam.
Webhook + wyciąganie zadań do zrobienia zabiły nam tygodniowego doca z podsumowaniem. Cała pętla jest 2 minuty teraz.
Nagrania z przesłuchań → transkrypcja z rozróżnieniem mówców → PDF z cytatami. Kiedyś zlecałem to za granicę. Teraz to jeden upload.
Włoskie rozmowy sprzedażowe → podsumowania po angielsku. Mój zespół wreszcie je czyta. Drobiazg, ogromna różnica.
Webhook + wyciąganie zadań do zrobienia zabiły nam tygodniowego doca z podsumowaniem. Cała pętla jest 2 minuty teraz.
Nagrania z przesłuchań → transkrypcja z rozróżnieniem mówców → PDF z cytatami. Kiedyś zlecałem to za granicę. Teraz to jeden upload.
Włoskie rozmowy sprzedażowe → podsumowania po angielsku. Mój zespół wreszcie je czyta. Drobiazg, ogromna różnica.
Auto-wykrywanie japońskiego po prostu działa. Kursywa szeryfowa na tej stronie to z kolei niezwiązana zbrodnia projektowa, którą szanuję.
REST API + limit na klucz = nasz wewnętrzny pipeline do notatek głosowych. Zajęło 30 minut do wpięcia. 19 $/mies. za cały zespół.
Auto-usuwanie po 24h to funkcja, której nie wiedziałam, że chcę dopóki nie sprawdziłam strony prywatności każdej konkurencji.
Auto-wykrywanie japońskiego po prostu działa. Kursywa szeryfowa na tej stronie to z kolei niezwiązana zbrodnia projektowa, którą szanuję.
REST API + limit na klucz = nasz wewnętrzny pipeline do notatek głosowych. Zajęło 30 minut do wpięcia. 19 $/mies. za cały zespół.
Auto-usuwanie po 24h to funkcja, której nie wiedziałam, że chcę dopóki nie sprawdziłam strony prywatności każdej konkurencji.
Przy czystym dźwięku i jednym lub dwóch mówcach dokładność sięga 95%+ w większości głównych języków. Spada przy szumie w tle, mocnych akcentach lub mówieniu jeden przez drugiego.
Ponad 100 języków z auto-wykrywaniem. Możesz też wymusić konkretny język, jeśli auto-wykrywanie się pomyli. Interfejs jest tylko po angielsku — wielojęzyczny UI jest w planach.
Pliki źródłowe (audio/wideo, które wgrałeś) są usuwane z naszej infrastruktury w ciągu 24 godzin po zakończeniu transkrypcji. Transkrypcja i podsumowanie zostają na twoim koncie, dopóki ich nie usuniesz — albo 30 dni po usunięciu konta. Nasi dostawcy speech-to-text (AssemblyAI główny, OpenAI zapasowy) przetwarzają audio zgodnie z własnymi politykami retencji — zobacz /privacy po pełną listę podwykonawców.
Nie. Nasz dostawca ASR ma opt-out z treningu domyślnie włączony dla płatnych endpointów — z nich korzystamy. Niczego nie dokładamy: żadnych własnych modeli trenowanych na twoich transkrypcjach, żadnej cichej analityki.
Twoje kredyty nie są pobierane. Większość błędów (prywatny URL, zbyt długi plik, kodek, którego nie obsługujemy) ma czytelny komunikat i wskazówkę jak ponowić.
Tak — w każdej chwili w portalu klienta Stripe. Plan działa do końca opłaconego okresu, a w dniu kolejnego odnowienia przechodzisz na Free.
Pełny zwrot w ciągu 7 dni, jeśli wykorzystałeś mniej niż 10% minut z planu. Po tym czasie zwrot proporcjonalny za niewykorzystaną część. Napisz na [email protected].
Tak — REST API już działa, webhooki też. Autoryzacja przez klucz API jest następna w kolejce. Limity zapytań zależnie od planu. Dokumentacja na /docs/api po założeniu konta.
Bez naklejki SOC 2. Jeśli czegoś jeszcze nie wdrożyliśmy, nie przyklejamy odznaki.
Audio i wideo, które wgrywasz, znikają w ciągu 24 godzin po zakończeniu zadania. Twarda umowa, nie ustawienie.
Dostawca ASR domyślnie nie używa nagrań do trenowania — korzystamy z tych endpointów. Niczego nie dokładamy.
Szyfrowanie w spoczynku i w transmisji, od pierwszego dnia. Wymuszony HSTS.
Respektujemy prawo dostępu, usunięcia i przenoszenia danych w UE. DPA na życzenie.
Ustawienia → Usuń konto. Wszystkie dane czyszczone w ciągu 30 dni. Bez zgłoszenia do supportu.
Pełna lista dostawców z celem przetwarzania na /privacy. Bez niespodziewanych dostawców.
30 darmowych minut miesięcznie, do 30 min na plik. Bez karty, bez karty-po-triale, bez gwiazdek. Każdy plan odwołasz jednym kliknięciem.