Transkrybuj audio do 10 godzin

Transkrybuj długie audio.Do 10 godzin. Bez limitów.

Upuść długi plik audio — do 10 godzin, 5 GB w Business. Dzielimy równolegle, utrzymujemy spójne ID mówców od początku do końca, zwracamy jedną transkrypcję zamiast numerowanego folderu.

Wrzuć audio lub wideo

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Nagrywaj prosto z przeglądarki

Rejestracja zajmuje 30 sekund — nagrywanie otwiera się od razu po niej, w panelu.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTPliki znikają automatycznie po 24 h

Godziny na wejściu. Jeden czysty plik na wyjściu.

Większość narzędzi timeout'uje przy 90-minutowej granicy lub dzieli twoje długie nagranie na numerowane części, które montują się ręcznie. Dzielimy na 12-minutowe, nakładające się okna, przetwarzamy równolegle i montujemy za globalnym przejściem diaryzacji.

Sesja strategii zarząduREC 3 mówcy · 5:14:22 · 3,1 GB

auto-detected en-GB44.1 kHz stereo · 192 kbps

~90s

Transkrypcja · jeden plik92% dokładności · t=3:14:08

Jesteśmy trzy godziny w — wróćmy do punktu o łańcuchu dostaw z sesji rano.

Tak, zwrot produkcji w Wietnamie. Myślę, że przelecimy nad ryzykiem czasu realizacji.

Czasy realizacji wzrosły z 14 do 31 dni po zmianie taryf.

I to zanim uwzględnimy zatłoczenie portów w Long Beach.

92% na całym 5-godzinnym plikuDOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Podsumowanie 5Transkrypcja 1,420Mówcy 2Eksporty

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Najważniejsze tezy

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Do zrobienia

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

Ogranicza długie pliki do 4 godzin na nagranie. ID mówców dryfują po 2 godzinach.

Maks. długość pliku4 godziny (Pro)

Maks. rozmiar pliku~1,5 GB upload

ID mówców od początku do końcaDryfuje po 2 godzinach

Wyjście dla długich plikówJeden dokument, obcięty na granicy

Koszt$16.99/użytkownik/miesiąc

Resumowalny uploadNie

Best forKrótkie spotkania do 2 godzin. Upadła na całodniowych nagraniach.

Option 02

Transcription.Solutions

10 godzin na plik. Dzielenie równoległe, globalny przeskok mówcy, jeden DOCX na wyjściu.

Maks. długość pliku10 godzin (Pro i Business)

Maks. rozmiar pliku2 GB Pro · 5 GB Business

ID mówców od początku do końcaGlobalny embedding pass

Wyjście dla długich plikówJeden plik · DOCX/SRT/TXT

Koszt · za minutę$0,03 flat niezależnie od długości

Resumowalny uploadMultipart, przetrwa przerwy

Best forCałodniowe warsztaty, przesłuchania, zebrania zarządu, historie ustne — cokolwiek poza 90-minutową ścianą.

Option 03

Whisper API + DIY dzielenie

Najtańsze za minutę. Sam budujesz dzielnik, łączenie mówców i logikę ponawiania.

Maks. długość pliku25 MB na żądanie (~25 min)

Maks. rozmiar pliku25 MB hard cap

ID mówców od początku do końcaBrak — bez diaryzacji

Wyjście dla długich plikówNumerowane części, sam łączysz

Koszt · za minutę$0,006 (OpenAI Whisper)

Czas engineeringGodziny do dni na potok

Best forInżynierowie chcący tekst na część i nie potrzebujący mówców, streszczań czy jednego wyjścia.

Ceny i limity dokładne na maj 2026. Limit długości Otter Pro ostatnio sprawdzony na ich publicznej stronie cenowej.

8 rzeczy, które ludzie pytają o transkrypcji długiego audio.

01Jaki jest rzeczywisty limit długości i rozmiaru pliku?+

10 godzin na plik zarówno w Pro, jak i Business. Pro ogranicza rozmiar pliku do 2 GB, Business do 5 GB. Jeśli masz coś dłuższego niż 10 godzin, podziel raz w naturalnym przerwaniu — utrzymamy ID mówców spójne, jeśli uploadziesz je z powrotem do siebie na tym samym projekcie.

02Czy dostaję jedną transkrypcję czy folder numerowanych części?+

Jeden plik. Zawsze. DOCX, SRT, TXT, lub JSON — twój wybór. Znaczniki czasu biegną ciągle od 00:00:00 do końca nagrania, nie resetują się na każdej granicy fragmentu.

03Jak długo zajmuje powrót 6-godzinnego pliku?+

Mniej więcej 18-25 minut na kolejce Pro, 8-12 na priorytecie Business. Przetwarzamy 12-minutowe fragmenty równolegle, więc czas ściennych skal sub-liniowo z długością pliku, nie minuta za minutę.

04Czy ID mówców pozostają spójne od początku do końca?+

Tak. Po diaryzacji na fragment, globalny embedding pass grupuje głosy na całym pliku. Mówca 3 w minucie 12 to ten sam Mówca 3 w minucie 487. To główna rzecz, którą DIY Whisper potoki robią źle.

05Co się stanie, jeśli mój upload upada w godzinie 3 z 4 GB pliku?+

Resumowalny multipart upload wznawia się od ostatnio ukończonej części. Nie re-uploadujesz pierwszych 3 GB. Działa na niestabilnym hotel Wi-Fi i mobilnym tetherings — testowaliśmy obie.

06Dlaczego Whisper API nie radzi sobie z długimi plikami?+

Endpoint OpenAI Whisper ma 25 MB na żądanie hard cap — mniej więcej 25 minut skompresowanego audio. Wszystko dłuższe potrzebuje fragmentacji, równolegej transkrypcji, potem łączenia transkrypcji i wyrównania mówców samemu. My to robimy server-side.

07Czy cena za minutę jest taka sama na 10-godzinnym pliku co na 10-minutowym?+

Tak. $0,03 za minutę flat, niezależnie od długości. 10-godzinny plik kosztuje $18. Nie doliczamy długich plików tak jak Rev ($1.50/min human × 10 godzin = $900).

08Czy mogę mieć znaczniki rozdziału lub znaczniki czasu co godzinę?+

Włącz 'Hour markers' na formularzu zadania i DOCX exportuje z przerwą nagłówka co 60 minut. SRT utrzymuje ciągły timecode. JSON ma oba — tablica rozdziału plus znaczniki czasu na poziomie słowa.

Transkrybuj długie audio.Do 10 godzin. Bez limitów.

Wrzuć audio lub wideo

Paste a link, we’ll fetch the audio

Nagrywaj prosto z przeglądarki

Godziny na wejściu. Jeden czysty plik na wyjściu.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro. DIY Whisper z dzieleniem. Lub my.

Otter Pro

Transcription.Solutions

Whisper API + DIY dzielenie

Trzy sposoby, w które narzędzia generyczne pękają poza 90-minutową granicę.

Co idzie źle

Co odwrócić tutaj

Zalecane ustawienia zadania dla długich plików

92% utrzymuje się na 5-godzinnym pliku. Jakość pozostaje stała godzina za godziną.

8 rzeczy, które ludzie pytają o transkrypcji długiego audio.

Upuść swój długi plik. Dostajesz jedną transkrypcję z powrotem.