Transkripsiyon sa mahabang mga audio file.Hanggang 10 oras. Walang timeout.

Ilagay ang mahabang audio file — hanggang 10 oras, 5 GB sa Business. Chunking kami nang parallel, pinapanatili ang speaker IDs na consistent mula simula hanggang dulo, at ibabalik ang isang transcript sa halip na numbered folder.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Isang 5-hour na file, nasa gitna ng transcript

Maraming oras. Isang malinis na file na labas.

Karamihan ng tools ay nag-timeout sa paligid ng 90-minute mark o nagsasahagi ng inyong mahabang recording sa numbered partials na kailangan ninyong iugnay. Chunking kami sa 12-minute overlapping windows, nagpoproseso nang parallel, at muling isinasama gamit ang global speaker pass.

Board strategy sessionREC 3 speakers · 5:14:22 · 3.1 GB
auto-detected en-GB44.1 kHz stereo · 192 kbps
~90s
Transcript · single file92% accuracy · t=3:14:08
S1

Tatlong oras na kami — bumalik tayo sa supply chain point mula sa umaga.

S2

Tama, ang Vietnam manufacturing pivot. Sa akin, tinawaran natin ang lead-time risk.

S1

Lead times ay pumunta mula 14 hanggang 31 days pagkatapos ng tariff change.

S3

At iyan pa bago natin isaalang-alang ang port congestion sa Long Beach.

92% across full 5h fileDOCX · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tatlong tunay na option · tapat na comparison

Otter Pro. DIY Whisper chunking. O kami.

Consumer tools ay naglalimit ng file length at tahimik na nagsasagot. Ang Whisper API ay may 25 MB per-request ceiling, kaya binubuo ninyo mismo ang chunker. Tinatanggap namin ang buong 10-hour file at ibabalik ang isang transcript.

Option 01

Otter Pro

Naglalimit ng long files sa 4 oras kada recording. Speaker labels ay nag-alayo pagkatapos ng 2-hour mark.

Max file length4 hours (Pro tier)
Max file size~1.5 GB upload
Speaker IDs end-to-endNag-alayo pagkatapos ng 2 hours
Long-file outputSingle doc, truncated sa cap
Cost$16.99/user/mo
Resumable uploadNo
Best forShort meetings sa ilalim ng 2 hours. Nabibigo sa day-long recordings.
Option 02

Transcription.Solutions

10 hours kada file. Parallel chunking, global speaker pass, isang DOCX na labas.

Max file length10 hours (Pro & Business)
Max file size2 GB Pro · 5 GB Business
Speaker IDs end-to-endGlobal embedding pass
Long-file outputSingle file · DOCX/SRT/TXT
Cost · per min$0.03 flat anuman ang haba
Resumable uploadMultipart, nakakatipid sa drops
Best forDay-long workshops, depositions, board meetings, oral histories — kahit anong lampas sa 90-minute wall.
Option 03

Whisper API + DIY chunking

Pinakamurang kada minuto. Kayo ang bumubuo ng chunker, ang speaker stitch, at ang retry logic.

Max file length25 MB per request (~25 min)
Max file size25 MB hard cap
Speaker IDs end-to-endNone — walang diarization
Long-file outputNumbered partials, kayo ang ugnay
Cost · per min$0.006 (OpenAI Whisper)
Engineering timeMga oras hanggang araw kada pipeline
Best forEngineers na gustong raw text kada chunk at hindi kailangan ng speakers, summaries, o single output.

Pricing and limits accurate as of May 2026. Otter Pro length cap last verified on their public pricing page.

Specific sa long files

Tatlong paraan na nagsisira ang generic tools pagkatapos ng 90-minute mark.

Karamihan ng pipelines ay binuo para sa one-hour meetings. Ang long audio ay sinayang ang mga ito sa predictable ways — ito ay kung ano ang gagawin namin ng iba.

Kung ano ang napupunta nang mali

  1. 1Silent timeout sa 90 minuto. Ang trabaho ay umiikot ng isang oras, pagkatapos ay nagsisira nang walang useful error. Kayo ay naiwan nang walang retry.
  2. 2Speaker IDs ay nag-alayo sa pagitan ng chunks. Speaker 1 sa oras 1 ay nagiging Speaker 4 sa oras 3 dahil bawat chunk ay diarized nang nag-iisa.
  3. 3Output ay isang numbered folder. `transcript_part_01.txt` hanggang `transcript_part_24.txt` na may timestamp resets sa bawat chunk boundary. Kayo ang ugnay nito.

Kung ano ang i-flip dito

  1. 1Resumable multipart upload. Ang connection ay bumaba sa oras 2 ng upload? Ipapatuloy mula sa huling completed part. Walang re-upload ng 4 GB.
  2. 2Global speaker embedding pass. Pagkatapos ng per-chunk diarization, nag-cluster kami ng mga tinig sa buong file kaya Speaker 3 ay ang parehong tao sa minuto 12 at minuto 487.
  3. 3Single DOCX na may hour markers. Isang file, continuous timestamps, optional chapter break bawat 60 minuto. Walang stitching.

Inirerekomendang job settings para sa long files

Ilagay ang kahit anong hihigit sa 90 minuto at ang mga ito ay awtomatikong bumubukas. I-override kada trabaho mula sa form.

Chunk strategy
12 min windows · 10s overlap
Diarization
Global pass sa lahat ng chunks
Speaker model
Long-form · 2-20 speakers
Upload
Resumable multipart
Queue
Priority (Business plan)
Export
Single DOCX · hour markers on

Accuracy · real-world numbers

92% ay humahawak sa buong 5-hour file. Kalidad ay flat hour-to-hour.

Ang mahirap sa long audio ay hindi ang model — ito ay pinapanatili ang accuracy na flat mula minuto 1 hanggang minuto 600. Ang speaker drift at chunk-boundary errors ay kung ano ang kumakasama sa karamihan ng pipelines. Ang mga numero sa ibaba ay sinukat sa buong-haba na customer files, hindi ang unang 10 minuto.

95%
Studio long-form, single speaker

Audiobook narration, solo podcast, dictated manuscript. 6-10 oras ng malinis na tinig nang walang room noise. Walang diarization ang kailangan.

92%
Boardroom, 2-6 speakers

Conference table, decent mic, 3-5 oras. Global speaker pass ay pinapanatiling stable ang IDs sa buong file.

88%
All-day workshop, lapel mics

7-9 hour training day na may mic handoffs at audience Q&A. Ang mga pangalan ay kailangan ng 5-minute pass sa speaker chips.

82%
Field roundtable, 8+ speakers

Mahabang oral history, focus group, o panel na may overlapping voices at ambient noise. Magagamit, pero inaasahan ang cleanup.

Common questions

8 bagay na tinatanong ng mga tao tungkol sa long audio transcription.

01Ano ang aktwal na file length at size limit?+
10 oras kada file sa Pro at Business. Ang Pro ay naglalimit ng file size sa 2 GB, Business sa 5 GB. Kung mayroon kayong mas mahabang 10 oras, pahitsurang ito nang minsan sa natural break — pinapanatiling consistent namin ang speaker IDs kung i-upload ninyo nang pabalik-balik sa parehong project.
02Makakuha ba ako ng isang transcript o folder ng numbered partials?+
Isang file. Lagi. DOCX, SRT, TXT, o JSON — ang inyong pagpili. Ang timestamps ay tumatakbo nang patuloy mula 00:00:00 hanggang sa katapusan ng recording, hindi reset sa bawat chunk boundary.
03Gaano katagal ang 6-hour file na bumalik?+
Humigit-kumulang 18-25 minuto sa Pro queue, 8-12 sa Business priority. Nagpoproseso kami ng 12-minute chunks nang parallel, kaya ang wall-clock time ay scale sub-linearly sa file length, hindi minute-for-minute.
04Nananatiling pareho ba ang speaker IDs end-to-end?+
Oo. Pagkatapos ng per-chunk diarization, ang global embedding pass ay nag-cluster ng mga tinig sa buong file. Speaker 3 sa minuto 12 ay ang parehong Speaker 3 sa minuto 487. Ito ang pangunahing bagay na nagkakamali ang DIY Whisper pipelines.
05Kung ano ang mangyayari kung ang aking upload ay bumaba sa oras 3 ng 4 GB file?+
Ang resumable multipart upload ay nagsisimula muli mula sa huling completed part. Hindi ninyo re-upload ang unang 3 GB. Gumagana sa flaky hotel Wi-Fi at cellular tethering — sinubukan namin ang mga ito.
06Bakit nag-choke ang Whisper API sa long files?+
Ang OpenAI's Whisper endpoint ay may 25 MB per-request hard cap — humigit-kumulang 25 minuto ng compressed audio. Kahit anong mas mahabang ito ay kailangan ninyong chunk, transkripsiyon nang parallel, pagkatapos ay ugnay ang transcripts at i-align ang speakers inyong sarili. Ginagawa namin ang lahat nito server-side.
07Pareho ba ang per-minute price sa isang 10-hour file tulad ng 10-minute file?+
Oo. $0.03 kada minuto flat, anuman ang haba. Ang 10-hour file ay nagkakahalaga ng $18. Hindi kami surcharge long files ang paraan ng Rev ($1.50/min human × 10 hours = $900).
08Makakakuha ba ako ng chapter markers o timestamps bawat oras?+
I-toggle ang 'Hour markers' sa job form at ang DOCX ay nag-export na may heading break bawat 60 minuto. Ang SRT ay may patuloy na timecode. Ang JSON ay may parehong — chapter array plus word-level timestamps.

Ilagay ang inyong long file. Makakuha ng isang transcript na bumalik.

30 libre minuto bawat buwan. Walang card. Mga file hanggang 10 oras, speaker labels na manatiling consistent, single-file export.

Magsimula nang libre