Whisper loka / malfermitfonta
Senpaga se vi havas GPU-on kaj posttagmezon. Neniuj parolanta diarizo en kubo.
Ĵetu MP3-dosieron ĉe ajna bitkvanto de 64 ĝis 320 kbps. Ricevu tempstampitan, parolanta-etikeditan sencon en 99 lingvoj — neniaj format-konvertiĝoj, neniaj re-kodadoj, neniaj atendado en vicoj.
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ Vidu kio eliras
Ni legas la MP3-framerojn rekte — VBR, CBR, komunŝtera, iu ajn kodilo (LAME, Fraunhofer, FFmpeg). Se la dosiero estas vera stereo kun parolantoj en apartaj kanaloj, ni uzas ĝin por dividi voĉojn. Monaŭra miksaĵo retroiras al akustika diarizo.
Do kiam vi unue rimarkis ke la arkivo estis nekompleta?
Verŝajne ĉirkaŭ 2019, kiam ni komencis cigitizadi la rulumojn.
Kaj la malhavaj benko — ĉu ili estis katalogita kie ajn?
Ekzistas papera indekso de '78, sed duono el ĝi estas akvobrutita.
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
Tri realaj variantoj · honesta komparo
Vi povas ruli Whisper en via propra portatablo senpague se vi estas teknika. Otter kaj Sonix akceptas MP3-alŝutojn en abonaj tabloj. Ni prenas la dosieron, redonas la sencon, kaj ne devigas vin vivi ene de interfaco.
Senpaga se vi havas GPU-on kaj posttagmezon. Neniuj parolanta diarizo en kubo.
Ĵetu la MP3. Ricevu parolanta-etikeditan tekston reen en preskau duone de tempa kurso × 0.025.
Lustra tablaro, monata minutoj-ĉapo, angla-akordita. Dosiero-alŝuto sentas kvazaŭ flanka trajto.
Prezaro kaj trajtoĝa atingebleco akurata kiel de majo 2026. Whisper efikeco varias laŭ modelo-grandeco kaj aparataro.
Specifa al MP3
MP3 estas formato, ne enregistraĵ-stilo — kio signifas ke la manko-modoj venas de la kodilo, ne de la parolado.
Normalaĵoj kiuj kontentas ~80% de MP3-dosieroj. Invalidigu po-laboraĵo el la formo.
Accuracy · real-world numbers
MP3 akureco estas limite de kio la kodilo konservis, ne de ni. Percepto-ĉapitra premo super ~96 kbps konservas parol-klarecon tre bone; sub 64 kbps, sibilantoj kaj konsonatoj komencas disfali. Nombroj sube estas de vera klient-MP3o en produktaĵo.
Preskau-senperde por parolado. Podkasto-masteroj, diktenilo-apel-elportoj, profesia intervju-oparo. Diarizo pura se parolantoj en apartaj kanaloj.
Plej ofta bitkvanto por parol-vorta MP3o. Zoom-elportoj, Riverside-ĉutoj, voĉ-enregistrilo-normo. Ĉapitra artefaktoj senson por rekognosko.
Voĉa-meznoto-normo sur plej multaj telefonoj. Akustika diarizo manipulas 2-4 parolantoj. Nombroj kaj propraj nomoj iam bezneco respekton.
Malpla respondmašina-ripon, lekcion-arkivoj, mallarĝa-kanalaj fontoj. Altfrekvenca konsonatoj (f/s/sh) malbuloj. Ankoraŭ legebla — planu redaktadon.
Komunaj demandoj
30 senpaga minuto ĉiu monato. Nenia karto bezonceca. Parolanta etikedoj, 99 lingvoj, ĉiu elporto-formato inkluziva.
Komenci senpage