Transkribu WAV-dosierojn kun parolanto-etikedoj.Senlossa kvalito.

Ĵetu WAV-registraĵon rekt' el via kampaj ilo, DAW-fulmo aŭ intervjua ĉaro. Ni konservas la 24-bitan kapacojn intakta, rulumas diarization sur la krua PCM, kaj liveras temposekvencajn transkriptojn kun SRT en minutoj.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Vidu, kio eniras

Krua PCM nur. Pura transkripto eksteren.

Senlossa WAV signifas ĉiu sibilo, eksplodo, kaj malkolera vorto konserviĝas intakta — neniuj MP3-ŝmiroj sur konsonantoj. Se la dosiero estas multi-traka (unu parolanto por ĉiu kanalo), ni tute preterigas akustan diarization kaj dividas laŭ la kanala aranĝo.

WAV · 48 kHz / 24-bitaREC 2 trakoj · 1h 12m · 743 MB
aŭto-trovita en-GBstereo PCM · nekompresita
~90s
Transkripto · ĝisvolanta97% precizeco
S1

Revenigu min al tiu mateno en sepdek-ok — kian horon la alvoko venis?

S2

Kvaron antaŭ kvin, pli-malpli. La ĉetelo estis ŝaltita, mi memoras tion.

S1

Kaj de tie vi veturis rekt' al la haveno?

S2

Rekt' al la boatyard. Lumoj ankoraŭ brilis kiam mi eniris.

97% je per-traka WAVSRT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tri veraj variantoj · honesta komparo

Adobe Audition. Descript. Aŭ ni.

La Speech to Text de Audition estas aranĝita kun Creative Cloud kaj restas ene de la templinio. Descript importas la WAV-on en sian propran redaktilon. Ni prenas la dosieron kiel ĝi estas, liveras normajn eksportojn, kaj ne petas vin moviĝi vian projekton.

Option 01

Adobe Audition / Premiere

Transkripa panelo ene de Adobe-templinio. Ligita al Creative Cloud kaj la projekta dosiero.

PostulasCreative Cloud-abono
Parolanto-diarizationJes, nur miksita
Mult-traka WAVAplataĵita antaŭ STT
EksportoSRT · CSV · XML
Lingvoj18, mana elekto
Kosto~$23/mo (unuopa aplikaĵo)
Best forRedaktoroj, kiuj jam tranĉas en Premiere aŭ Audition kaj volas titolojn kunigitajn al la templinio.
Option 02

Transcription.Solutions

Ĵetu la WAV-on. Per-kanala diarization se ĝi estas multi-traka. Fonto disfojita en 24h.

PostulasNenio — nur la dosiero
Parolanto-diarizationPer-traka aŭ akusta
Mult-traka WAVĜis 16 kanaloj
EksportoSRT · VTT · DOCX · TXT · JSON
Lingvoj99, aŭto-trovita
Kosto · po minuto$0.03
Best forIuj, kiuj havas kruajn WAV-ojn — kampaj registraristoj, podkastistoj fulmoŝaltantaj el DAW, oralaj arĥivistoj, esploristoj.
Option 03

Descript

Importas vian WAV-on en redaktilon de Descript. Potenca, sed vi devas labori ene de ĝi.

PostulasDescript-konto + importo
Parolanto-diarizationAkusta, EN-ĝustita
Mult-traka WAVImportu kiel apartajn vidojn
EksportoTXT · SRT · DOCX
Lingvoj23, precizeco varias
Kosto$16–24/uzanto/mo
Best forPodkast-redaktoroj, kiuj volas redakti la sonarojn redaktante la transkription — la vera superpotenco de Descript.

Prezo aktuala je 2026. Adobe kaj Descript-funkcioj ŝanĝiĝas ĉiam; kontrolu nuajn dokumentojn antaŭ ol engaĝiĝi.

Specifo de WAV

Tri aferoj, kiuj mordas homojn je ĝeneraj transkrib-iloj.

Plej alŝutiloj sence mallaboradas vian WAV antaŭ sendi ĝin al rekognoscilo. Ni ne laboras.

Kio malaperas

  1. 1Mult-traka WAV aplatiĝas. 4-kanala kampaj registraĵo el Sound Devices MixPre miksiĝas al monao antaŭ STT. La per-mikrofono-aparteco, kiun vi pagis, estas ĵetata.
  2. 232-bita glita WAV-oj el Zoom F-serio aŭ MixPre estas total refuzita, aŭ detranĉita al 16-bita kaj perdi ilian kapac-reakiron.
  3. 396 kHz / 24-bita intervjuoj daŭras eterne alŝuti ĉar la ilo re-kodigadas ĝis MP3 en la retnavigilo antaŭ sendi.

Kio ŝanĝiĝi ĉi tie

  1. 1Alŝutu la mult-trakan WAV-on kiel ĝi estas (ĝis 16 kanaloj). Ni legas la kanalan aranĝon el la WAV-kapo kaj atribuas unu parolanton po trako — neniuj akusta diveno.
  2. 232-bita glito estas ĉapele akceptita. Ni konservas la glit-kapacon kiam normalizas por la rekognoscilo, tiel ĉapeloj super 0 dBFS ne detranĉas.
  3. 3Rekta binara alŝuto, neniuj rekodigado en la retnavigilo. 2 GB WAV moviĝas je via plena bendlargo kaj komencas traktadon la momenton la lasta bajto enirenmaŝinas.

Rekomendita labora agordoj por WAV

Ĵetu WAV kaj tiuj ŝaltiĝas per difaŭlto. Anstataŭigu po-labore el la formularo.

Specimenrapido
Nativa (neniuj malgradigado)
Bit-profundo
24-bita / 32-glito konservita
Diarization
Per-traka se mult-traka
Parolanto-modelo
Intervju · 2-8 parolantoj
Plenaj vortoj
Konservita (malŝaltu se bezonata)
Eksporto
DOCX · SRT · temposekvenca TXT

Accuracy · real-world numbers

97%+ je per-traka WAV. WAV donas al la rekognoscilo la plej puran eblan signalojn.

Ĉar WAV storas kruajn PCM sen perceptoscienca kunpremo, konsonantoj kaj sibloj ne estas ŝmiritaj tiel kiel MP3 ŝmiras ilin. La rekognoscilo aŭdas, kion la mikrofono aŭdis. Nombreoj sube venas el veraj laboraj WAV-oj en produktado.

98%
Studio WAV · solounua parolanto

48 kHz / 24-bita, grandmembrana kondensatoro, traktita ĉambro. Rakontado, sona libro, voĉaj pregoj atterigi ĉi tie.

96%
Mult-traka intervju-WAV

Unu kanalo po parolanto (lavo aŭ limaj mikrofonoj). Diarization estas nur kanala reilumaĵo — nur-teksta eraro.

92%
Mantenata kampaj registrilo

Zoom H5, Tascam DR-40, similaj. Stereo XY-kaptiĝo, 2-3 parolantoj, iom da ĉambrorflekto. Plej podkast-WAV-oj atterigi ĉi tie.

85%
Brua medio-kampaj WAV

Aera, kafejo, aŭto. Senloss-kaptiĝo helpas — la bruo estas vera, ne kodeca artefakto — sed precizeco ankoraŭ malupas sur sovintaj paroloj.

Oftaj demandoj

8 aferoj, kiujn homoj demandas rilatante WAV-transkribojn.

01Kia estas la maksimuma WAV-dosiera grando?+
5 GB po dosiero je la norma plano, kio estas ĉirkaŭ 8 horoj de stereo 48 kHz / 24-bita, aŭ 2,5 horoj de 96 kHz / 24-bita. Pli grandaj dosieroj estas senvare je la teama plano — kontaktu nin antaŭ ol alŝuti.
02Ĉu vi subtenas 32-bitan glitan WAV-on el Zoom F-serio aŭ MixPre?+
Jes, ĉapele. Ni legas la glitajn specimenojn sen detranĉado je 0 dBFS, tiel fortaj transientoj, kiujn vi planis tiri malsupren en postado, ankoraŭ transkribaĝas klareco. Plej ĝeneraj alŝutiloj sence desuprenĉapiĝas ĝis 16-bita unue.
03Mi havas 4-trakan WAV-on el kampaj registrilo — unu mikrofono po persono. Ĉu diarization uzos tiun?+
Ĝi uzos. Alŝutu la polifonan WAV-on rekte (ne fulmoŝaltu al stereo unue). Ni analizas la kanalan aranĝon el la WAV-kapo kaj atribuas unu parolanton po trako — multa pli fidinda ol akusta diarization sur similaj voĉoj.
04Ĉu vi mallaborados mian 96 kHz WAV-on?+
La rekognoscilo kuriĝas je 16 kHz ene — tio estas la ĉapo de homa parolkolekteblo. Sed ni konservas vian originalan dosieron netusita kaj uzas ĝin por ĉiu post-elabaro kiel sonaĵbruo-ĝardo. Viaj eksportoj referencas la originalan templinio.
05Ĉu WAV vere pli akura ol MP3 por transkribado?+
Iomete, jes — kutime 1-2 punktoj de WER sur pura parolado. La pli granda interspaco aperas sur sibloj kaj malfortaj pasoj, kie MP3-a psikoakusta kunpremo ĵetas informon, kiun la rekognoscilo uzus. Por arĥivado aŭ forenza laboro, WAV estas la ĝusta voko.
06Ĉu BWF-metadatenoj kaj tempokodo konserviĝas?+
Ni legas BWF-ĉapelojn (bext, iXML) kaj uzas la komenca tempokodo per-ekanagi la transkripcion al via seanca templinio. La originala WAV neniam modifiĝas — ni laboras je kopio, kiu disfojitas ene de 24h.
07Ĉu mi povas ĵeti dosierujon de WAV-dosieroj el DAW-seanca elsendo?+
Jes. Pluralŝuto akceptas ĝis 50 dosierojn samtempe. Ĉiu WAV ricevas sian propran laboron kaj transkripcion. Se ili estas stemoj el unu seanco, vi ankaŭ povas kunigi ilin en ununom mult-trakan WAV antaŭ alŝuto kaj ni diarizam per kanalo.
08Kiom longo vere daŭras 1-hora stereo WAV?+
Alŝuto estas la plej malrapida parto — 1-hora 48 kHz / 24-bita stereo WAV estas ĉirkaŭ 600 MB kaj daŭras 2-5 minutojn je tipa larĝbendo. Post alŝuto, la transkribo mem kuriĝas en ĉirkaŭ 4-6 minutoj je la norma vico.

Ĵetu vian WAV-on. Konservu la senloss-kvalitojn. Vidu, kio elsendas.

30 libera minuto ĉiu monato. Neniuj karto. Per-traka diarization, 32-bita glito subtena, fonta sono disfojita en 24h.

Komenci libere