Episode → show notes → naipublish
Ang mahabang interview ay nagiging 5-line summary, apat na chapter, transcript na may speaker labels, at SRT para sa short-form clips — isang job, lahat ng output na talagang ipa-publish mo.
VTT · DOCX · PDF
Speech-to-text at AI transcription software para sa audio at video. I-convert ang MP3, MP4, o voice papuntang text na may speaker labels at AI summary, kadalasan mas mabilis pa kaysa realtime.
MP3 · MP4 · WAV · M4A · MOV · hanggang 10 oras kada file
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ pa
Libreng tier: 30 minuto kada buwan, hanggang 30 min kada file. Walang card na hihingin.
Gumagana ang tabs. Naka-toggle ang action items. Ito mismo ang nagloload sa account mo pagkatapos ng job — parehong layout, parehong controls.
Hindi lang transcript ang kailangan ng founders — kailangan nila ng content pagkatapos ng tawag. Pinipilit sila ng mga tool na pagdugtungin ang 5 app.
Malinis na text dump · lahat ng plan
Naka-timestamp na subtitle · lahat ng plan
Speaker headers + summary · lahat ng plan
Public schema · para sa API workflows · lahat ng plan
HTML5 video player format · lahat ng plan
Mga speaker header + timestamp · lahat ng plan
Handa nang i-print · summary at speakers · lahat ng plan
I-hover o i-tap ang anumang output para makita ang aktwal na hitsura. Parehong 30-segundong podcast clip sa gitna, walong output na galing dito.
en-GB English (UK)0.6%en-AU English (AU)0.2%Tatlong pattern na nakikita namin kada linggo. Hindi nagbabago ang pipeline — ang ipini-publish mo pagkatapos noon ang nagbabago.
Ang mahabang interview ay nagiging 5-line summary, apat na chapter, transcript na may speaker labels, at SRT para sa short-form clips — isang job, lahat ng output na talagang ipa-publish mo.
Tatlong-oras na Zoom recordings na may dalawang boses, end-to-end. Speaker diarization sa Pro. Mag-cite sa timestamp mula sa DOCX export. Wala nang "saan ba nila sinabi yun…" na pag-scrub.
Walang auto-join, walang calendar permissions, walang "agent sa meeting mo." I-drop ang recording, i-share ang transcript. Action items na nakuha, napangalanan, handa nang i-triage.
Anim na paraan papasok, gumagana na ngayon. Bawat pill ay totoong ingest path na buhay sa production.
Lahat ng plan ay may diarization-quality ASR. May mas malaking file, queue priority, at AI summary ang mas mataas na tier.
Para sa pagsubok, paminsan-minsang one-offs, maiikling clip.
Para sa mga gumagawa ng interview, podcast, o paulit-ulit na long-form na trabaho.
Para sa teams, agencies, at ops na malaki ang volume.
May tipid sa annual billing 50% · Refund policy · Walang kailangang card para sa Free
Pareho ang audio, pareho ang model. Ang pinagkaiba ay lahat ng ginagawa namin pagkatapos ng transcription.
Ang madalas kong marinig sa mga founder ay ang agwat sa pagitan ng raw recordings at ng content na talagang puwede nilang ipadala. Tama, walang gustong isa pang transcript — gusto nila ng show note, clip, blog draft, bago pa matapos ang call. Oo, at pinipilit ka ng tooling ngayon na pagdugtungin ang limang app para marating iyon. Isang pipeline, isang lugar. Doon kami tumataya. Buwan na naming nakikita ang pattern na ito — malinis ang audio na pumapasok, pero ang workflow pagkatapos ay pinaglalapat ng screenshots at copy-paste sa pagitan ng Notion at Otter at Zapier at anuman ang nakabukas sa kabilang tab pagtapos ng call at dalawampung minuto na lang bago ang deadline…
Susunod: i-paste kung saan-saan, ayusin ang structure, isulat mismo ang summary, hilahin ang action items nang manu-mano.
Hindi transcript ang kailangan ng mga founder — post-processing. Mas magaling ang isang pipeline kaysa pagdugtungin ang limang app.
Susunod: kopyahin ang TL;DR sa Slack, ikabit ang DOCX sa email, ipadala ang clip. Tapos na bago pa lumamig ang call notes.
— Parehong audio · Parehong model · Nasa post-processing ang pinagkaiba —
Mga kusang review mula sa naka-sign in na user. Walang review-incentive campaign. I-hover para mag-pause.
Nagbubukas ng 5 tab ang podcaster para mailabas ang isang episode. Isang trabaho papasok — show notes, transkripsyon, clip-ready SRT. Ayun lang.
14 long-form interviews sa pamamagitan ng diarization. DER 0.95 sa malinis na audio ay totoo. Diretso sa paper draft ang DOCX exports.
26 voice memos. 3 TikTok URLs. Newsletter draft outline sa loob ng 11 minuto. Subukan mong talunin iyan sa Otter — hihintayin ko.
Nagbubukas ng 5 tab ang podcaster para mailabas ang isang episode. Isang trabaho papasok — show notes, transkripsyon, clip-ready SRT. Ayun lang.
14 long-form interviews sa pamamagitan ng diarization. DER 0.95 sa malinis na audio ay totoo. Diretso sa paper draft ang DOCX exports.
26 voice memos. 3 TikTok URLs. Newsletter draft outline sa loob ng 11 minuto. Subukan mong talunin iyan sa Otter — hihintayin ko.
Pinatay ng webhook + action-items extraction ang weekly-recap-doc namin. Ang buong loop ay 2 minuto ngayon.
Mga deposition recording → diarized na transcript → naka-cite na PDF. Dati, ino-outsource pa namin 'to sa ibang bansa. Ngayon, ito isang upload.
Italian sales calls → English summaries. Ang team ko sa wakas, nababasa na sila. Maliit na detalye, malaking epekto.
Pinatay ng webhook + action-items extraction ang weekly-recap-doc namin. Ang buong loop ay 2 minuto ngayon.
Mga deposition recording → diarized na transcript → naka-cite na PDF. Dati, ino-outsource pa namin 'to sa ibang bansa. Ngayon, ito isang upload.
Italian sales calls → English summaries. Ang team ko sa wakas, nababasa na sila. Maliit na detalye, malaking epekto.
Auto-detect ng Japanese gumagana lang. Ang serif italic sa site na ito ay hiwalay na design crime na iginagalang ko.
REST API + per-key rate-limit = ang internal voice-memo pipeline namin. Tumagal ng 30 minuto para i-wire. $19/buwan para sa buong team.
Ang 24h auto-delete ang feature na hindi ko alam na gusto ko pala hanggang sa nakita ko ang privacy page ng bawat kakumpitensya.
Auto-detect ng Japanese gumagana lang. Ang serif italic sa site na ito ay hiwalay na design crime na iginagalang ko.
REST API + per-key rate-limit = ang internal voice-memo pipeline namin. Tumagal ng 30 minuto para i-wire. $19/buwan para sa buong team.
Ang 24h auto-delete ang feature na hindi ko alam na gusto ko pala hanggang sa nakita ko ang privacy page ng bawat kakumpitensya.
Sa malinaw na audio na may isa o dalawang speaker, umaabot sa 95%+ ang accuracy sa karamihan ng pangunahing wika. Bumababa ang quality kapag may background noise, malakas na accent, o nag-o-overlap ang mga boses.
100+ na wika na may auto-detect. Pwede mo ring piliting gamitin ang isang partikular na wika kung mali ang napili ng auto-detect. English lang ang UI — naka-plano pa ang multi-language interface.
Buburahin ang source media (ang audio/video na in-upload mo) mula sa infrastructure namin sa loob ng 24 oras pagkatapos matapos ang transcription. Nananatili sa account mo ang transcript at summary hanggang i-delete mo — o 30 araw pagkatapos mong i-delete ang account mo. Pinoproseso ng mga speech-to-text provider namin (AssemblyAI primary, OpenAI fallback) ang audio sa ilalim ng sarili nilang retention policies — tingnan ang /privacy para sa buong subprocessor list.
Hindi. Ang upstream ASR provider namin ay may training opt-out by default para sa paid endpoints — yun ang ginagamit namin. Wala kaming dinadagdag: walang sariling model na tina-train sa mga transcript mo, walang tagong analytics.
Hindi mababawasan ang minuto mo. Karamihan ng mga failure (private URL, sobrang haba ng file, codec na hindi sinusuportahan) ay may malinaw na error message at gabay sa pag-retry.
Oo — anumang oras sa Stripe customer portal. Mananatili ang plan mo sa buong bayad na panahon, tapos lilipat sa Free sa susunod na renewal date.
Buong refund sa loob ng 7 araw kung wala ka pang nagagamit na 10% ng minuto sa plan mo. Pagkatapos noon, pro-rated refund para sa hindi pa nagagamit. Mag-email sa support@transcription.solutions.
Oo — buhay na ang REST API, pati na ang webhooks. Susunod sa listahan ang API key auth. May rate limits kada plan tier. Nasa /docs/api ang docs kapag may account ka na.
Walang SOC 2 sticker. Kung hindi pa namin nai-ship 'yung control, hindi kami nagsasabit ng badge.
Mawawala ang audio at video na ina-upload mo sa loob ng 24 oras pagkatapos matapos ang job. Matibay na kontrata, hindi setting.
Naka-opt out na bilang default sa training ang upstream ASR provider — 'yung endpoints na 'yon ang ginagamit namin. Wala kaming idinadagdag.
Encryption sa storage at sa transit, simula pa noong unang araw. Naka-enforce ang HSTS.
Iginagalang ang mga EU access / deletion / portability rights. DPA kapag hiniling.
Settings → Delete account. Bubura lahat ng data sa loob ng 30 araw. Hindi kailangan ng support ticket.
Buong listahan ng vendor at layunin sa /privacy. Walang biglaang vendor.
30 libreng minuto kada buwan, hanggang 30 min kada file. Walang credit card, walang card-pagkatapos-ng-trial, walang asterisk. Puwedeng i-cancel ang anumang plan kahit kailan sa isang click.