Whisper ଲୋକାଲ୍ / ଓପନ୍ ସୋର୍ସ
ଯଦି ଆପଣଙ୍କ ପାଖରେ GPU ଓ ଗୋଟିଏ ଅପରାହ୍ନ ଅଛି, ତେବେ ମାଗଣା। ବକ୍ସ ବାହାରକୁ ସ୍ପିକର୍ ଡାଇରାଇଜେସନ୍ ନାହିଁ।
64 ରୁ 320 kbps ର ଯେକୌଣସି ବିଟ୍ ରେଟ୍ ରେ MP3 ଫାଇଲ୍ ଡ୍ରପ୍ କରନ୍ତୁ। 99 ଭାଷାରେ ଟାଇମ୍ ଷ୍ଟାମ୍ପ୍ ଓ ସ୍ପିକର୍-ଲେବେଲ୍ ଯୁକ୍ତ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ପାଆନ୍ତୁ — କୌଣସି ଫର୍ମାଟ୍ କନଭର୍ସନ୍ ନାହିଁ, କୌଣସି ରି-ଏନକୋଡିଂ ନାହିଁ, କୌଣସି କ୍ୟୁରେ ଅପେକ୍ଷା ନାହିଁ।
MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously
YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more
↓ ବାହାରୁଥିବା ଫଳାଫଳ ଦେଖନ୍ତୁ
ଆମେ MP3 ଫ୍ରେମ୍ ହେଡର୍ ସିଧାସଳଖ ପଢ଼ିଥାଉ — VBR, CBR, ଜଏଣ୍ଟ-ଷ୍ଟେରିଓ, ଯେକୌଣସି ଏନକୋଡର୍ (LAME, Fraunhofer, FFmpeg)। ଯଦି ଫାଇଲ୍ ପ୍ରକୃତ ଷ୍ଟେରିଓ ଏବଂ ସ୍ପିକର୍ ମାନେ ଅଲଗା ଚ୍ୟାନେଲ୍ ରେ ଅଛନ୍ତି, ଆମେ ସେଇଟି ବ୍ୟବହାର କରି ସ୍ୱର ବିଭାଜନ କରୁ। ମୋନୋ ମିକ୍ସ-ଡାଉନ୍ ଆକୋଷ୍ଟିକ୍ ଡାଇରାଇଜେସନ୍ ଉପରେ ନିର୍ଭର କରେ।
ଆଚ୍ଛା, ଆପଣ ପ୍ରଥମେ କେବେ ବୁଝିଲେ ଯେ ଆର୍କାଇଭ୍ ଅସମ୍ପୂର୍ଣ୍ଣ ଅଛି?
ସମ୍ଭବତଃ 2019 ବେଳକୁ, ଯେତେବେଳେ ଆମେ ରିଲ୍-ଟୁ-ରିଲ୍ ଗୁଡ଼ିକୁ ଡିଜିଟାଇଜ୍ କରିବା ଆରମ୍ଭ କଲୁ।
ଆଉ ସେହି ହଜିଯାଇଥିବା ଟେପ୍ — ସେଗୁଡ଼ିକ କୋଉଠି କ୍ୟାଟାଲଗ୍ ହୋଇଥିଲା ତ?
'78 ର ଗୋଟିଏ କାଗଜ ଇଣ୍ଡେକ୍ସ ଅଛି, କିନ୍ତୁ ତାହାର ଅଧା ପାଣିରେ ନଷ୍ଟ ହୋଇଯାଇଛି।
↓ This is the dashboard
Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.
Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.
ତିନୋଟି ବାସ୍ତବ ବିକଳ୍ପ · ସତ ତୁଳନା
ଯଦି ଆପଣ ଟେକ୍ନିକାଲ୍, ଆପଣ ନିଜ ଲ୍ୟାପଟପ୍ ରେ Whisper ମାଗଣାରେ ଚଳାଇ ପାରିବେ। Otter ଓ Sonix ସବସ୍କ୍ରିପସନ୍ ଡ୍ୟାସବୋର୍ଡ ଭିତରେ MP3 ଅପଲୋଡ୍ ଗ୍ରହଣ କରନ୍ତି। ଆମେ ଫାଇଲ୍ ନେଉ, ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ଫେରାଇ ଦେଉ, ଏବଂ ଆପଣଙ୍କୁ UI ଭିତରେ ରହିବାକୁ ବାଧ୍ୟ କରୁ ନାହୁଁ।
ଯଦି ଆପଣଙ୍କ ପାଖରେ GPU ଓ ଗୋଟିଏ ଅପରାହ୍ନ ଅଛି, ତେବେ ମାଗଣା। ବକ୍ସ ବାହାରକୁ ସ୍ପିକର୍ ଡାଇରାଇଜେସନ୍ ନାହିଁ।
MP3 ଡ୍ରପ୍ କରନ୍ତୁ। ପ୍ରାୟ ରିଅଲ୍-ଟାଇମ୍ × 0.025 ରେ ସ୍ପିକର୍-ଲେବେଲ୍ ଯୁକ୍ତ ଟେକ୍ସଟ୍ ଫେରତ ପାଆନ୍ତୁ।
ସୁନ୍ଦର ଡ୍ୟାସବୋର୍ଡ, ମାସିକ ମିନିଟ୍ ସୀମା, ଇଂରାଜୀ-ଟ୍ୟୁନ୍ଡ। ଫାଇଲ୍ ଅପଲୋଡ୍ ଗୋଟିଏ ସାଇଡ୍ ଫିଚର୍ ପରି ଲାଗେ।
ମେ 2026 ସୁଦ୍ଧା ମୂଲ୍ୟ ଓ ଫିଚର୍ ଉପଲବ୍ଧତା ସଠିକ୍। Whisper କାର୍ଯ୍ୟକ୍ଷମତା ମଡେଲ୍ ଆକାର ଓ ହାର୍ଡୱେର୍ ଉପରେ ନିର୍ଭର କରେ।
MP3 ପାଇଁ ନିର୍ଦ୍ଦିଷ୍ଟ
MP3 ଗୋଟିଏ ଫର୍ମାଟ୍, ରେକର୍ଡିଂ ଶୈଳୀ ନୁହଁ — ଯାହାର ଅର୍ଥ ବିଫଳତା ଭଙ୍ଗୀ ଏନକୋଡର୍ ରୁ ଆସେ, ବକ୍ତୃତା ରୁ ନୁହଁ।
ଡିଫଲ୍ଟ ଯାହା ~80% MP3 ଫାଇଲ୍ ପାଇଁ ଫିଟ୍। ଫର୍ମ ରୁ ପ୍ରତି-ଜବ୍ ଓଭରାଇଡ୍ କରନ୍ତୁ।
Accuracy · real-world numbers
MP3 ସଠିକତା ଏନକୋଡର୍ କଣ ରଖିଛି ତା'ଦ୍ୱାରା ସୀମିତ, ଆମ ଦ୍ୱାରା ନୁହଁ। ~96 kbps ଉପରର ପର୍ସେପ୍ଚୁଆଲ୍ କମ୍ପ୍ରେସନ୍ ବକ୍ତୃତା ବୋଧଗମ୍ୟତା ବହୁତ ଭଲ ସୁରକ୍ଷିତ ରଖେ; 64 kbps ତଳକୁ ସିବିଲାଣ୍ଟ୍ ଓ କନ୍ସୋନାଣ୍ଟ୍ ବୁଡ଼ିଯିବାକୁ ଆରମ୍ଭ କରନ୍ତି। ତଳର ସଂଖ୍ୟାଗୁଡ଼ିକ ପ୍ରୋଡକ୍ସନ୍ ରେ ବାସ୍ତବ ଗ୍ରାହ��� MP3 ରୁ ସଂଗୃହୀତ।
ବକ୍ତୃତା ପାଇଁ ପ୍ରାୟ ଲସ୍-ଲେସ୍। ପଡକାଷ୍ଟ ମାଷ୍ଟର୍, ଡିକ୍ଟେସନ୍ ଆପ୍ ଏକ୍ସପୋର୍ଟ, ପ୍ରଫେସନାଲ୍ ସାକ୍ଷାତକାର ରିଗ୍। ଯଦି ସ୍ପିକର୍ ଅଲଗା ଚ୍ୟାନେଲ୍ ରେ ଅଛନ୍ତି ତେବେ ଡାଇରାଇଜେସନ୍ ସଫା।
ବକ୍ତୃତା MP3 ପାଇଁ ସର୍ବାଧିକ ସାଧାରଣ ବିଟ୍ ରେଟ୍। Zoom ଏକ୍ସପୋର୍ଟ, Riverside ଡାଉନଲୋଡ୍, ଭଏସ୍ ରେକର୍ଡର୍ ଡିଫଲ୍ଟ। ରିକଗ୍ନାଇଜର୍ ପାଇଁ କମ୍ପ୍ରେସନ୍ ଆର୍ଟିଫାକ୍ଟ ଅଶ୍ରବ୍ୟ।
ଅଧିକାଂଶ ଫୋନ୍ ରେ ଭଏସ୍ ମେମୋ ଡିଫଲ୍ଟ। ଆକୋଷ୍ଟିକ୍ ଡାଇରାଇଜେସନ୍ 2-4 ସ୍ପିକର୍ ସମ୍ଭାଳେ। ସଂଖ୍ୟା ଓ ବିଶେଷ୍ୟ ବେଳେବେଳେ ଗୋଟିଏ ନଜର ଲୋଡ଼େ।
ପୁରୁଣା ଆନ୍ସରିଂ ମେସିନ୍ ରିପ୍, ଲେକ୍ଚର୍ ଆର୍କାଇଭ୍, ସଂକୀର୍ଣ୍ଣ ବ୍ୟାଣ୍ଡ ସୋର୍ସ। ଉଚ୍ଚ-ଆବୃତ୍ତି କନ୍ସୋନାଣ୍ଟ୍ (f/s/sh) ଅସ୍ପଷ୍ଟ ହୁଅନ୍ତି। ତଥାପି ପଠନଯୋଗ୍ୟ — ଗୋଟିଏ ପ୍ରୁଫରିଡ୍ ଯୋଜନା କରନ୍ତୁ।
ସାଧାରଣ ପ୍ରଶ୍ନ
ପ୍ରତି ମାସରେ 30 ମିନିଟ୍ ମାଗଣା। କୌଣସି କାର୍ଡ ଲୋଡ଼ା ନାହିଁ। ସ୍ପିକର୍ ଲେବଲ୍, 99 ଭାଷା, ସବୁ ଏକ୍ସପୋର୍ଟ ଫର୍ମାଟ୍ ସାମିଲ।
ମାଗଣାରେ ଆରମ୍ଭ କରନ୍ତୁ