ফোকাস গ্রুপ ট্রান্সক্রিপশন।প্রতিটি স্পিকার লেবেল করা, প্রতিটি শব্দ।

একটি ফোকাস গ্রুপ রেকর্ডিং ড্রপ করুন ৬, ৮, এমনকি ১০ টি কণ্ঠস্বর সহ। প্রতিটি অংশগ্রহণকারী লেবেলযুক্ত, ক্রস-টক ট্যাগযুক্ত, এবং একটি DOCX সহ শব্দের জন্য শব্দ ট্রান্সক্রিপ্ট পান যা সরাসরি NVivo তে লোড হয়।

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ যা বের হয় তা দেখুন

আট অংশগ্রহণকারী ইনপুট। লেবেলযুক্ত শব্দ্যবাচী আউটপুট।

ফোকাস গ্রুপ আমাদের সারিতে সবচেয়ে কঠিন ডায়ারাইজেশন কেস — একই জনতাত্ত্বিক, একই ধরনের কণ্ঠস্বর, ঘন ঘন ক্রস-টক ওভারল্যাপ। আমরা ওভারল্যাপ ইনলাইন ট্যাগ করি এটি ড্রপ করার পরিবর্তে, তারপর আপনি Speaker 3 → 'Participant_F2' একবার পুনর্নাম করেন এবং এটি প্রসারিত হয়।

ফোকাস গ্রুপ রেকর্ডিংREC মডারেটর + ৭ অংশগ্রহণকারী · ১:২৩:১৪
স্বয়ংক্রিয় শনাক্ত en-US৪৪ kHz সীমানা মাইক · WAV
~90s
ট্রান্সক্রিপ্ট · স্ট্রিমিং৯১% নির্ভুলতা · ৮ স্পিকার
S1

তাই যখন আপনি প্যাকেজিং প্রথম খুলেছিলেন — আমাকে বলুন আপনি কী লক্ষ্য করেছেন।

S2

সত্যি বলতে? প্রথম জিনিসটি ছিল গন্ধ। একটি হাসপাতালের মতো, ধরনের ক্লিনিক্যাল —

S3

হ্যাঁ, একই রকম। আমি ভেবেছিলাম এটি ল্যাভেন্ডার একটি হওয়ার কথা।

S2

সঠিক, এবং লেবেলটি ল্যাভেন্ডার বলে কিন্তু এটি সত্যিই করে না —

৮-স্পিকার রুম মাইকে ৯১% নির্ভুলতাDOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

তিনটি প্রকৃত বিকল্প · সৎ তুলনা

Rev মানব। সাধারণ AI। বা আমরা।

গবেষকরা সাধারণত একজন মানব ট্রান্সক্রাইবার (ধীর, সঠিক, ব্যয়বহুল) অথবা একটি সাধারণ AI টুলের মধ্যে বেছে নেন যা ৮-ভয়েস রোমের জন্য তৈরি করা হয়নি। আমরা মাঝখানে আছি — AI গতি, গবেষণা রেকর্ডিংয়ের জন্য সুর করা ডায়ারাইজেশন, এবং একটি DOCX যা NVivo তে সার্জারি ছাড়াই ড্রপ করে।

Option 01

Rev মানব শব্দবাচী

একজন মানুষ এটি টাইপ করে। উচ্চ নির্ভুলতা, কিন্তু ২৪-ঘন্টা টার্নঅ্যারাউন্ড এবং মূল্য ঘন্টার সাথে রৈখিকভাবে স্কেল হয়।

নির্ভুলতা~৯৯% (মানব)
টার্নঅ্যারাউন্ড১২–২৪ ঘন্টা সাধারণ
ক্রস-টক[crosstalk] চিহ্নিত
QDA এক্সপোর্টDOCX, ম্যানুয়াল ক্লিনআপ
খরচ · প্রতি মিনিট$১.৫০ শব্দবাচী
৯০-মিনিট গ্রুপ~$১३५
Best forডিসার্টেশন কাজ বা নিয়ন্ত্রিত গবেষণা যেখানে প্রতিটি অনস্বচ্ছতা মানব-যাচাইকৃত হতে হবে।
Option 02

Transcription.Solutions

৶-১০ ভয়েসের জন্য সুর করা ডায়ারাইজেশন, ইনলাইন ট্যাগযুক্ত ক্রস-টক, NVivo, ATLAS.ti, এবং Dedoose এর জন্য আকারের DOCX এক্সপোর্ট।

নির্ভুলতাগ্রুপ অডিওতে ৮৮–৯४%
টার্নঅ্যারাউন্ড~१x বাস্তব সময়
ক্রস-টকট্যাগযুক্ত, ড্রপ করা নয়
QDA এক্সপোর্টস্পিকার টার্ন সহ DOCX
খরচ · প্রতি মিনিট$०.०३
৯০-মিনিট গ্রুপ~$२.७०
Best forএকাধিক গ্রুপ চালানো গবেষকরা যারা পরের সপ্তাহ নয়, আগামীকাল সকালে NVivo তে একটি প্রথম-পাস ট্রান্সক্রিপ্ট প্রয়োজন।
Option 03

Otter / Sonix

মিটিংয়ের জন্য তৈরি সাধারণ AI। ২-३ স্পিকারে ভালো, ५ এর পরে ভেঙে পড়ে — এবং এক্সপোর্ট QDA সফ্টওয়্যার প্রত্যাশা করে না।

নির্ভুলতা५ স্পিকারের পরে ড্রপ
টার্নঅ্যারাউন্ডদ্রুত
ক্রস-টকপ্রায়শ ড্রপ করা
QDA এক্সপোর্টকোন নেটিভ NVivo ফরম্যাট নয়
স্পিকার ক্যাপনরম লিমিট ~६
খরচ$१७–२२/ব্যবহারকারী/মাসিক
Best forছোট সাক্ষাৎকার এবং ১-এর জন্য-১s যেখানে রেকর্ডিং २-३ কণ্ঠস্ব�� আছে এবং ক্যালেন্ডার কর্মপ্রবাহে থাকে।

মে २०२६ অনুযায়ী সঠিক মূল্য নির্ধারণ। নির্ভুলতা পরিসীমা আমাদের গ্রাহক ফোকাস গ্রুপ ফাইলের অভ্যন্তরীণ নমুনা থেকে আসে, কৃত্রিম বেঞ্চমার্ক নয়।

ফোকাস গ্রুপের জন্য নির্দিষ্ট

তিনটি জিনিস যা গবেষকদের জেনেরিক AI সরঞ্জামগুলিতে কামড়ায়।

সামনে সঠিক সেটিংস ফ্লিপ করুন এবং ট্রান্সক্রিপ্ট ক্লিনআপ সপ্তাহান্তে NVivo তে ড্রপ করে।

কি ভুল হয়?

  1. 1ক্রস-টক ড্রপ করা হয়। বেশিরভাগ ভোক্তা সরঞ্জাম ওভারল্যাপের সময় একজন স্পিকার বেছে নেয় এবং বাকিটি বাতিল করে। আপনি ঠিক যেখানে ঐকমত্য বা প্রতিক্রিয়া ঘটে সেখানে হারায়।
  2. 2স্পিকার ३ এ সংহত হয়। সরঞ্জামগুলি মিটিং-আকারের রুম অনুমান করে এবং ডায়ারাইজেশন ক্লাস্টার কম ক্যাপ করে। আপনার আট অংশগ্রহণকারী 'Speaker 1' / 'Speaker 2' / 'Speaker 3' হিসাবে ফিরে আসে।
  3. 3এক্সপোর্ট একটি পাঠের দেয়াল। নো প্যারাগ্রাফ ব্রেক প্রতি স্পিকার টার্ন, কোন DOCX কাঠামো NVivo ইনপুটে স্বয়ংক্রিয় কোড করতে পারে।

এখানে কী ফ্লিপ করতে হবে

  1. 1জব ফর্মে ওভারল্যাপিং স্পীচ ট্যাগ করুন চালু করুন। ক্রস-টক ইনলাইন `[overlap]` মার্কার পায় এবং উভয় স্পিকার তাদের উচ্চারণ ধরে রাখে।
  2. 2প্রত্যাশিত স্পিকার: ८-१२ স্পষ্টভাবে সেট করুন। আমরা অনুমান করার পরিবর্তে ম্যাথ করতে ডায়ারাইজেশন ক্লাস্টার গণনা আকার দিই।
  3. 3DOCX (QDA-ready) এক্সপোর্ট বেছে নিন। স্পিকার টার্ন প্যারাগ্রাফ হয়ে ওঠে লেবেল-উপসর্গগত — NVivo, ATLAS.ti, এবং Dedoose সব ইনপুটে এই ফরম্যাট স্বয়ংক্রিয়-সনাক্ত করে।

ফোকাস গ্রুপের জন্য প্রস্তাবিত জব সেটিংস

ফোকাস গ্রুপ ফাইল 'গবেষণা' টেমপ্লেট সহ ড্রপ করুন এবং এগুলি ডিফল্টরূপে চালু হয়। ফর্ম থেকে প্রতি-জব ওভাররাইড করুন।

ডায়ারাইজেশন
একাউস্টিক · প্রত্যাশিত ६-१० স্পিকার
শব্দবাচী মোড
সম্পূর্ণ — অসমতা রাখা
ওভারল্যাপ হ্যান্ডলিং
ট্যাগ ইনলাইন [overlap]
কাস্টম শব্দভাণ্ডার
স্ক্রিনার থেকে পণ্য / ব্র্যান্ড নাম
স্পিকার লেবেল
সম্পাদনযোগ্য জব-পোস্ট, সব প্রসারিত করুন
এক্সপোর্ট
DOCX (QDA-ready) · টাইমস্ট্যাম্পড TXT

Accuracy · real-world numbers

প্রতি অংশগ্রহণকারী লাভালিয়ারে ९४%। একক রুম মাইকে ८२% ধরে রাখে।

ফোকাস গ্রুপ নির্ভুলতা মাইক্রোফোন টোপোলজি দ্বারা বাধাবদ্ধ, মডেল নয়। প্রতিটি অংশগ্রহণকারীর উপর একটি লাভালিয়ার আমাদের পরিষ্কার প্রতি-স্পিকার চ্যানেল দেয় — ডায়ারাইজেশন তুচ্ছ হয়ে ওঠে। একটি সম্মেলন টেবিলে একটি সীমানা মাইক ८ টি ভয়েস সহ কঠিন কেস। নীচের সংখ্যা আমাদের পাইপলাইনে প্রকৃত গবেষণা রেকর্ডিং থেকে আসে।

94%
প্রতি অংশগ্রহণকারী লাভালিয়ার

প্রতিটি অংশগ্রহণকারী তাদের নিজস্ব ট্র্যাকে, মাল্টিট্র্যাক WAV তে মিশ্রিত। ডায়ারাইজেশন এড়িয়ে যাওয়া হয়েছে — কেবল পাঠ ত্রুটি। ডিসার্টেশন-গ্রেড কাজের জন্য সেরা কেস।

91%
সম্মেলন মাইক, ४-६ অংশগ্রহণকারী

টেবিলে কেন্দ্রীভূত সীমানা মাইক, মধ্যম রুম চিকিত্সা। কণ্ঠস্বর বৈশিষ্ট্যযুক্ত, একই লিঙ্গ এবং একই বয়সের অংশগ্রহণকারীদের মধ্যে মাঝে মধ্যে বিভ্রান্তি।

86%
একক রুম মাইক, ७-१० অংশগ্রহণকারী

ক্রস-টক ঘন ঘন, একই ভয়েস একাউস্টিক ডায়ারাইজেশনের অধীনে একত্রি�� হয়। বিশ্লেষণের আগে স্পিকার চিপে १०-মিনিট পুনর্নাম এবং মার্জ পাস আশা করুন।

82%
মনো জুম এ রিমোট গ্রুপ

সংকুচিত মনো মিশ্রণ, কোন প্রতি-চ্যানেল বিভাজন উপলব্ধ নয়। শব্দগুলি সাইবার কোডিংয়ের জন্য এখনও ব্যবহারযোগ্য, কিন্তু অসমতা-স্তরের শব্দবাচী দাবি এখানে দুর্বল হয়।

সাধারণ প্রশ্ন

ফোকাস গ্রুপ ট্রান্সক্রিপশন সম্পর্কে ८ টি জিনিস মানুষ জিজ্ঞাসা করে।

01আমি Speaker 1 কে অংশগ্রহণকারীর প্রকৃত নাম বা আইডিতে পুনর্নাম করতে পারি?+
হ্যাঁ। সম্পাদকে যেকোনো স্পিকার চিপ ক্লিক করুন, নাম বা স্ক্রিনার আইডি টাইপ করুন (যেমন 'P04_F_34'), এবং এটি সেই স্পিকার থেকে ট্রান্সক্রিপ্টে প্রতিটি টার্নে প্রসারিত হয়। DOCX এক্সপোর্ট পুনর্নাম করা লেবেল ব্যবহার করে।
02আপনি ক্রস-টক এবং ওভারল্যাপিং স্পীচ কীভাবে হ্যান্ডেল করেন?+
আমরা এটি `[overlap]` মার্কার দিয়ে ইনলাইন ট্যাগ করি এবং উভয় স্পিকারের উচ্চারণ ট্রান্সক্রিপ্টে রাখি। সাধারণ সরঞ্জামগুলি সাধারণত একটি ভয়েস বেছে নেয় এবং অন্যটি ড্রপ করে — আমরা এটি করি না, কারণ ওভারল্যাপ মুহূর্তগুলি প্রায়শই যেখানে প্রকৃত ফোকাস গ্রুপ গতিশীলতা থাকে।
03DOCX সত্যিই NVivo এবং ATLAS.ti তে পরিষ্কারভাবে আমদানি করে?+
হ্যাঁ। আমরা স্পিকার লেবেল প্যারাগ্রাফ-স্টাইল হেডিং হিসাবে এক্সপোর্ট করি, যা NVivo স্বয়ংক্রিয়ভাবে ইনপুটে কোড করে এবং ATLAS.ti স্পিকার টার্ন হিসাবে স্বীকৃতি দেয়। Dedoose এর ট্রান্সক্রিপ্ট আমদানি পথের মাধ্যমে একই DOCX গ্রহণ করে।
04আপনি একটি ফাইলে কতজন স্পিকার ডায়ারাইজ করতে পারেন?+
সফট সিলিং প্রায় १२। এর বেশি, একাউস্টিক ক্লাস্টারিং একই ভয়েস একত্রিত করা শুরু করে — যা সাধারণত আপনার দিকে एक १०-१५ মিনিট পুনর্নাম পাস মানে। সেরা ফলাফলের জন্য জব ফর্মে 'প্রত্যাশিত স্পিকার' স্পষ্টভাবে সেট করুন।
05শব্দবাচী বা পরিষ্কার — আমি বেছে নিতে পারি?+
উভয়। শব্দবাচী মোড প্রতিটি 'um', মিথ্যা শুরু, এবং পুনরাবৃত্ত শব্দ রাখে আলোচনা বিশ্লেষণের জন্য। পরিষ্কার পঠনযোগ্যতার জন্য অসমতা ছাড়ায়। আপনি প্রতি-জব বেছে নিন; গবেষণা টেমপ্লেটের ডিফল্ট শব্দবাচী।
06IRB প্রয়োজনীয়তা এবং অংশগ্রহণকারী গোপনীয়তা সম্পর্কে কী?+
ফাইলগুলি আমাদের অবকাঠামোতে প্রক্রিয়াজাত করা হয়, তৃতীয় পক্ষের API তে পাঠানো হয় না। আমরা IRB প্রোটোকলের জন্য একটি প্রতি-জব স্বয়ংক্রিয়-ডিলিট-আফটার-N-ডেজ ফ্ল্যাগ অফার করি। আমরা SOC 2 টাইপ II এবং GDPR-সম্মতিসম্পন্ন; আপনার IRB যদি এটি প্রয়োজন হয় তবে DPA আইনি পৃষ্ঠায় রয়েছে।
07আমি ভিডিও বা অডিও-মাত্র রেকর্ড করব?+
অডিও-শুধু জরিমানা — আমরা ডায়ারাইজেশনের জন্য ভিডিও ব্যবহার করি না। আপনার কাছে অংশগ্রহণকারী শনাক্তকরণের জন্য ভিডিও থাকে, এটি আপনার নিজস্ব কোডিংয়ের জন্য স্থানীয়ভাবে রাখুন; শুধু অডিও ট্র্যাক আপলোড করা দ্রুত এবং সস্তা।
08Rev মানব শব্দবাচীর সাথে খরচ কীভাবে তুলনা করে?+
একটি ९०-মিনিট ফোকাস গ্রুপ এখানে প্রায় $२.७० বনাম প্রায় $१३५ Rev শব্দবাচীতে চলে। ট্রেড-অফ নির্ভুলতা: আমরা মাইক সেটআপের উপর নির্ভর করে ८६-९४% এ অবতরণ করি, Rev এর মানব ট্রান্সক্রাইবাররা ~९९% আঘাত করে। বেশিরভাগ গবেষকরা আমাদের অগ্রিম পাস এর জন্য ব্যবহার করে এবং শুধুমাত্র নির্দিষ্ট গ্রুপ প্রয়োজন হলে মানুষে বৃদ্ধি করে।

একটি ফোকাস গ্রুপ রেকর্ডিং ড্রপ করুন। আগামীকাল NVivo তে ট্রান্সক্রিপ্ট দেখুন।

প্রতি মাসে ৩০ বিনামূল্যে মিনিট। কোন কার্ড নয়। স্পিকার লেবেল, ক্রস-টক ট্যাগিং, QDA-ready DOCX এক্সপোর্ট প্রতিটি প্ল্যানে অন্তর্ভুক্ত।

বিনামূল্যে শুরু করুন