رونویسی مصاحبه.سجل متفاوت، نتیجه یکسان.

یادداشت تلفن، تماس Zoom، ریگ lavalier یا ضبط‌کننده میدانی دستی — ضبط مصاحبه را رها کنید و متن برچسب‌شده،­ دارای مهر زمانی را دریافت کنید که می‌توانید از آن نقل‌قول کنید.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ ببینید چه نتیجه‌ای بیرون میآید

دو صدا میآید. دو صدا بیرون میآید، برچسب‌شده.

اکثر مصاحبه‌ها دو نفر روی یک دستگاه هستند — تلفنی روی میز، ضبط‌کننده‌ای بین شما. ما صوت مصاحبه را از کانال تک مونو به خبرنگار و منبع جدا می‌کنیم، سپس هر نوبت را برای استناد مهر زمانی می‌زنیم.

ضبط‌کننده میدانی · WAVREC ۲ سخنران · ۳۸:۴۲
تشخیص خودکار en-US۴۸ kHz مونو · ۱۴۱۱ kbps
~90s
متن · جریان‌دار۹۴% دقت
S1

می‌تونی بگی چه دیدی صبح هفدهم؟

S2

حدود شش برام. درب بارگیری قبلاً باز بود، که نباید باز بود.

S1

و تو پیش‌تر درباره مسئله درب گزارش کردی — به کی؟

S2

به Diane Okafor در تسهیلات، دو بار در مارس. من ایمیل‌ها دارم.

۹۴% روی میدانی WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

سه گزینه واقعی · مقایسه صادقانه

Rev انسانی. Otter یا Trint. یا ما.

Rev صوت شما را به رونویسیگرهای انسان می‌فرستد — کند و گران اما تعهد بالا روی صوت سخت. Otter و Trint مثل ما اولین مبنای هوش مصنوعی هستند، تطبیق‌شده برای خبرنگاران و محققان. جای هر یک این است.

Option 01

رونویسی انسانی Rev

مردم واقعی صوت مصاحبه‌تان را تایپ می‌کنند. بهترین روی صوت دشمن‌آمیز، اما منتظر می‌مانید و پول پرداخت می‌کنید.

زمان به‌دست‌آوری۱۲–۲۴ ساعت معمول
دقت روی صوت تمیز۹۹% (ادعا‌شده)
برچسب‌های سخنراندستی، شامل
زبان‌هاEN انسانی · ۳۰+ هوش مصنوعی
هزینه · در دقیقه$۱.۵۰ انسانی · $۰.۲۵ هوش مصنوعی
حریم خصوصیصوت به پیمانکاران ارسال شده
Best forمصاحبه‌های مقید به دادگاه یا منتشر‌شده‌اش روی صوت بد که به گوش انسان و یک روز انتظار نیاز دارید.
Option 02

Transcription.Solutions

رونویسی هوش مصنوعی، تقسیم‌شده سخنران، آماده در چند دقیقه. موتور یکسان برای یادداشت تلفن، Zoom یا ضبط‌کننده میدانی.

زمان به‌دست‌آوری~۳ دقیقه برای هر ساعت صوت
دقت روی صوت تمیز۹۴–۹۶%
برچسب‌های سخنرانخودکار · نام‌گذاری مجدد در ویرایشگر
زبان‌ها۹۹، تشخیص خودکار
هزینه · در دقیقه$۰.۰۳
حریم خصوصیصوت در ۲۴ ساعت حذف شد�� · بدون آموزش
Best forخبرنگاران، محققان و تهیه‌کنندگانی که مصاحبه‌های متعددی در هفته انجام می‌دهند و به متن کهن‌سنجی سریع نیاز دارند بدون بارگذاری برای پیمانکار.
Option 03

Otter / Trint

رونویسی هوش مصنوعی با ویرایشگر جهت‌یافته تحقیق. English-قوی، قفل برای طرح‌های ماهانه.

زمان به‌دست‌آوریبی‌درنگ تا ~۵ دقیقه
دقت روی صوت تمیز~۹۰–۹۳%
برچسب‌های سخنرانبله · EN-تطبیق‌شده
زبان‌هاOtter EN-تنها · Trint ۳۰+
هزینه$۱۷–۸۰/کاربر/ماه (اشتراک)
حریم خصوصیدر حساب ذخیره شده به طریقه پیش‌فرض
Best forتیم‌هایی که می‌خواهند کتابخانه‌ای از هر مصاحبه‌ای که تا به حال ضبط شده است و اشکالی برای پرداخت صندلی ماهانه در هر کاربر ندارند.

قیمت‌گذاری و پرچم‌های ویژگی تا ۲۰۲۶ دقیق. زمان به‌دست‌آوری Rev انسانی متفاوت است بر اساس عمق صف و طول صوت.

مختص مصاحبه‌ها

سه چیز مختص ابزارهای رونویسی عمومی

صوت مصاحبه‌ای به ندرت تمیز است. این تنظیمات را برگردانید و متن تحت نقل‌قول سخت می‌ماند.

چه مشکلی رخ می‌دهد

  1. 1صحبت‌کاری روی یک کانال. وقتی منبع شما تأکیدی می‌شود و روی سؤال شما صحبت می‌کند، diarization عمومی هر دو را به یک بلوک سخنران ادغام می‌کند.
  2. 2نام منابع و جاها (Okafor, Tigray, Maranello) به صورت صوتی برگشت می‌خورند. بی‌سود برای واقعیت‌سنجی برای متن.
  3. 3لحظات بیرون صحنه در همان متن به‌عنوان مواد نقل‌قول شامل می‌شوند — هیچ راهی برای علامت‌گذاری منطقه به‌عنوان محو‌شده نیست.

تنظیمات را اینجا برگردانید

  1. 1اگر ضبط‌کننده میدانی شما WAV دو کانالی (یک میکروفون در هر مسیر) ��ی‌نویسید، آن فایل را مستقیماً بارگذاری کنید. ما هر کانال را تشخیص می‌دهیم و diarization را کاملاً رد می‌کنیم.
  2. 2یادداشت‌های آمادگی‌تان را بچسبانید — نام منابع، سازمان‌ها، نام‌های مکان — در Custom vocabulary روی فرم کار. تشخیص‌کننده آن‌ها را به‌عنوان noun‌های مشخص شناخته شده معامله می‌کند.
  3. 3پس از فرود متن، منطقه را به عنوان محو در ویرایشگر علامت‌گذاری کنید. صادركنی به `[REDACTED 14:22–15:08]` در DOCX و TXT باشد، با صوت منبع حذف شده در ۲۴ ساعت بدون توجه به طرح.

تنظیمات کار توصیه‌شده برای مصاحبه‌ها

فایل مصاحبه را رها کنید و این‌ها به طریقه پیش‌فرض روشن شوند. هر‌کاری در هر کار از فرم نادیده بگیرید.

Diarization
در کانال اگر استریو · صوت به غیراینصورت
Speaker model
مصاحبه · ۲–۴ سخنران
زبان
خودکار‌تشخیص · code-switch روشن
Filler words
نگه‌داشته (حالت شفاف)
خلاصه
نقل‌قول‌های کلیدی + شاخص موضوع
صادرات
DOCX با مهرهای زمانی · TXT ساده · JSON

Accuracy · real-world numbers

۹۶% روی lavalier خوب. هنوز خوانا روی ضبط کافه‌ای.

دقت مصاحبه‌ای محدود است به آنچه میکروفن واقعاً شنید. میکروفن نزدیک استریو روی هر سخنران سقف است؛ تلفن روی میز سروصدایی کف است. اعداد پایین از فایل‌های مصاحبه تولید آمده، نه معیار‌های مصنوعی.

96%
Dual lavalier · استودیو آرام

یک میکروفون برای هر سخنران، کانال‌های جداگانه (Zoom H5/H6, Tascam DR-40). Diarization بی‌اهمیت است — خطا فقط متن است.

94%
ضبط‌کننده دستی روی میز

کندانسور یکسان بین دو سخنران، اتاق آرام. Diarization آکوستیک صدا‌ها را به‌طور قابل اعتماد تحت ۴ فوت جدا می‌کند.

90%
یادداشت صوتی تلفن · نزدیک

iPhone یا Pixel صدای یادداشت روی میز. نام‌ها و شماره‌ها گاه حذف شوند؛ جریان برای نقل‌قول خوب است.

84%
ضبط میدانی · کافه یا خیابان

دستگاه‌های اسپرسو، ترافیک، صدای سوم نزدیک. بدترین حالت در داده‌های ما — قابل استفاده برای ناوبری، نقل‌قول را برای صوت تأیید کنید.

سوالات متداول

۸ سوال متداول درباره رونویسی مصاحبه.

01آیا می‌توانم از این متن‌ها در یک مقاله منتشر شده بدون تأیید برای صوت استفاده کنم؟+
برای نقل‌قول مستقیم — خیر، همیشه برای صوت تأیید کنید. متن‌های هوش مصنوعی در دقت ۹۴% هنوز یک کلمه را در ۱۷ درمیانش بدقی می‌خوانند، و کلمه نادرست در نقل‌قول تصحیح است. متن برای ناوبری و پیش‌نویس است؛ صوت اصل درستی است.
02ضبط‌کننده‌ام یک WAV استریو را با یک میکروفون برای هر سخنران ذخیره کرد. چه کاری باید بکنم؟+
آن فایل را مستقیماً بارگذاری کنید — ابتدا به مونو تبدیل نکنید. ما دو کانال را تشخیص می‌دهیم و هر کدام را به مسیر diarization خود روانه می‌کنیم، که بالاترین‌مسیر دقت است که داریم. انتظار داشته ۹۶%+ روی یک اتاق آرام.
03درباره مصاحبه‌هایی که روی تماس تلفنی ضبط شده چطور؟+
صوت تلفن ۸ kHz باریک‌باند است، که دقت حدود ۸۸% را حتی روی یک خط تمیز محدود می‌کند. ما هنوز هم دو طرف را با استفاده از جدایی کانال جدا می‌کنیم اگر برنامه‌ی ضبط‌تان آن‌ها را جداگانه تسجیل کرد (اکثر این کار را می‌کند). تماس‌های VoIP روی WhatsApp یا Signal کمی بهتر از PSTN صدا می‌کنند.
04آیا می‌توانم بخش‌های بیرون صحنه را پیش از اشتراک متن محو کنم؟+
بله. در ویرایشگر، دامنه مهر زمانی را انتخاب کنید و آن را `[REDACTED]` علامت‌گذاری کنید. صادرات متن را با علامت محوی جایگزین می‌کند اما مهرهای زمانی را حفظ می‌کند تا سند هنوز صوت را ردیابی کند.
05آیا شما مدل‌ها را روی ضبط‌های مصاحبه‌ام آموزش می‌دهید؟+
خیر. صوت منبع از زیرساخت ما در طول ۲۴ ساعت پس از تکمیل حذف می‌شود، و ما از ضبط‌های مشتری برای آموزش مدل تحت هیچ طرح استفاده نمی‌کنیم. متن رونویسی تا زمانی که شما آن را حذف کنید در حساب شما می‌ماند.
06سه یا چهار نفر روی تحقیق پنل مصاحبه — دiarization هنوز کار می‌کند؟+
تا حدود شش صدای متمایز، بله، اما دقت روی تعیین سخنران با هر نفر اضافه‌شده کاهش می‌یابد و زمانی بدتر می‌شود که دو سخنران مشابه به نظر برسند. یک پاس نام‌گذاری مجدد ۲–۳ دقیقه‌ای روی تراشه‌های سخنران پس از فرود متن برنامه‌ریزی کنید.
07آیا می‌توانید مصاحبه‌ها را به زبان‌های دیگری غیر انگلیسی رونویسی کنید؟+
۹۹ زبان، خودکار‌تشخیص. Code-switching (منبع انگلیسی درمیان جملاً به اسپانیایی لغت‌کشی) در ۱۲ جفت زبان دستگیری می‌شود. دقت بر اساس زبان متفاوت است — زبان‌های اروپایی انگلیسی را مطابقت می‌کنند؛ زبان‌های آفریقایی و آسیای مرکزی کم‌منبع ۵–۱۰ امتیاز پایین‌تر اجرا می‌شوند.
08من برای ضبط روی تماس Zoom — آیا باید از صفحه Zoom شما به جای این استفاده کنم؟+
موتور یکسان، نتیجه یکسان. صفحه Zoom موارد‌خاص ضبط ابری را پوشش می‌دهد (صوت برای‌هر‌شرکت‌کننده، تنزل تماس dial-in). اگر یک مصاحبه را در یک زمان روی Zoom هدایت می‌کنید، یا هر دو مسیر کار می‌کند — MP4 را اینجا رها کنید و برچسب‌های سخنران به همان شکل بیرون می‌آیند.

ضبط مصاحبه‌تان را رها کنید. ببینید چه نتیجه‌ای بیرون میآید.

۳۰ دقیقه رایگان هر ماه. بدون کارت. برچسب‌های سخنران، ۹۹ زبان، تمام صادرات شامل.

شروع کنید رایگان