رونویسی مصاحبه — رونویسی مصاحبه با برچسب‌های سخنران و مهر زمانی

رونویسی مصاحبه.سجل متفاوت، نتیجه یکسان.

یادداشت تلفن، تماس Zoom، ریگ lavalier یا ضبط‌کننده میدانی دستی — ضبط مصاحبه را رها کنید و متن برچسب‌شده، دارای مهر زمانی را دریافت کنید که می‌توانید از آن نقل‌قول کنید.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

دو صدا میآید. دو صدا بیرون میآید، برچسب‌شده.

اکثر مصاحبه‌ها دو نفر روی یک دستگاه هستند — تلفنی روی میز، ضبط‌کننده‌ای بین شما. ما صوت مصاحبه را از کانال تک مونو به خبرنگار و منبع جدا می‌کنیم، سپس هر نوبت را برای استناد مهر زمانی می‌زنیم.

ضبط‌کننده میدانی · WAVREC ۲ سخنران · ۳۸:۴۲

تشخیص خودکار en-US۴۸ kHz مونو · ۱۴۱۱ kbps

~90s

متن · جریان‌دار۹۴% دقت

می‌تونی بگی چه دیدی صبح هفدهم؟

حدود شش برام. درب بارگیری قبلاً باز بود، که نباید باز بود.

و تو پیش‌تر درباره مسئله درب گزارش کردی — به کی؟

به Diane Okafor در تسهیلات، دو بار در مارس. من ایمیل‌ها دارم.

۹۴% روی میدانی WAVDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev انسانی. Otter یا Trint. یا ما.

Rev صوت شما را به رونویسیگرهای انسان می‌فرستد — کند و گران اما تعهد بالا روی صوت سخت. Otter و Trint مثل ما اولین مبنای هوش مصنوعی هستند، تطبیق‌شده برای خبرنگاران و محققان. جای هر یک این است.

Option 01

رونویسی انسانی Rev

مردم واقعی صوت مصاحبه‌تان را تایپ می‌کنند. بهترین روی صوت دشمن‌آمیز، اما منتظر می‌مانید و پول پرداخت می‌کنید.

زمان به‌دست‌آوری۱۲–۲۴ ساعت معمول

دقت روی صوت تمیز۹۹% (ادعا‌شده)

برچسب‌های سخنراندستی، شامل

زبان‌هاEN انسانی · ۳۰+ هوش مصنوعی

هزینه · در دقیقه$۱.۵۰ انسانی · $۰.۲۵ هوش مصنوعی

حریم خصوصیصوت به پیمانکاران ارسال شده

Best forمصاحبه‌های مقید به دادگاه یا منتشر‌شده‌اش روی صوت بد که به گوش انسان و یک روز انتظار نیاز دارید.

Option 02

Transcription.Solutions

رونویسی هوش مصنوعی، تقسیم‌شده سخنران، آماده در چند دقیقه. موتور یکسان برای یادداشت تلفن، Zoom یا ضبط‌کننده میدانی.

زمان به‌دست‌آوری~۳ دقیقه برای هر ساعت صوت

دقت روی صوت تمیز۹۴–۹۶%

برچسب‌های سخنرانخودکار · نام‌گذاری مجدد در ویرایشگر

زبان‌ها۹۹، تشخیص خودکار

هزینه · در دقیقه$۰.۰۳

حریم خصوصیصوت در ۲۴ ساعت حذف شد�� · بدون آموزش

Best forخبرنگاران، محققان و تهیه‌کنندگانی که مصاحبه‌های متعددی در هفته انجام می‌دهند و به متن کهن‌سنجی سریع نیاز دارند بدون بارگذاری برای پیمانکار.

Option 03

Otter / Trint

رونویسی هوش مصنوعی با ویرایشگر جهت‌یافته تحقیق. English-قوی، قفل برای طرح‌های ماهانه.

زمان به‌دست‌آوریبی‌درنگ تا ~۵ دقیقه

دقت روی صوت تمیز~۹۰–۹۳%

برچسب‌های سخنرانبله · EN-تطبیق‌شده

زبان‌هاOtter EN-تنها · Trint ۳۰+

هزینه$۱۷–۸۰/کاربر/ماه (اشتراک)

حریم خصوصیدر حساب ذخیره شده به طریقه پیش‌فرض

Best forتیم‌هایی که می‌خواهند کتابخانه‌ای از هر مصاحبه‌ای که تا به حال ضبط شده است و اشکالی برای پرداخت صندلی ماهانه در هر کاربر ندارند.

قیمت‌گذاری و پرچم‌های ویژگی تا ۲۰۲۶ دقیق. زمان به‌دست‌آوری Rev انسانی متفاوت است بر اساس عمق صف و طول صوت.

۹۶% روی lavalier خوب. هنوز خوانا روی ضبط کافه‌ای.

دقت مصاحبه‌ای محدود است به آنچه میکروفن واقعاً شنید. میکروفن نزدیک استریو روی هر سخنران سقف است؛ تلفن روی میز سروصدایی کف است. اعداد پایین از فایل‌های مصاحبه تولید آمده، نه معیار‌های مصنوعی.

۸ سوال متداول درباره رونویسی مصاحبه.

01آیا می‌توانم از این متن‌ها در یک مقاله منتشر شده بدون تأیید برای صوت استفاده کنم؟+

برای نقل‌قول مستقیم — خیر، همیشه برای صوت تأیید کنید. متن‌های هوش مصنوعی در دقت ۹۴% هنوز یک کلمه را در ۱۷ درمیانش بدقی می‌خوانند، و کلمه نادرست در نقل‌قول تصحیح است. متن برای ناوبری و پیش‌نویس است؛ صوت اصل درستی است.

02ضبط‌کننده‌ام یک WAV استریو را با یک میکروفون برای هر سخنران ذخیره کرد. چه کاری باید بکنم؟+

آن فایل را مستقیماً بارگذاری کنید — ابتدا به مونو تبدیل نکنید. ما دو کانال را تشخیص می‌دهیم و هر کدام را به مسیر diarization خود روانه می‌کنیم، که بالاترین‌مسیر دقت است که داریم. انتظار داشته ۹۶%+ روی یک اتاق آرام.

03درباره مصاحبه‌هایی که روی تماس تلفنی ضبط شده چطور؟+

صوت تلفن ۸ kHz باریک‌باند است، که دقت حدود ۸۸% را حتی روی یک خط تمیز محدود می‌کند. ما هنوز هم دو طرف را با استفاده از جدایی کانال جدا می‌کنیم اگر برنامه‌ی ضبط‌تان آن‌ها را جداگانه تسجیل کرد (اکثر این کار را می‌کند). تماس‌های VoIP روی WhatsApp یا Signal کمی بهتر از PSTN صدا می‌کنند.

04آیا می‌توانم بخش‌های بیرون صحنه را پیش از اشتراک متن محو کنم؟+

بله. در ویرایشگر، دامنه مهر زمانی را انتخاب کنید و آن را `[REDACTED]` علامت‌گذاری کنید. صادرات متن را با علامت محوی جایگزین می‌کند اما مهرهای زمانی را حفظ می‌کند تا سند هنوز صوت را ردیابی کند.

05آیا شما مدل‌ها را روی ضبط‌های مصاحبه‌ام آموزش می‌دهید؟+

خیر. صوت منبع از زیرساخت ما در طول ۲۴ ساعت پس از تکمیل حذف می‌شود، و ما از ضبط‌های مشتری برای آموزش مدل تحت هیچ طرح استفاده نمی‌کنیم. متن رونویسی تا زمانی که شما آن را حذف کنید در حساب شما می‌ماند.

06سه یا چهار نفر روی تحقیق پنل مصاحبه — دiarization هنوز کار می‌کند؟+

تا حدود شش صدای متمایز، بله، اما دقت روی تعیین سخنران با هر نفر اضافه‌شده کاهش می‌یابد و زمانی بدتر می‌شود که دو سخنران مشابه به نظر برسند. یک پاس نام‌گذاری مجدد ۲–۳ دقیقه‌ای روی تراشه‌های سخنران پس از فرود متن برنامه‌ریزی کنید.

07آیا می‌توانید مصاحبه‌ها را به زبان‌های دیگری غیر انگلیسی رونویسی کنید؟+

۹۹ زبان، خودکار‌تشخیص. Code-switching (منبع انگلیسی درمیان جملاً به اسپانیایی لغت‌کشی) در ۱۲ جفت زبان دستگیری می‌شود. دقت بر اساس زبان متفاوت است — زبان‌های اروپایی انگلیسی را مطابقت می‌کنند؛ زبان‌های آفریقایی و آسیای مرکزی کم‌منبع ۵–۱۰ امتیاز پایین‌تر اجرا می‌شوند.

08من برای ضبط روی تماس Zoom — آیا باید از صفحه Zoom شما به جای این استفاده کنم؟+

موتور یکسان، نتیجه یکسان. صفحه Zoom موارد‌خاص ضبط ابری را پوشش می‌دهد (صوت برای‌هر‌شرکت‌کننده، تنزل تماس dial-in). اگر یک مصاحبه را در یک زمان روی Zoom هدایت می‌کنید، یا هر دو مسیر کار می‌کند — MP4 را اینجا رها کنید و برچسب‌های سخنران به همان شکل بیرون می‌آیند.