Транскрипція інтерв'ю — транскрибуйте інтерв'ю з позначенням доповідачів та часовими мітками

Транскрипція інтерв'ю.Різні джерела — один результат.

Записка з телефону, Zoom дзвінок, ларалійний мікрофон чи портативний рекордер — завантажте записаний контент інтерв'ю і отримайте розмічений текст із позначенням доповідачів і часовим кодом, готовий для цитування.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Два голоси входять. Два голоси на виході, помічені.

Більшість інтерв'ю — це дві людини з одним пристроєм. Телефон на столі, рекордер між вами. Ми розділяємо записаний звук інтерв'ю на журналіста і джерело навіть з одного моно каналу, потім ставимо часові мітки на кожен оборот мови для цитування.

Портативний рекордер · WAVREC 2 доповідачи · 38:42

автоматично виявлено en-US48 кГц моно · 1411 кбіт/с

~90s

Транскрипція · потоковий режим94% точність

Розкажіть, що ви побачили того ранку вісімнадцятого?

Я прибув близько шостої. Двері вантажного отвору були вже відкриті, хоча не повинні були.

А ви повідомляли про цю проблему раніше — кому?

Дайан Окафор з управління будинку, двічі в березні. У мене є листи.

94% на портативному рекордері WAVDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev людський. Otter або Trint. Або ми.

Rev надсилає ваш звук людям-транскрипторам — повільно і дорого, але високої якості на складному звуку. Otter і Trint — це AI як ми, налаштовані для журналістів і дослідників. Ось де кожен підходить.

Option 01

Rev людська транскрипція

Реальні люди друкують ваше інтерв'ю. Найкраще на складному звуку, але чекати доведеться і заплатити багато.

Час виконання12–24 години типово

Точність на чистому звуку99% (за твердженням)

Позначення доповідачівРучне, включене

МовиEN людська · 30+ AI

Вартість · за хвилину$1.50 людська · $0.25 AI

ПриватністьЗвук надсилається підрядникам

Best forІнтерв'ю для суду або публікації на складному звуку, де потрібне людське вухо і у вас є час на очікування.

Option 02

Transcription.Solutions

AI транскрипція, розділені доповідачі, готово за хвилини. Один двигун для записки з телефону, Zoom або портативного рекордера.

Час виконання~3 хв на годину звуку

Точність на чистому звуку94–96%

Позначення доповідачівАвтоматичне · перейменування в редакторі

Мови99, автоматичне виявлення

Вартість · за хвилину$0.03

ПриватністьЗвук видаляється через 24 год · без тренування

Best forЖурналісти, дослідники і продюсери, які роблять кілька інтерв'ю на тиждень і потребують швидкого, цитабельного тексту без передачі підрядникам.

Option 03

Otter / Trint

AI транскрипція з редактором, орієнтованим на дослідження. Сильна в англійській, прив'язана до місячних планів.

Час виконанняReal-time to ~5 хв

Точність на чистому звуку~90–93%

Позначення доповідачівТак · EN-налаштовано

МовиOtter лише EN · Trint 30+

Вартість$17–80/користувач/місяць (передплата)

ПриватністьЗберігається в обліковому записі за замовчуванням

Best forКоманди, які хочуть розміщувати всі записані інтерв'ю в одному місці і не проти місячної плати за користувача.

Ціни і функції актуальні на 2026 рік. Час виконання Rev варіюється залежно від черги і тривалості звуку.

96% з хорошого лавалійного мікрофону. Все ще читаємо перевірку на записі в кав'ярні.

Точність інтерв'ю обмежена тим, що мікрофон насправді почув. Близько розташований стерео мікрофон для кожного доповідача — стеля; телефон на шумному столі — дно. Цифри нижче походять від робочих файлів інтерв'ю, не синтетичних тестів.

8 речей, які люди питають про транскрипцію інтерв'ю.

01Чи можу я використовувати ці транскрипції в опублікованій статті без перевірки за звуком?+

Для прямих цитат — ні, завжди перевіряйте за звуком. AI транскрипції з 94% точністю все ще помиляються в одному слові з 17, і неправильне слово в цитаті — це помилка. Транскрипція для навігації та чернетки; звук — джере��о істини.

02Мій рекордер записав стерео WAV з одним мікрофоном на кожного доповідача. Що мені робити?+

Завантажте цей файл прямо — не конвертуйте в моно спочатку. Ми виявляємо два канали і вибіраємо кожен як окрему дорізку розділення доповідачів, що дає найвищу точність. Очікуйте 96%+ у тихій кімнаті.

03А як щодо інтерв'ю записаних через телефонний дзвінок?+

Телефонний звук — 8 кГц вузька смуга, що обмежує точність близько 88% навіть на чистій лінії. Ми все ще розділяємо двох учасників за розділенням каналу, якщо ваш додаток записав їх окремо (більшість так роблять). VoIP виклики через WhatsApp або Signal звучать трохи краще, ніж PSTN.

04Чи можу я відредагувати оффреко секції перед поданням транскрипції?+

Так. У редакторі виділіть час та позначте `[REDACTED]`. Експорт замінює текст маркером редагування, але зберігає часові мітки, тому документ все ще синхронізується зі звуком.

05Ви тренуєте моделі на моїх записах інтерв'ю?+

Ні. Вихідний звук видаляється з нашої системи через 24 години від завершення, і ми не використовуємо записи клієнтів для тренування моделей через яким-небудь планом. Текст транскрипції залишається на вашому рахунку, поки ви його не видалите.

06Три-чотири людини на панельному інтерв'ю — розділення доповідачів все ще працює?+

До близько шести різних голосів, так, але точність розподілу доповідачів падає з кожною додатковою людиною та гірше, коли двоє звучить подібно. Планйте 2–3 хвилини перейменування на мітці доповідача після завантаження транскрипції.

07Чи можете ви транскрибувати інтерв'ю мовами, відмінними від англійської?+

99 мов, автоматичне виявлення. Code-switching (англійське джерело, що переходить в іспанську середину речення) обробляється в 12 мовних парах. Точність варіюється за мовами — європейські мови відповідають англійській; низькоресурсні африканські та центральноазійські мови дають на 5–10 пунктів менше.

08Я записую через Zoom дзвінок — чи мені використовувати вашу сторінку Zoom натомість?+

Один двигун, один результат. Сторінка Zoom охоплює специфіку хмарного запису (звук для кожного учасника, деградація dial-in). Якщо ви проводите одне інтерв'ю за раз по Zoom, будь-який шлях працює — завантажте MP4 тут і позначення доповідачів вийдуть однаково.