Транскрипція інтерв'ю.Різні джерела один результат.

Записка з телефону, Zoom дзвінок, ларалійний мікрофон чи портативний рекордер — завантажте записаний контент інтерв'ю і отримайте розмічений текст із позначенням доповідачів і часовим кодом, готовий для цитування.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Подивіться, що вийде

Два голоси входять. Два голоси на виході, помічені.

Більшість інтерв'ю — це дві людини з одним пристроєм. Телефон на столі, рекордер між вами. Ми розділяємо записаний звук інтерв'ю на журналіста і джерело навіть з одного моно каналу, потім ставимо часові мітки на кожен оборот мови для цитування.

Портативний рекордер · WAVREC 2 доповідачи · 38:42
автоматично виявлено en-US48 кГц моно · 1411 кбіт/с
~90s
Транскрипція · потоковий режим94% точність
S1

Розкажіть, що ви побачили того ранку вісімнадцятого?

S2

Я прибув близько шостої. Двері вантажного отвору були вже відкриті, хоча не повинні були.

S1

А ви повідомляли про цю проблему раніше — кому?

S2

Дайан Окафор з управління будинку, двічі в березні. У мене є листи.

94% на портативному рекордері WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реальні варіанти · чесне порівняння

Rev людський. Otter або Trint. Або ми.

Rev надсилає ваш звук людям-транскрипторам — повільно і дорого, але високої якості на складному звуку. Otter і Trint — це AI як ми, налаштовані для журналістів і дослідників. Ось де кожен підходить.

Option 01

Rev людська транскрипція

Реальні люди друкують ваше інтерв'ю. Найкраще на складному звуку, але чекати доведеться і заплатити багато.

Час виконання12–24 години типово
Точність на чистому звуку99% (за твердженням)
Позначення доповідачівРучне, включене
МовиEN людська · 30+ AI
Вартість · за хвилину$1.50 людська · $0.25 AI
ПриватністьЗвук надсилається підрядникам
Best forІнтерв'ю для суду або публікації на складному звуку, де потрібне людське вухо і у вас є час на очікування.
Option 02

Transcription.Solutions

AI транскрипція, розділені доповідачі, готово за хвилини. Один двигун для записки з телефону, Zoom або портативного рекордера.

Час виконання~3 хв на годину звуку
Точність на чистому звуку94–96%
Позначення доповідачівАвтоматичне · перейменування в редакторі
Мови99, автоматичне виявлення
Вартість · за хвилину$0.03
ПриватністьЗвук видаляється через 24 год · без тренування
Best forЖурналісти, дослідники і продюсери, які роблять кілька інтерв'ю на тиждень і потребують швидкого, цитабельного тексту без передачі підрядникам.
Option 03

Otter / Trint

AI транскрипція з редактором, орієнтованим на дослідження. Сильна в англійській, прив'язана до місячних планів.

Час виконанняReal-time to ~5 хв
Точність на чистому звуку~90–93%
Позначення доповідачівТак · EN-налаштовано
МовиOtter лише EN · Trint 30+
Вартість$17–80/користувач/місяць (передплата)
ПриватністьЗберігається в обліковому записі за замовчуванням
Best forКоманди, які хочуть розміщувати всі записані інтерв'ю в одному місці і не проти місячної плати за користувача.

Ціни і функції актуальні на 2026 рік. Час виконання Rev варіюється залежно від черги і тривалості звуку.

Особливе для інтерв'ю

Три речі, що дошкуляють людям з універсальними інструментами транскрипції.

Звук інтерв'ю рідко чистий. Переведіть ці налаштування — і транскрипція витримає цитування.

Що йде не так

  1. 1Одночасна мова на одному каналі. Коли ваше джерело говорить від емоцій і перебиває вашу думку, універсальне розділення доповідачів об'єднує обох в один блок.
  2. 2Імена і місця джерела (Окафор, Тиграй, Маранелло) повертаються фонетичні. Безполезні для перевірки фактів за транскриптом.
  3. 3Оффреко моменти опиняються в одному документі з цитабельним матеріалом — немає способу помітити регіон як редаговано.

Що переключити тут

  1. 1Якщо ваш портативний рекордер записує двоканальний WAV (один мікрофон за доріжку), завантажте файл прямо. Ми виявляємо по каналам і пропускаємо розділення доповідачів цілком.
  2. 2Вставте свої заповітні записи — імена джерел, організації, назви місць — в Користувальницький словник на формі завдання. Розпізнавач розглядає їх як відомі власні імена.
  3. 3Після завантаження транскрипції, помітьте регіон як оффреко в редакторі. Він експортується як `[REDACTED 14:22–15:08]` в DOCX і TXT, а вихідний звук видаляється через 24 години без питань.

Рекомендовані налаштування завдання для інтерв'ю

Завантажте файл інтерв'ю і ці налаштування активуються за замовчуванням. Можете змінити для кожного завдання з формою.

Розділення доповідачів
По каналам якщо стерео · акустичне інакше
Модель доповідача
Інтерв'ю · 2–4 доповідачи
Мова
Автоматичне виявлення · code-switch ввімк
Слова-паузи
Збережено (дослівний режим)
Резюме
Ключові цитати + індекс тем
Експорт
DOCX з часовими мітками · простий TXT · JSON

Accuracy · real-world numbers

96% з хорошого лавалійного мікрофону. Все ще читаємо перевірку на записі в кав'ярні.

Точність інтерв'ю обмежена тим, що мікрофон насправді почув. Близько розташований стерео мікрофон для кожного доповідача — стеля; телефон на шумному столі — дно. Цифри нижче походять від робочих файлів інтерв'ю, не синтетичних тестів.

96%
Подвійний лавалійний мікрофон · студійна тиша

По одному мікрофону на доповідача, окремі канали (Zoom H5/H6, Tascam DR-40). Розділення доповідачів тривіальне — помилка лише в тексту.

94%
Рекордер на столі

Один конденсаторний мікрофон між двома людьми, тиха кімната. Акустичне розділення доповідачів працює надійно на відстані до 4 футів.

90%
Голосова записка з телефону · близько

Записка голосу iPhone або Pixel на столі. Імена і номери іноді пропускаються; темп в нормі для цитування.

84%
Портативний рекордер · кав'ярня або вулиця

Кавоварки, трафік, інші голоси поблизу. Найгірший випадок в наших даних — придатний для навігації, перевірте цитати за звуком.

Часті питання

8 речей, які люди питають про транскрипцію інтерв'ю.

01Чи можу я використовувати ці транскрипції в опублікованій статті без перевірки за звуком?+
Для прямих цитат — ні, завжди перевіряйте за звуком. AI транскрипції з 94% точністю все ще помиляються в одному слові з 17, і неправильне слово в цитаті — це помилка. Транскрипція для навігації та чернетки; звук — джере��о істини.
02Мій рекордер записав стерео WAV з одним мікрофоном на кожного доповідача. Що мені робити?+
Завантажте цей файл прямо — не конвертуйте в моно спочатку. Ми виявляємо два канали і вибіраємо кожен як окрему дорізку розділення доповідачів, що дає найвищу точність. Очікуйте 96%+ у тихій кімнаті.
03А як щодо інтерв'ю записаних через телефонний дзвінок?+
Телефонний звук — 8 кГц вузька смуга, що обмежує точність близько 88% навіть на чистій лінії. Ми все ще розділяємо двох учасників за розділенням каналу, якщо ваш додаток записав їх окремо (більшість так роблять). VoIP виклики через WhatsApp або Signal звучать трохи краще, ніж PSTN.
04Чи можу я відредагувати оффреко секції перед поданням транскрипції?+
Так. У редакторі виділіть час та позначте `[REDACTED]`. Експорт замінює текст маркером редагування, але зберігає часові мітки, тому документ все ще синхронізується зі звуком.
05Ви тренуєте моделі на моїх записах інтерв'ю?+
Ні. Вихідний звук видаляється з нашої системи через 24 години від завершення, і ми не використовуємо записи клієнтів для тренування моделей через яким-небудь планом. Текст транскрипції залишається на вашому рахунку, поки ви його не видалите.
06Три-чотири людини на панельному інтерв'ю — розділення доповідачів все ще працює?+
До близько шести різних голосів, так, але точність розподілу доповідачів падає з кожною додатковою людиною та гірше, коли двоє звучить подібно. Планйте 2–3 хвилини перейменування на мітці доповідача після завантаження транскрипції.
07Чи можете ви транскрибувати інтерв'ю мовами, відмінними від англійської?+
99 мов, автоматичне виявлення. Code-switching (англійське джерело, що переходить в іспанську середину речення) обробляється в 12 мовних парах. Точність варіюється за мовами — європейські мови відповідають англійській; низькоресурсні африканські та центральноазійські мови дають на 5–10 пунктів менше.
08Я записую через Zoom дзвінок — чи мені використовувати вашу сторінку Zoom натомість?+
Один двигун, один результат. Сторінка Zoom охоплює специфіку хмарного запису (звук для кожного учасника, деградація dial-in). Якщо ви проводите одне інтерв'ю за раз по Zoom, будь-який шлях працює — завантажте MP4 тут і позначення доповідачів вийдуть однаково.

Завантажте своє інтерв'ю. Подивіться, що вийде.

30 безплатних хвилин кожного місяця. Без карти. Позначення доповідачів, 99 мов, усі експорти включені.

Почати безплатно