Транскрибування для дослідників.Готово для IRB, CAQDAS та 100+ мов.

Завантажте запис інтерв'ю або фокус-групи. Отримайте розмічений учасниками, мічений часом текст, готовий для NVivo, Atlas.ti чи MaxQDA — з видаленням аудіо через 24 години.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Дивіться, що вийде

Запис з поля на вході. Готовий до кодування транскрипт на виході.

Ми позначаємо кожен хід учасника мічею часу на початку, зберігаємо наповнювачі якщо ви просите дослівно, й експортуємо DOCX зі стилями промовців, які ваш CAQDAS-інструмент вже розпізнає.

Напівструктуроване інтерв'ю · .wavREC 2 промовці · 1:08:24
автоматично виявлено en-GB44,1 кГц моно · петличний мікрофон
~90s
Транскрипт · потоковий94% точність · дослівний режим
S1

Можете розповісти мені про перший раз, коли ви помітили зміни в районі?

S2

Е, це було мабуть 2019-го — пекарня на розі закрилась, і, так, саме тоді я зрозумів.

S1

І як себе почували, спостерігаючи це протягом тих місяців?

S2

Чесно? Як місце, яке я знав тридцять років, поволі зникало.

94% на петличному інтерв'юDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реальні варіанти · чесне порівняння

Rev (людська транскрипція). NVivo Transcription. Або ми.

Людська служба Rev — історичний стандарт для публікаційних цитат. NVivo вбудовує AI-транскрибування в самий CAQDAS-інструмент. Ми сидимо посередині — швидше ніж Rev, точніше та IRB-дружніше ніж вбудована NVivo.

Option 01

Rev (людська транскрипція)

Люди набирають машинопис. Повільно, дорого, але золотий стандарт для публікованого дослівного запису.

Час обробки12–24 години (типово)
Вартість · за хвилину$1,50 людська / $0,25 AI
Позначення промовцівТак, вручну розставлені
Зберігання аудіоНа серверах Rev
МовиEN людська · ~30 AI
Експорт CAQDASDOCX, TXT (вручну)
Best forОкремі стратегічні інтерв'ю призначені для прямого цитування у опублікованій статті, де бюджет не обмеження.
Option 02

Transcription.Solutions

AI-транскрипт за хвилини, аудіо видаляється через 24 год, DOCX оформлений для імпорту в NVivo та Atlas.ti.

Час обробки~5 хв для 60-хвилинного файлу
Вартість · за хвилину$0,03
Позначення промовцівДіаризовано, перейменуйте в додатку
Зберігання аудіоВидаляється через 24 год
Мови100+, автоматичне виявлення
Експорт CAQDASDOCX стилі заголовків + TXT
Best forДослідники, які проводять 20+ інтерв'ю та потребують швидких первинних транскриптів, потім вручну коригують 5% цитат призначених для публікації.
Option 03

NVivo Transcription / Otter

AI-транскрибування вбудоване в ваш CAQDAS-інструмент або записувач. Зручно, EN-орієнтовано, менше контролю.

Час обробкиПорівнюваний (AI)
ВартістьКредитні пакети · ~$0,30/хв
Позначення промовцівАкустична, EN-налаштована
Зберігання аудіоПов'язано з підписною versioning
МовиТочність non-EN падає
Експорт CAQDASРідне тільки для NVivo
Best forОдинокі аспіранти, які працюють виключно англійською всередині одної CAQDAS-екосистеми й хочуть найпростішого рахунку.

Цілі та флаги функцій точні станом на 2026 р. Розділення AI/людської Rev та цінування кредитів NVivo Transcription варіюються за регіонами та академічним ліцензуванням.

Специфічно для якісного дослідження

Три речі, що створюють проблеми дослідникам на загальних сервісах транскрибування.

Переведіть правильні параметри до завантаження й транскрипт імпортується прямо до вашого CAQDAS-проекту.

Що йде не так

  1. 1Наповнювачі видаляються мовчки. Загальний AI видаляє "е", "типу", неповні старти — гарно для нотаток нарад, смертельно для аналізу розмови чи discourse-роботи.
  2. 2Доменна термінологія (теоретичні рамки, назви наркотиків, названия місць, кінетичні терміни) транскрибуються фонетично. Кодування потім потребує pass find-and-replace.
  3. 3Аудіо сидить на серверах постачальника на невизначений час. Більшість планів управління даними IRB вимагають видалення або контрольованого утримання — постачальники рідко це чітко документують.

Що переключити тут

  1. 1Переключіться на режим Дослівного на формі завдання. Ми зберігаємо наповнювачі, неповні старти, повторення й маркери сміху — режим clean режиму на opt-in, а не default для дослідників.
  2. 2Вставте своє codebook терміни та власні імена в Custom vocabulary. Ми передаємо це як hint recognizer, не hard, так контекст все одно перемагає.
  3. 3Аудіо видаляється протягом 24 годин завершення завдання. Транскрипт залишається у вашому обліку. Ми можемо видати confirmation видалення для вашого IRB-файлу на запит.

Рекомендовані параметри завдання для дослідницьких інтерв'ю

Завантажте польовий запис і ці переключаються за замовчуванням. Перевидіть по-завданню з форми.

Режим
Дослівний (наповнювачі + неповні старти вкл.)
Модель промовців
Інтерв'ю · 2–8 промовців
Мова
Автоматичне виявлення · tolerance для акцентів
Міки часу
Кожен хід промовця
Зберігання аудіо
Видалити протягом 24 год
Експорт
DOCX (стилі CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% при чистому петличному інтерв'ю. Щира розмова про те, що ламається під час польових досліджень.

Польовий звук — складна справа в транскрибуванні: відкриті кімнати, акцентована англійська, накладання мови в фокус-групах. Петличні Dyadic-інтерв'ю торкаються стелі; амбієнтні записи з поля та великі фокус-групи деградують швидше. Цифри нижче походять з реальних завантажень дослідниками, а не з синтетичних бенчмарків.

95%
1-на-1, петличний або USB мікрофон

Тиха кімната, одиничний L2 або рідний носій мови, рекордер на столі. Найкращий випадок для напівструктурованих інтерв'ю — більшість dyadic досліджень падають сюди.

91%
Портативний рекордер, 2–3 промовці

Zoom H4n або рекордер телефону середину столу. Стільці промовців виявляються за напрямком. Спланюйте 5-хвилинний прохід для перейменування.

85%
Польове інтерв'ю, амбієнтний шум

Кафе, ринок, ходячи інтерв'ю. Фоновий гомін і трафік впливають на короткі відповіді; основні ходи залишаються codable.

80%
Фокус-група, 5–8 учасників

Накладання мови і спільний мік. Діаризація об'єднує деяких тихіших промовців — очікуйте розшифрування під час кодування.

Поширені питання

8 запитань, які задають дослідники про транскрибування для досліджень.

01Це припустиме за типовим планом управління даними IRB?+
Більшість тих планів, які ми бачили, схвалюють нас, як тільки вони читають два факти: аудіо видаляється протягом 24 годин після завершення завдання, й транскрипти залишаються тільки в аккаунті дослідника. Ми не є самі IRB — ваша дошка робить остаточний виклик — але ми видамо письмовий опис обробки для вашого протоколу на запит.
02Ви зберігаєте моє аудіо інтерв'ю?+
Ні. Аудіо-файл видаляється протягом 24 годин завершення завдання. Тільки транскрипт залишається у вашому обліку й ви можете видалити його будь-коли. Ми не використовуємо дослідницьке аудіо для навчання моделей.
03Можете зробити істинний дослівний — з наповнювачами, неповними стартами й накладаннями — для аналізу розмови?+
Так. Переключіть режим Дослівного на формі завдання й ми зберігаємо "е", "ну", повторення, неповні старти й токени сміху. Накладання позначається символом brace на межі ходу. Ми не робимо jefferston позначення автоматично — це все ще pass людиною.
04DOCX буде імпортувати чисто в NVivo, Atlas.ti чи MaxQDA?+
Так. Наш DOCX використовує заголовки й стилі промовців, які кожен інструмент очікує для auto-coding за промовцем. У NVivo, використовуйте File → Import → Transcripts. У Atlas.ti та MaxQDA, структура speaker-абзацу зберігається, тому auto-coding по промовцю працює з коробки.
05Як це обробляє акцентовану англійську чи багатомовні інтерв'ю?+
Ми підтримуємо 100+ мов з автоматичним виявленням, включаючи code-switching в одному записі. Важкі L2 акценти приземляються близько 85–90% на чистому звуку. Для меншинних мов з розрідженими тренувальними даними (наприклад, деякі африканські й Indigenous мови), точність нижча й ми це кажемо на вибір языка.
06Фокус-групи з 6–8 людьми — діаризація насправді працює?+
Частково. Акустична діаризація надійно відділяє 4–5 різних голосів на спільному мікрофоні. За межами того, очікуйте модель об'єднати двох найтихіших учасників. Виправлення — pass перейменування в редакторі транскрипту — більшість фокус-групових транскриптів потребують 10–15 хвилин очищення.
07Мої co-PI та аспіранти можуть отримати доступ до транскриптів в одному проекті?+
Так. Workspaces підтримужуть спільні папки з дозволами per-user — PI може бачити всі інтерв'ю, РА бачать тільки їхню призначену когорту. Корисно для multi-site досліджень де ви не хочете одного студента експортувати дані іншого.
08Для публікаційно-якісних прямих цитат, ви пропонуєте pass людиною?+
Ще ні, й ми не претендувати, що ми робимо. Для цитат що йдуть у дисертацію чи статтю, наша рекомендація: запустіть AI-транскрипт спочатку, коди у вашому CAQDAS-інструменту, потім вручну коригуйте конкретні 30–60 секунд навколо кожної цитати проти звуку до видалення. Це робочий процес, який більшість наших дослідницьких користувачів використовують.

Завантажте одне інтерв'ю. Перевірте, чи транскрипт кодується так, як кодували б ви.

30 безплатних хвилин щомісяця. Без карти. Дослівний режим, 100+ мов, CAQDAS-готовий DOCX, аудіо видаляється за 24 год.

Почати безплатно