Транскрипция на интервюта.Един резултат, независимо от записа.

Гласова бележка, Zoom разговор, лав микрофон или ръчен полев записващ уред — качете записа на интервюто и получете текст с обозначени говорители, временни маркери, цитируем.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Вижте какво излиза

Два гласа влизат. Два гласа излизат, обозначени.

Повечето интервюта са двама души на един уред — телефон на масата, записващ уред между вас. Разделяме надявата на интервюто между репортер и източник дори от един моно канал, След това маркираме всяка реплика за цитиране.

Полев записващ уред · WAVREC 2 говорители · 38:42
автоматично открит en-US48 kHz mono · 1411 kbps
~90s
Транскрипт · потоково94% точност
S1

Можеш ли ми да опишеш какво видя сутринта на осемнадесетия?

S2

Дойдох около шест. Вратата на кичата за товарене беше вече отворена, което не трябваше да е така.

S1

И бяхте докладвали проблема с вратата преди — на кого?

S2

На Дайън Окафор в съоръженията, два пъти през март. Имам имейлите.

94% при полева WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реални опции · честно сравнение

Rev човешка. Otter или Trint. Или ние.

Rev изпраща вашия звук до човешки транскрибери — бавно и скъпо, но висока точност на лош звук. Otter и Trint са ИИ-първо като ние, настроени за журналисти и изследователи. Ето където всеки се вписва.

Option 01

Rev човешка транскрипция

Истински хора пишат вашето интервю. Най-добро при враждебен звук, но чакате и платите.

Време на доставка12–24 часа типично
Точност при чист звук99% (твърдение)
Обозначения на говорителиРъчно, включено
ЕзициEN човешка · 30+ ИИ
Цена · на минута$1.50 човешка · $0.25 ИИ
ПоверителностЗвук изпращен на подизпълнители
Best forИнтервюта, които отиват в съд или са критични за публикуване, при лош звук, където се нуждаете от човешко ухо и имате ден за чакане.
Option 02

Transcription.Solutions

ИИ транскрипт, разделени говорители, готов в минути. Един и същ двигател за гласова бележка, Zoom или полев записващ уред.

Време на доставка~3 мин на час звук
Точност при чист звук94–96%
Обозначения на говорителиАвтоматично · преименуване в редактор
Езици99, автоматично открить
Цена · на минута$0.03
ПоверителностЗвук изтрит в 24h · без обучение
Best forЖурналисти, изследователи и продуценти, които правят множество интервюта в седмица, нуждаещи се от бърз, цитируем текст без качване на подизпълнител.
Option 03

Otter / Trint

ИИ транскрипция с редактор, ориентиран към изучаване. Силна англияност, заключена към месечни планове.

Време на доставкаРеално време до ~5 мин
Точност при чист звук~90–93%
Обозначения на говорителиДа · EN-настроена
ЕзициOtter само EN · Trint 30+
Цена$17–80/потребител/мес (абонамент)
ПоверителностСъхранено в акаунта по подразбиране
Best forЕкипи, които искат хоствана библиотека от всяко интервю, което е записано, и не възражат на месечна такса на потребител.

Цени и флагове на функции точни към 2026. Rev човешко време варира в зависимост от дълбочина на опашката и дължина на звука.

Специфично за интервюта

Три неща, които спъват хората при обичайни инструменти за транскрипция.

Звукът на интервюта редко е чист. Променете тези параметри и транскриптът издържа при цитиране.

Какво се случва

  1. 1Припокриване на един канал. Когато вашият източник е емоционален и говори над вашия въпрос, обичайната диаризация сливат двамата в един блок говор.
  2. 2Имена и места на източник (Okhafor, Tigray, Maranello) се връщат фонетично. Безполезно за проверка на факти срещу транскрипт.
  3. 3Моментом извън протокола завършват в същия транскрипт като цитируем материал — няма начин да маркирате регион като редактиран.

Какво да промените тук

  1. 1Ако вашия полев записващ уред пише WAV с два канала (един микрофон на трас), качете този файл директно. Открива се по канал и прескачаме диаризацията напълно.
  2. 2Поставете вашите бележки за подготовка — имена на източници, организации, имена на места — в Персонализирана лексика на формата на работата. Разпознаватачът ги третира като известни собствени имена.
  3. 3След като транскриптът пристигне, маркирайте регион като извън протокола в редактора. Той експортира като `[РЕДАКТИРАН 14:22–15:08]` в DOCX и TXT, със звука на източника изтрит в 24 часа независимо.

Препоръчани параметри на работата за интервюта

Качете файл на интервюта и тези се включват по подразбиране. Променете за-работа от формата.

Диаризация
По канал ако стерео · акустично иначе
Модел на говоритель
Интервю · 2–4 говорители
Език
Автоматично открить · кодово превключване включено
Пълнозвучни д��ми
Запазване (букваален режим)
Резюме
Ключови цитати + индекс на темата
Експорт
DOCX с времеви маркери · обикновен TXT · JSON

Accuracy · real-world numbers

96% със добър микрофон. Все още четлива дори при записване на кафе.

Точността на интервюто е ограничена от това, което микрофонът действително чу. Микрофонна стерео близо с един на говоритель е максималното; телефон, лежащ на шумна маса, е минималното. Числата по-долу идват от производствени интервюта файлове, а не синтетични тести.

96%
Двойна лав · студийна тишина

Един микрофон на говоритель, отделни канали (Zoom H5/H6, Tascam DR-40). Диаризацията е тривиална — грешка е само текстова.

94%
Ръчен записващ уред на маса

Един кондензаторен микрофон между двама говорители, тиха стая. Акустична диаризация разделя гласовете надеж��о под 4 фута.

90%
Гласова бележка на телефона · близко

Гласова бележка на iPhone или Pixel на масата. Имена и номера понякога липсват; кадънцът е подходящ за цитиране.

84%
Полева записване · кафе или улица

Кафе машини, трафик, трети гласове наблизо. Най-лош случай в нашите данни — използваем за навигация, проверете цитати срещу звук.

Често задавани въпроси

8 неща, които хората питат за транскрипцията на интервюта.

01Мога ли да използвам тези транскрипти в публикувана статия без проверка срещу звука?+
За преки цитати — не, винаги проверете срещу звука. ИИ транскриптите при 94% точност все още погрешат една дума на 17 в средното, а неправилната дума в цитат е корекция. Транскриптът е за навигация и написа��ие; звукът е източникът на истина.
02Мойния записващ уред запази стерео WAV с един микрофон на говоритель. Какво да правя?+
Качете този файл директно — не преобразувайте в моно първо. Открива се двата канала и маршрутизира всеки към собственият си тях диаризация, което е най-висока-точност пътят, който имаме. Очаквайте 96%+ в тиха стая.
03Какво относно интервютата записани през телефонен разговор?+
Звукът над телефона е 8 kHz узок-диапазон, което ограничава точност около 88% дори на чиста линия. Все още разделяме двете страни използвайки разделяне на канала, ако вашото приложение за записване ги даде отделно (повечето го правят). VoIP разговори над WhatsApp или Signal звучат малко по-добре от PSTN.
04Мога ли да редактирам секции извън протокола преди споделяне на транскриптът?+
Да. В редактора, изберете временния диапазон и маркирайте го `[РЕДАКТИРАН]`. Експортът заменя текста с редакция маркер, но запазва времеви маркери, така че документът все още проследява звука.
05Обучавате ли модели на моите интервю записи?+
Не. Първоначалният звук се изтрива от нашата инфраструктура в рамките на 24 часа от завършването, и ние не използвам записи на клиенти за обучение на модели под всеки план. Текстът на транскриптът остава в акаунта ви, докато го изтриете.
06Трима или четирима човека на панелно интервю — диаризацията все още функционира?+
До около шест различни гласа, да, но точност при присвояване на говор пада с всеки добавен човек и се влошава, когато два говорители звучат подобно. Планирайте преминаване от 2–3 минути събиране на говорител чипове, след като транскриптът пристига.
07Можете ли да транскрибирате интервюта на езици различни от английския?+
99 езици, автоматично открити. Кодово превключване (английски източник плъзга в испански по-средата на изречение) управлява 12 езикови двойки. Точност варира по език — европейски езици съответстват на английския; езици с нисък ресурс африкански и на Централна Азия работят 5–10 точки ниже.
08Записвам на Zoom разг��вор — трябва ли да използвам вашата Zoom страница вместо?+
Един и същ двигател, един и същ резултат. Zoom страницата покрива специфики на облачен запис (звук на участник, деградация на повиквания). Ако водите едно интервю в момента на Zoom, някой път работи — качете MP4 тук и означенията на говор излизат еднакво.

Качете записа на интервюто. Погледнете какво се получи.

30 безплатни минути всеки месец. Без карта. Обозначени говорители, 99 езици, всички експорти включени.

Начало безплатно