Transkrypcja dla badaczy akademickich.Świadoma IRB, gotowa do CAQDAS, 100+ języków.

Prześlij nagranie wywiadu badawczego lub nagranie grupy fokusowej. Uzyskaj tekst oznaczony głosami uczestników, sytuowany w czasie, gotowy dla NVivo, Atlas.ti lub MaxQDA — z audio usuniętym w ciągu 24 godzin.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Sprawdź, co wychodzi

Nagranie terenowe wchodzi. Transkrypt gotowy do kodowania wychodzi.

Każdą wypowiedź uczestnika oznaczamy sygnaturą czasową na początku, zachowujemy słowa-wypełniacze, jeśli prosisz o tryb dosłowny, i eksportujemy DOCX ze stylami głosów, które Twoje narzędzie CAQDAS już rozpoznaje.

Wywiad półstrukturyzowany · .wavREC 2 głosy · 1:08:24
automatycznie wykryty en-GB44.1 kHz mono · mikrofon lavalier
~90s
Transkrypt · przesyłaniedokładność 94% · tryb dosłowny
S1

Czy możesz mi opowiedzieć o pierwszym razie, kiedy zauważyłeś zmianę w okolicy?

S2

Hm, to było chyba w 2019 roku — piekarnię na rogu zamknięto, i, tak, wtedy mnie olśniło.

S1

I jak się czułeś, obserwując, jak się to zmienia przez te miesiące?

S2

Szczerze? Jakby miejsce, które znałem od trzydziestu lat, znikało, kawałek po kawałku.

dokładność 94% w wywiadzie z mikrofonem lavalierDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Trzy rzeczywiste opcje · uczciwe porównanie

Rev człowiek. NVivo Transcription. Albo my.

Usługa człowieka Rev to historyczny standard dla cytatów osiągalnych dla rozprawy. NVivo łączy transkrypcję AI wewnątrz narzędzia CAQDAS. Siedzimy pośrodku — szybciej niż Rev, bardziej dokładnie i bardziej przyjazne dla IRB niż wbudowana funkcja NVivo.

Option 01

Rev (transkrypcja człowieka)

Ludzie to piszą. Powoli, drogo, ale złoty standard dla dosłowności publikowalnej.

Czas realizacji12–24 godzin (typowo)
Koszt · na minutę$1.50 człowiek / $0.25 AI
Etykiety głośnikówTak, ręcznie umieszczone
Zatrzymanie audioPrzechowywane na serwerach Rev
JęzykiEN człowiek · ~30 AI
Eksport CAQDASDOCX, TXT (ręcznie)
Best forPojedyncze wywiady o wysokiej stawce przeznaczone do bezpośredniego cytowania w opublikowanym artykule, gdy budżet nie jest ograniczeniem.
Option 02

Transcription.Solutions

Transkrypt AI w minuty, audio usunięte w ciągu 24 godzin, DOCX ostylizowany do importu NVivo i Atlas.ti.

Czas realizacji~5 minut na plik 60-minutowy
Koszt · na minutę$0.03
Etykiety głośnikówDiarizowane, zmień nazwę w aplikacji
Zatrzymanie audioUsunięte w ciągu 24 godzin
Języki100+, automatycznie wykrywane
Eksport CAQDASStyle nagłówków DOCX + TXT
Best forBadacze prowadzący 20+ wywiadów, którzy potrzebują szybkich pierwszych transkryptów, a następnie ręcznie poprawiają 5% cytatów przeznaczonych do publikacji.
Option 03

NVivo Transcription / Otter

Transkrypcja AI dołączona do Twojego narzędzia CAQDAS lub notatnika. Wygodne, angielsko-orientowane, mniej kontroli.

Czas realizacjiPorównywalny (AI)
KosztPakiety kredytów · ~$0.30/min
Etykiety głośnikówAkustyczne, angielsko-strojone
Zatrzymanie audioPowiązane z subskrypcją
JęzykiDokładność spoza EN spada
Eksport CAQDASNative tylko do NVivo
Best forStudenci doktorski pracujący wyłącznie w angielszczyźnie w jednym ekosystemie CAQDAS, którzy chcą jedną rachunków.

Ceny i flagi funkcji dokładne na 2026 r. Podział AI/człowieka Rev i ceny kredytów NVivo Transcription różnią się w zależności od regionu i licencji akademickiej.

Specyficzne dla badań jakościowych

Trzy rzeczy, które depczą badaczy na ogólnych narzędziach transkrypcji.

Przerzuć właściwe ustawienia przed przesłaniem, a transkrypt zaimportuje się bezpośrednio do Twojego projektu CAQDAS.

Co idzie źle

  1. 1Słowa-wypełniacze usunięte w ciszy. Generyczne AI usuwa "um", "like", fałszywe starty — w porządku dla notatek ze spotkań, fatalne dla analizy konwersacji lub pracy dyskursywnej.
  2. 2Terminologia domeny (ramach teoretyczne, nazwy leków, nazwy miejsc, określenia pokrewieństwa) jest transkrybowana fonetycznie. Kodowanie wtedy wymaga przejścia find-and-replace.
  3. 3Audio siedzi na serwerach dostawcy przez nieograniczony czas. Większość planów zarządzania danymi IRB wymaga usunięcia lub kontrolowanego zatrzymania — dostawcy rzadko to jasno dokumentują.

Co przerzucić tutaj

  1. 1Przełącz na tryb Dosłowny w formularzu zadania. Zachowujemy wypełniacze, fałszywe starty, powtórzenia i markery śmiechu — tryb czysty jest opcjonalny, a nie domyślny dla badaczy.
  2. 2Wklej terminy kodebooka i nazwy własne do Niestandardowego słownika. Przechodzimy to jako wskazówkę rozpoznawania, a nie twardą substytucję, więc kontekst wciąż wygrywa.
  3. 3Audio jest usunięte w ciągu 24 godzin od ukończenia zadania. Transkrypt pozostaje na Twoim koncie. Możemy wydać potwierdzenie usunięcia do pliku IRB na żądanie.

Rekomendowane ustawienia zadania dla wywiadów badawczych

Prześlij nagranie terenowe, a te przerzucają się domyślnie. Przesłoń na zadanie z formularza.

Tryb
Dosłowny (wypełniacze + fałszywe starty włączone)
Model głośnika
Wywiad · 2–8 mówiących
Język
Automatyczne wykrycie · tolerancja akcentu
Sygnatury czasowe
Każda wypowiedź mówcy
Zatrzymanie audio
Usuń w ciągu 24 godzin
Eksport
DOCX (style CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% na czystym wywiadzie z mikrofonem lavalier. Szczerość na temat tego, co psuje pracę terenową.

Audio terenowe to trudny przypadek w transkrypcji — otwarte pomieszczenia, angliki z akcentem, nakładające się mowy w grupach fokusowych. Wywiady diadyczne z mikrofonem lavalier osiągają sufit; nagrania ambient z terenu i duże grupy fokusowe degradują się najszybciej. Poniższe liczby pochodzą z rzeczywistych przesyłek badaczy, a nie syntetycznych benchmarków.

95%
1-na-1, mikrofon lavalier lub USB

Cichy pokój, jeden mówiący L2 lub rodzimi, rejestrator na stole. Najlepszy przypadek dla wywiadów półstrukturyzowanych — większość badań diadycznych znajduje się tutaj.

91%
Rejestrator ręczny, 2–3 mówiący

Zoom H4n lub rejestrator telefonu na środku stołu. Krzesła mówców zidentyfikowane po kierunku. Zaplanuj 5-minutowy przebieg zmian nazw.

85%
Wywiad terenowy, szum otoczenia

Kawiarnia, targ, zawsze rozmowa. Szum tła i ruch drogowy wpływają na krótkie odpowiedzi; główne wypowiedzi pozostają kodowalne.

80%
Grupa fokusowa, 5–8 uczestników

Nakładające się mowy i wspólny mikrofon. Diaryzacja połączy niektóre cichsze głosy — spodziewaj się rozjaśniania w czasie kodowania.

Częste pytania

8 rzeczy, które badacze pytają o transkrypcję akademicką.

01Czy jest to akceptowalne w ramach typowego planu zarządzania danymi IRB?+
Większość planów, które widzieliśmy, zatwierdza nas, gdy przeczytają dwa fakty: audio jest usuwane w ciągu 24 godzin od ukończenia zadania, a transkrypty pozostają tylko na koncie badacza. Nie jesteśmy sami IRB — Twoja komisja wydaje ostateczną opinię — ale wystawimy pisemny opis przetwarzania do Twojego protokołu na żądanie.
02Czy zatrzymujesz mój audio wywiadu?+
Nie. Plik audio jest usuwany w ciągu 24 godzin od ukończenia zadania. Tylko transkrypt pozostaje na Twoim koncie, a możesz go usunąć w każdej chwili. Nie używamy audio badawczego do trenowania modeli.
03Czy możesz wykonać egzakt dosłowny — ze słowami-wypełniaczami, fałszywymi startami i nakładkami — dla analizy konwersacji?+
Tak. Przerzuć tryb Dosłowny w formularzu zadania, a zachowamy "um", "uh", powtórzenia, fałszywe starty i tokeny śmiechu. Nakładka jest oznaczona symbolem nawiasu u granicy wypowiedzi. Nie robimy notacji Jeffersona automatycznie — to wciąż przebieg człowieka.
04Czy DOCX będzie czysty import do NVivo, Atlas.ti lub MaxQDA?+
Tak. Nasz DOCX używa stylów nagłówków i głośników, których oczekuje każde narzędzie do automatycznego kodowania po głośniku. W NVivo użyj Plik → Import → Transkrypty. W Atlas.ti i MaxQDA struktura akapitu głośnika jest zachowana, więc automatyczne kodowanie po głośniku działa od razu.
05Jak sobie radzi z angielską wymową lub wielojęzycznymi wywiadami?+
Obsługujemy 100+ języków z automatycznym wykryciem, w tym zmianę kodu w ramach jednego nagrania. Ciężkie akcenty L2 lądują wokół 85–90% w czystym audio. W przypadku języków mniejszościowych z rzadkimi danymi treningowymi (np. niektóre języki afrykańskie i rdzennych), dokładność jest niższa i mówimy o tym w wskaźniku języka.
06Grupy fokusowe z 6–8 osobami — czy diaryzacja faktycznie działa?+
Częściowo. Akustyczna diaryzacja niezawodnie rozdziela 4–5 różnych głosów na wspólnym mikrofonie. Poza tym spodziewaj się, że model połączy dwa najcichsze uczestniki. Poprawka to przebieg zmian nazw w edytorze transkryptu — większość transkryptów grupy fokusowej wymaga 10–15 minut oczyszczania.
07Czy mój współ-PI i studenci podyplomowi mogą uzyskać dostęp do transkryptów w tym samym projekcie?+
Tak. Obszary robocze obsługują foldery współdzielone z uprawnieniami dla każdego użytkownika — PI może widzieć wszystkie wywiady, asystenci badawczy widzą tylko przypisaną kohortę. Przydatne w badaniach wielośrodkowych, gdzie nie chcesz, aby jeden student eksportował dane innego.
08Dla cytatów przeznaczonych do publikacji, czy oferujesz przebieg człowieka?+
Jeszcze nie, i nie będziemy się udawać. Dla cytatów trafiających do rozprawy lub artykułu, nasze zalecenie to: najpierw uruchom transkrypt AI, koduj w narzędziu CAQDAS, a następnie ręcznie popraw konkretne 30–60 sekund wokół każdego cytatu względem audio przed jego usunięciem. To przepływ pracy, który używa większość naszych badaczy.

Prześlij jeden wywiad. Sprawdź, czy transkrypt koduje się w sposób, w jaki Ty byś to kodował.

30 darmowych minut każdego miesiąca. Bez karty. Tryb dosłowny, 100+ języków, DOCX gotowy do CAQDAS, audio usunięte w ciągu 24 godzin.

Zacznij za darmo