Transkription für akademische Forschende.IRB-konform, CAQDAS-ready, 100+ Sprachen.

Laden Sie ein Forschungsinterview oder Fokusgruppengespräch hoch. Erhalten Sie mit Sprechern gekennzeichneten, zeitgestempelten Text, bereit für NVivo, Atlas.ti oder MaxQDA — mit Audio gelöscht innerhalb von 24 Stunden.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Sehen Sie, was rauskommt

Feldaufnahme rein. Codierungsreifes Transkript raus.

Wir markieren jeden Teilnehmerbeitrag mit einem Zeitstempel am Anfang, behalten Filler-Wörter, wenn Sie wörtlich anfordern, und exportieren DOCX mit Sprecherstilen, die Ihr CAQDAS-Tool bereits erkennt.

Halbstrukturiertes Interview · .wavREC 2 Sprecher · 1:08:24
automatisch erkannt en-GB44,1 kHz Mono · Lavalier-Mikrofon
~90s
Transkript · Streaming94% Genauigkeit · wörtlicher Modus
S1

Können Sie mir erklären, wie Sie den Wandel im Viertel zum ersten Mal bemerkt haben?

S2

Äh, das war wahrscheinlich 2019 — die Bäckerei an der Ecke schloss, und ja, da hat es mich getroffen.

S1

Und wie hat sich das angefühlt, das über diese Monate hinweg zu beobachten?

S2

Ehrlich gesagt? Als würde der Ort, den ich dreißig Jahre lang kannte, stückweise verschwinden.

94% bei Lavalier-InterviewDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Drei echte Optionen · ehrlicher Vergleich

Rev menschlich. NVivo Transcription. Oder wir.

Revs menschlicher Service ist der historische Standard für dissertationswürdige Zitate. NVivo bündelt AI-Transkription im CAQDAS-Tool selbst. Wir sitzen dazwischen — schneller als Rev, genauer und IRB-freundlicher als NVivos eingebaute Lösung.

Option 01

Rev (menschliche Transkription)

Menschen tippen es. Langsam, teuer, aber der Gold-Standard für veröffentlichungsreife wörtliche Transkripte.

Bearbeitungszeit12–24 Stunden (typisch)
Kosten · pro Minute$1.50 menschlich / $0.25 AI
Sprecher-LabelsJa, manuell platziert
Audio-RetentionGespeichert auf Rev-Servern
SprachenEN menschlich · ~30 AI
CAQDAS-ExportDOCX, TXT (manuell)
Best forEinzelne hochriskedichte Interviews für direkte Zitate in veröffentlichten Papieren, wenn Budget kein Hindernis ist.
Option 02

Transcription.Solutions

AI-Transkript in Minuten, Audio gelöscht in 24h, DOCX für NVivo- und Atlas.ti-Import formatiert.

Bearbeitungszeit~5 Minuten für eine 60-Minuten-Datei
Kosten · pro Minute$0.03
Sprecher-LabelsDiarisiert, in der App umbenennen
Audio-RetentionGelöscht innerhalb von 24h
Sprachen100+, automatisch erkannt
CAQDAS-ExportDOCX Heading-Stile + TXT
Best forForschende, die 20+ Interviews führen und schnelle Erstdurchsätze brauchen, dann die 5% der Zitate für Veröffentlichung von Hand korrigieren.
Option 03

NVivo Transcription / Otter

AI-Transkription im CAQDAS-Tool oder Note-Taking-App enthalten. Praktisch, EN-orientiert, weniger Kontrolle.

BearbeitungszeitVergleichbar (AI)
KostenGutscheinpakete · ~$0.30/Minute
Sprecher-LabelsAkustisch, EN-optimiert
Audio-RetentionAn Abo gebunden
SprachenNicht-EN Genauigkeit sinkt
CAQDAS-ExportNur nativ zu NVivo
Best forEinzelne Doktoranden, die vollständig in Englisch in einem CAQDAS-Ökosystem arbeiten und eine Rechnung wollen.

Preisgestaltung und Funktionen akkurat ab 2026. Revs AI/Menschlich-Split und NVivo Transcription-Gutscheinpreise variieren nach Region und akademischer Lizenzierung.

Spezifisch für qualitative Forschung

Drei Dinge, die Forschende bei generischen Transkriptions-Tools ins Stolpern bringen.

Kippen Sie die richtigen Einstellungen um, bevor Sie hochladen, und das Transkript importiert direkt in Ihr CAQDAS-Projekt.

Was schiefgeht

  1. 1Filler-Wörter stillschweigend entfernt. Generische AI entfernt "äh", "wie", falsche Starts — in Ordnung für Besprechungsnotizen, tödlich für Gesprächsanalyse oder Diskursarbeit.
  2. 2Fachterminologie (theoretische Rahmen, Medikamentennamen, Ortsnamen, Verwandtschaftsbegriffe) wird phonetisch transkribiert. Codierung braucht dann einen Find-and-Replace-Pass.
  3. 3Audio sitzt auf den Servern des Anbieters unbegrenzt. Die meisten IRB-Datenverwaltungspläne verlangen Löschung oder überwachte Retention — Anbieter dokumentieren dies selten klar.

Was hier zu kippen ist

  1. 1Wechseln Sie zu Wörtlich-Modus auf dem Job-Formular. Wir behalten Filler, falsche Starts, Wiederholungen und Lach-Marker — Clean-Modus ist Opt-in, nicht Standard für Forschende.
  2. 2Fügen Sie Ihre Codebuch-Begriffe und Eigennamen in Custom Vocabulary ein. Wir geben es als Erkennungs-Hinweis durch, nicht als harte Substitution, also Kontext gewinnt immer noch.
  3. 3Audio ist innerhalb von 24 Stunden nach Job-Abschluss gelöscht. Transkript bleibt in Ihrem Konto. Wir können eine Löschbestätigung für Ihre IRB-Datei auf Anfrage ausstellen.

Empfohlene Job-Einstellungen für Forschungsinterviews

Laden Sie eine Feldaufnahme hoch und diese schalten sich standardmäßig ein. Pro-Job vom Formular überschreiben.

Modus
Wörtlich (Filler + falsche Starts aktiviert)
Sprecher-Modell
Interview · 2–8 Sprecher
Sprache
Automatische Erkennung · akzent-tolerant
Zeitstempel
Jeder Sprecher-Beitrag
Audio-Retention
Löschen innerhalb von 24h
Export
DOCX (CAQDAS-Stile) · TXT · SRT

Accuracy · real-world numbers

94% bei einem sauberen Lavalier-Interview. Ehrlich über das, was Feldarbeit durcheinander bringt.

Feldaudio ist der schwierige Fall in der Transkription — offene Räume, englischer L2-Akzent, überlappendes Sprechen in Fokusgruppen. Lavalier-Mikrofon-dyadische Interviews erreichen die Grenze; Umgebungsaufnahmen und große Fokusgruppen verschlechtern sich am schnellsten. Die Zahlen unten stammen aus echten Forscher-Uploads, nicht synthetischen Benchmarks.

95%
1-zu-1, Lavalier oder USB-Mikrofon

Stiller Raum, einzelner L2 oder Muttersprachler, Recorder auf dem Tisch. Bester Fall für halbstrukturierte Interviews — die meisten dyadischen Studien landen hier.

91%
Handheld-Recorder, 2–3 Sprecher

Zoom H4n oder Telefon-Recorder in der Mitte des Tisches. Sprecher-Positionen sind durch Richtung erkennbar. Planen Sie einen 5-Minuten-Umbenennungs-Pass.

85%
Feldinterview, Umgebungslärm

Café, Markt, spazierendes Interview. Hintergrund-Chat und Verkehr beeinflussen kurze Antworten; Hauptbeiträge bleiben codierbar.

80%
Fokusgruppe, 5–8 Teilnehmer

Überlappendes Sprechen und geteiltes Mikrofon. Diarisierung wird einige leisere Stimmen zusammenführen — erwarten Sie Disambiguierung zur Codierungszeit.

Häufig gestellte Fragen

8 Dinge, die Forschende über akademische Transkription fragen.

01Ist das unter einem typischen IRB-Datenverwaltungsplan akzeptabel?+
Die meisten Pläne, die wir gesehen haben, genehmigen uns, sobald sie zwei Fakten lesen: Audio wird innerhalb von 24 Stunden nach Job-Abschluss gelöscht, und Transkripte bleiben nur im Konto des Forschenden. Wir sind nicht selbst ein IRB — Ihr Board macht den endgültigen Aufruf — aber wir stellen eine schriftliche Verarbeitungsbeschreibung für Ihr Protokoll auf Anfrage zur Verfügung.
02Behalten Sie mein Interview-Audio?+
Nein. Die Audio-Datei ist innerhalb von 24 Stunden nach Job-Abschluss gelöscht. Nur das Transkript bleibt in Ihrem Konto, und Sie können es jederzeit löschen. Wir verwenden kein Forschungs-Audio zum Trainieren von Modellen.
03Können Sie echte wörtliche Transkripte — mit Fillern, falschen Starts und Überlappungen — für Gesprächsanalyse machen?+
Ja. Schalten Sie Wörtlich-Modus auf dem Job-Formular ein und wir behalten "äh", "uh", Wiederholungen, falsche Starts und Lach-Tokens. Überlappung ist mit einer Klammer am Beitrags-Rand markiert. Wir machen Jefferson-Notation nicht automatisch — das ist immer noch ein menschlicher Pass.
04Importiert die DOCX sauber in NVivo, Atlas.ti oder MaxQDA?+
Ja. Unsere DOCX nutzt die Heading- und Sprecherstile, die jedes Tool für automatisches Codieren nach Sprecher erwartet. In NVivo nutzen Sie File → Import → Transcripts. In Atlas.ti und MaxQDA ist die Sprecher-Absatz-Struktur erhalten, sodass Auto-Codieren nach Sprecher direkt funktioniert.
05Wie geschieht es mit betontem Englisch oder mehrsprachigen Interviews?+
Wir unterstützen 100+ Sprachen mit Automatische Erkennung, einschließlich Code-Switching in einer einzigen Aufnahme. Starke L2-Akzente landen um 85–90% bei sauberen Audio. Bei Minderheitssprachen mit spärlichen Trainingsdaten (z.B. einige afrikanische und indigene Sprachen) ist die Genauigkeit niedriger und wir sagen das beim Sprachenwähler.
06Fokusgruppen mit 6–8 Personen — funktioniert Diarisierung eigentlich?+
Teilweise. Akustische Diarisierung trennt zuverlässig 4–5 unterschiedliche Stimmen auf einem geteilten Mikrofon. Darüber hinaus erwartet, dass das Modell die beiden leisesten Teilnehmer zusammenführt. Die Lösung ist ein Umbenennungs-Pass im Transkript-Editor — die meisten Fokusgruppen-Transkripte brauchen 10–15 Minuten Aufräumarbeit.
07Können mein Co-PI und Doktoranden auf Transkripte im selben Projekt zugreifen?+
Ja. Workspaces unterstützen geteilte Ordner mit Pro-Nutzer-Berechtigungen — PI kann alle Interviews sehen, RAs sehen nur ihre zugewiesene Kohorte. Nützlich für Multi-Site-Studien, wo Sie nicht möchten, dass ein Student die Daten eines anderen exportiert.
08Für Veröffentlichungs-Qualität direkte Zitate, bieten Sie einen menschlichen Pass an?+
Noch nicht, und wir werden nicht so tun, als würden wir. Für Zitate, die in eine These oder einen Artikel gehen, ist unsere Empfehlung: Führen Sie zuerst das AI-Transkript, codieren Sie in Ihrem CAQDAS-Tool, dann korrigieren Sie von Hand die spezifischen 30–60 Sekunden um jedes Zitat gegen das Audio, bevor es gelöscht wird. Das ist der Workflow, den die meisten unserer Forschungs-Nutzer verwenden.

Laden Sie ein Interview hoch. Sehen Sie, ob das Transkript so codiert, wie Sie es codieren würden.

30 kostenlose Minuten jeden Monat. Keine Karte. Wörtlich-Modus, 100+ Sprachen, CAQDAS-reife DOCX, Audio gelöscht in 24h.

Kostenlos starten