Interview-Transkription — Interviews mit Sprecherlabels und Zeitstempeln transkribieren

Interview-Transkription.Unterschiedliche Aufnahme, gleiches Ergebnis.

Telefon-Memo, Zoom-Anruf, Lavaliermikrofon oder tragbarer Feldrecorder — lade die Interview-Aufnahme hoch und bekommen Text mit Sprecherlabels und Zeitstempeln zum Zitieren.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Zwei Stimmen rein. Zwei Stimmen raus, gelabelt.

Die meisten Interviews sind zwei Personen auf einem Gerät — ein Telefon auf dem Tisch, ein Rekorder zwischen euch. Wir trennen die Interview-Aufnahme in Reporterin und Quelle auf, auch von nur einem Mono-Kanal, und versehen jeden Beitrag mit einem Zeitstempel zum Zitieren.

Field recorder · WAVREC 2 speakers · 38:42

auto-detected en-US48 kHz mono · 1411 kbps

~90s

Transkript · Streaming94% Genauigkeit

Kannst du mir erzählen, was du am Morgen des achtzehnten gesehen hast?

Ich bin gegen sechs angekommen. Die Ladebuchtür war bereits offen, was nicht hätte sein dürfen.

Und du hattest das Türproblem vorher gemeldet — wem?

An Diane Okafor in der Verwaltung, zweimal im März. Ich habe die E-Mails.

94% bei Feldaufnahmen im WAV-FormatDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Rev Transkription von Menschen

Echte Menschen tippen dein Interview. Am besten bei schlechtem Audio, aber es dauert und kostet.

BearbeitungszeitTypisch 12–24 Stunden

Genauigkeit bei sauberer Aufnahme99% (angegeben)

SprecherlabelsManuell, inbegriffen

SprachenEN von Menschen · 30+ KI

Kosten · pro Minute$1,50 von Menschen · $0,25 KI

DatenschutzAufnahme an Auftragnehmer übermittelt

Best forInterviews mit Gerichtsverwertung oder publikationskritische Interviews bei schlechtem Audio, wo du ein menschliches Ohr brauchst und einen Tag warten kannst.

Option 02

Transcription.Solutions

KI-Transkription, Sprechertrennung, fertig in Minuten. Same Engine für Telefon-Memo, Zoom oder Feldrecorder.

Bearbeitungszeit~3 Min. pro Stunde Audio

Genauigkeit bei sauberer Aufnahme94–96%

SprecherlabelsAutomatisch · im Editor umbenennen

Sprachen99, automatisch erkannt

Kosten · pro Minute$0,03

DatenschutzAufnahme nach 24h gelöscht · kein Training

Best forJournalisten, Forscherinnen und Produzenten, die mehrmals pro Woche Interviews führen und schnelle, zitierbare Texte ohne Upload an einen Auftragnehmer brauchen.

Option 03

Otter / Trint

KI-Transkription mit forschungsorientiertem Editor. Englisch-stark, an Monatspläne gebunden.

BearbeitungszeitEchtzeit bis ~5 Min.

Genauigkeit bei sauberer Aufnahme~90–93%

SprecherlabelsJa · für EN optimiert

SprachenOtter nur EN · Trint 30+

Kosten$17–80/Benutzer/Monat (Abo)

DatenschutzStandardmäßig im Konto gespeichert

Best forTeams, die eine gehostete Bibliothek jedes jemals aufgezeichneten Interviews haben wollen und sich nicht an eine monatliche Gebühr pro Benutzer stören.

Preise und Features aktuell für 2026. Bearbeitungszeit bei Rev variiert je nach Warteschlange und Audiodauer.

8 Fragen zu Interview-Transkription.

01Kann ich diese Transkripte in einem veröffentlichten Artikel verwenden, ohne die Aufnahme zu überprüfen?+

Für direkte Zitate — nein, überprüfe immer gegen die Aufnahme. KI-Transkripte mit 94% Genauigkeit lesen durchschnittlich noch ein Wort in 17 falsch, und das falsche Wort in einem Zitat ist eine Korrektur. Das Transkript ist zur Navigation und zum Entwurferstellen; die Aufnahme ist die Quelle der Wahrheit.

02Mein Rekorder hat eine Stereo-WAV mit einem Mikrofon pro Sprecher gespeichert. Was soll ich tun?+

Lade die Datei direkt hoch — konvertiere nicht zuerst zu Mono. Wir erkennen die zwei Kanäle und leiten jeden zu seinem eigenen Sprechertrennung-Track, was der höchste Genauigkeitspfad ist, den wir haben. Erwarte 96%+ in einem ruhigen Raum.

03Was ist mit Interviews, die über einen Telefonanruf aufgezeichnet wurden?+

Telefonaudio ist 8 kHz Schmalband, was die Genauigkeit auf etwa 88% begrenzt, auch bei einer sauberen Leitung. Wir teilen die beiden Parteien immer noch mit Kanaltrennung, wenn deine Recorder-App sie separat aufgezeichnet hat (die meisten tun es). VoIP-Anrufe über WhatsApp oder Signal klingen etwas besser als PSTN.

04Kann ich Off-the-Record-Abschnitte vor dem Teilen des Transkripts redigieren?+

Ja. Im Editor wählst du den Zeitstempelbereich aus und markierst ihn `[REDACTED]`. Der Export ersetzt den Text mit einem Redaktionsmarker, behält aber die Zeitstempel, damit das Dokument die Aufnahme immer noch verfolgt.

05Trainieren Sie Modelle mit meinen Interview-Aufnahmen?+

Nein. Die Quellenaufnahme wird innerhalb von 24 Stunden nach Abschluss aus unserer Infrastruktur gelöscht, und wir verwenden Kundenaufnahmen unter keinem Plan zum Modelltraining. Der Transkripttext bleibt in deinem Konto, bis du ihn löschst.

06Drei oder vier Personen in einem Panel-Interview — funktioniert die Sprechertrennung immer noch?+

Bis etwa sechs unterschiedliche Stimmen, ja, aber die Genauigkeit der Sprecherzuweisung fällt mit jeder hinzugefügten Person und wird schlechter, wenn zwei Sprecher ähnlich klingen. Plane einen 2–3-minütigen Umbenennungspass für die Speaker-Chips, nachdem das Transkript ankommt.

07Könnt ihr Interviews in anderen Sprachen als Englisch transkribieren?+

99 Sprachen, automatisch erkannt. Code-Wechsel (wenn die Quelle mitten im Satz die Sprache wechselt) wird in 12 Sprachenpaaren bearbeitet. Genauigkeit variiert je nach Sprache — europäische Sprachen entsprechen Englisch; Sprachen mit geringen Ressourcen in Afrika und Zentralasien sind 5–10 Punkte niedriger.

08Ich nehme bei Zoom auf — sollte ich stattdessen eure Zoom-Seite verwenden?+

Same Engine, gleiches Ergebnis. Die Zoom-Seite behandelt Cloud-Recording-Spezifiken (Audio pro Teilnehmer, Dial-In-Verschlechterung). Wenn du ein Interview auf einmal über Zoom führst, funktionieren beide Pfade — lade die MP4 hier hoch und die Sprecherlabels kommen gleich heraus.

Interview-Transkription.Unterschiedliche Aufnahme, gleiches Ergebnis.

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

Zwei Stimmen rein. Zwei Stimmen raus, gelabelt.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Rev von Menschen. Otter oder Trint. Oder wir.

Rev Transkription von Menschen

Transcription.Solutions

Otter / Trint

Drei Fallstricke bei generischen Transkriptions-Tools.

Was schiefgeht

Was du hier einstellen solltest

Empfohlene Job-Einstellungen für Interviews

96% bei guten Lavaliermikrofonen. Auch bei Café-Aufnahmen noch lesbar.

8 Fragen zu Interview-Transkription.

Lade deine Interview-Aufnahme hoch. Schau dir an, was rauskommt.