Längere Audiodateien bis zu 10 Stunden transkribieren — lange Audio zu Text, ohne Timeout

Lange Audiodateien transkribieren.Bis zu 10 Stunden. Ohne Timeout.

Laden Sie eine lange Audiodatei hoch — bis zu 10 Stunden, 5 GB auf Business. Wir chunken parallel, halten Sprecher-IDs durchgehend konsistent und geben Ihnen ein Transkript statt eines nummerieren Ordners.

Audio oder Video ablegen

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Direkt aus Ihrem Browser aufnehmen

Die Registrierung dauert 30 Sekunden – die Aufnahme öffnet sich danach direkt im Dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTDateien werden automatisch nach 24h gelöscht

Stunden rein. Eine saubere Datei raus.

Die meisten Tools zeitlimitieren um die 90-Minuten-Marke oder teilen Ihre lange Aufnahme in nummerierte Teile auf, die Sie selbst zusammenfügen müssen. Wir verwenden 12-Minuten-Fenster mit Überlappung, verarbeiten parallel und fügen mit einem globalen Sprecherdurchlauf wieder zusammen.

Strategiesitzung des VorstandsREC 3 Sprecher · 5:14:22 · 3,1 GB

automatisch erkannt: en-GB44,1 kHz Stereo · 192 kbps

~90s

Transkript · einzelne Datei92% Genauigkeit · t=3:14:08

Wir sind drei Stunden drin — lassen Sie uns zum Lieferkettenthema aus der Morgensitzung zurückkehren.

Richtig, der Umschwung der Fertigung in Vietnam. Ich denke, wir haben das Vorlaufzeit-Risiko übersehen.

Die Vorlaufzeiten sind nach der Zolländerung von 14 auf 31 Tage angewachsen.

Und das ist, bevor wir die Staukrise in Long Beach einrechnen.

92% über die gesamte 5-Stunden-DateiDOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Zusammenfassung 5Transkript 1,420Sprecher 2Exporte

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Wichtige Punkte

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Aufgaben

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

Begrenzt lange Dateien auf 4 Stunden pro Aufnahme. Sprecherlabels driften nach der 2-Stunden-Marke ab.

Max. Dateilänge4 Stunden (Pro-Plan)

Max. Dateigröße~1,5 GB Upload

Sprecher-IDs durchgehendDriften nach 2 Stunden ab

Long-File-OutputEinzelnes Dokument, bei Limit gekürzt

Kosten$16,99/Benutzer/Monat

Wiederaufnahme-UploadNein

Best forKurze Meetings unter 2 Stunden. Scheitert bei ganztägigen Aufnahmen.

Option 02

Transcription.Solutions

10 Stunden pro Datei. Paralleles Chunking, globaler Sprecherdurchlauf, ein DOCX raus.

Max. Dateilänge10 Stunden (Pro & Business)

Max. Dateigröße2 GB Pro · 5 GB Business

Sprecher-IDs durchgehendGlobaler Embedding-Durchlauf

Long-File-OutputEinzelne Datei · DOCX/SRT/TXT

Kosten · pro Min.$0,03 pauschal, egal wie lang

Wiederaufnahme-UploadMultipart, übersteht Verbindungsabbrüche

Best forGanztägige Workshops, Zeugenaussagen, Vorstandssitzungen, Oral Histories — alles über der 90-Minuten-Grenze.

Option 03

Whisper API + DIY Chunking

Günstigster Preis pro Minute. Sie bauen den Chunker, die Sprecher-Zusammenfügung und die Retry-Logik.

Max. Dateilänge25 MB pro Request (~25 Min.)

Max. Dateigröße25 MB Obergrenze

Sprecher-IDs durchgehendKeine — kein Diarisierung

Long-File-OutputNummerierte Teile, Sie fügen zusammen

Kosten · pro Min.$0,006 (OpenAI Whisper)

Engineering-ZeitStunden bis Tage pro Pipeline

Best forIngenieure, die Rohtexte pro Chunk wollen und keine Sprecher, Zusammenfassungen oder Single-Output benötigen.

Preise und Limits korrekt ab Mai 2026. Otter Pro Längenbegrenzung zuletzt überprüft auf ihrer öffentlichen Preisseite.

92% bleibt über eine 5-Stunden-Datei konstant. Qualität bleibt Stunde für Stunde stabil.

Das Schwierige bei langen Audiodateien ist nicht das Modell — es ist, die Genauigkeit von Minute 1 bis Minute 600 stabil zu halten. Sprecherdrift und Chunk-Grenzfehler sind das, was die meisten Pipelines zerstört. Die untenstehenden Zahlen werden über vollständige Kundendateien gemessen, nicht über die ersten 10 Minuten.

8 Dinge, die Menschen über lange Audio-Transkription fragen.

01Wie lang und groß können die Dateien wirklich sein?+

10 Stunden pro Datei auf Pro und Business. Pro begrenzt die Dateigröße auf 2 GB, Business auf 5 GB. Wenn Sie etwas länger als 10 Stunden haben, teilen Sie es einmal bei einer natürlichen Pause — wir halten die Sprecher-IDs konsistent, wenn Sie sie nacheinander in dasselbe Projekt hochladen.

02Bekomme ich ein Transkript oder einen Ordner mit nummerierten Teilen?+

Eine Datei. Immer. DOCX, SRT, TXT oder JSON — Ihre Wahl. Zeitstempel laufen kontinuierlich von 00:00:00 bis zum Ende der Aufnahme, nicht zurückgesetzt bei jeder Block-Grenze.

03Wie lange dauert eine 6-Stunden-Datei?+

Etwa 18–25 Minuten in der Pro-Warteschlange, 8–12 auf Business-Priorität. Wir verarbeiten die 12-Minuten-Blöcke parallel, daher skaliert die Verarbeitungszeit sublinear mit der Dateilänge, nicht Minute für Minute.

04Bleiben die Sprecher-IDs durchgehend konsistent?+

Ja. Nach per-Block-Diarisierung clustert ein globaler Embedding-Durchlauf Stimmen über die ganze Datei. Sprecher 3 bei Minute 12 ist derselbe Sprecher 3 bei Minute 487. Das ist das Hauptproblem, das DIY-Whisper-Pipelines falsch machen.

05What happens wenn mein Upload in Stunde 3 einer 4 GB-Datei abbricht?+

Wiederaufnahme-Multipart-Upload setzt vom letzten abgeschlossenen Teil fort. Sie laden die ersten 3 GB nicht erneut hoch. Funktioniert auf flächigem Hotel-Wi-Fi und Mobilfunk-Tethering — wir haben beide getestet.

06Warum scheitert die Whisper API bei langen Dateien?+

Der Whisper-Endpoint von OpenAI hat ein 25 MB pro Request Limit — etwa 25 Minuten komprimiertes Audio. Alles längere braucht Sie zum Chunken, parallel zu transkribieren und dann Transkripte zusammenzufügen und Sprecher selbst abzugleichen. Das machen wir server-seitig.

07Ist der Minutenpreis gleich bei einer 10-Stunden- wie bei einer 10-Minuten-Datei?+

Ja. $0,03 pro Minute pauschal, egal wie lang. Eine 10-Stunden-Datei kostet $18. Wir berechnen keine Zusatzgebühr für lange Dateien wie Rev ($1,50/min menschlich × 10 Stunden = $900).

08Kann ich Kapitelmarken oder Zeitstempel jede Stunde bekommen?+

Aktivieren Sie 'Stundenmarken' im Job-Formular und das DOCX exportiert mit Überschriftumbruch alle 60 Minuten. SRT behält kontinuierliche Zeitcodes. JSON hat beides — Kapitel-Array plus wortebenenweise Zeitstempel.

Lange Audiodateien transkribieren.Bis zu 10 Stunden. Ohne Timeout.

Audio oder Video ablegen

Paste a link, we’ll fetch the audio

Direkt aus Ihrem Browser aufnehmen

Stunden rein. Eine saubere Datei raus.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro. DIY Whisper Chunking. Oder uns.

Otter Pro

Transcription.Solutions

Whisper API + DIY Chunking

Drei Wege, wie generische Tools nach der 90-Minuten-Marke scheitern.

Was schiefgeht

Was hier umkehren

Empfohlene Job-Einstellungen für lange Dateien

92% bleibt über eine 5-Stunden-Datei konstant. Qualität bleibt Stunde für Stunde stabil.

8 Dinge, die Menschen über lange Audio-Transkription fragen.

Laden Sie Ihre lange Datei hoch. Erhalten Sie ein Transkript zurück.