Transcrire des fichiers audio jusqu'à 10 heures — audio long en texte, pas de délai d'expiration

Transcrire les fichiers audio longs.Jusqu'à 10 heures. Pas de délai d'expiration.

Déposez un fichier audio long — jusqu'à 10 heures, 5 GB sur Business. Nous segmentons en parallèle, maintenons les ID de locuteur cohérents d'un bout à l'autre, et vous retournons une seule transcription au lieu d'un dossier numéroté.

Déposez votre audio ou vidéo

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Enregistrez directement depuis votre navigateur

L'inscription prend 30 secondes — l'enregistrement s'ouvre juste après, dans le tableau de bord.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFichiers supprimés automatiquement sous 24h

Des heures traitées. Un fichier unique et propre.

La plupart des outils expirent autour de 90 minutes ou divisent votre enregistrement long en éléments numérotés que vous devez assembler. Nous segmentons en fenêtres de 12 minutes chevauchantes, les traitons en parallèle, et les réassemblons avec une passe de locuteur global.

Réunion stratégique du conseil d'administrationREC 3 locuteurs · 5:14:22 · 3.1 GB

détecté automatiquement en-GBStéréo 44.1 kHz · 192 kbps

~90s

Transcription · fichier uniquePrécision 92 % · t=3:14:08

Nous en sommes à trois heures — revenons sur le point de la chaîne d'approvisionnement de la session du matin.

Exact, le pivot de fabrication au Vietnam. Je pense que nous avons sous-estimé le risque de délai de livraison.

Les délais de livraison sont passés de 14 à 31 jours après le changement tarifaire.

Et c'est avant de tenir compte de la congestion portuaire à Long Beach.

92 % sur le fichier complet de 5hDOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Résumé 5Transcription 1,420Intervenants 2Exportations

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Points clés

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Éléments d'action

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Otter Pro

Limite les fichiers longs à 4 heures par enregistrement. Les étiquettes de locuteur dérivent après 2 heures.

Longueur max des fichiers4 heures (Pro)

Taille max des fichiers~1,5 GB d'upload

ID de locuteur d'un bout à l'autreDérive après 2 heures

Sortie fichier longDocument unique, tronqué au seuil

Coût$16.99/utilisateur/mois

Téléchargement reprendreNon

Best forRéunions courtes de moins de 2 heures. Défaut sur les enregistrements de jour complet.

Option 02

Transcription.Solutions

10 heures par fichier. Segmentation parallèle, passe de locuteur global, un DOCX en sortie.

Longueur max des fichiers10 heures (Pro & Business)

Taille max des fichiers2 GB Pro · 5 GB Business

ID de locuteur d'un bout à l'autrePasse d'intégration global

Sortie fichier longFichier unique · DOCX/SRT/TXT

Coût · par minute$0.03 uniforme indépendamment de la longueur

Téléchargement reprendreMultipart, survit aux interruptions

Best forAteliers d'une journée, dépôts, réunions du conseil, histoires orales — tout ce qui dépasse la barrière de 90 minutes.

Option 03

Whisper API + DIY chunking

Le moins cher par minute. Vous construisez le segmenteur, l'assemblage des locuteurs et la logique de nouvelle tentative.

Longueur max des fichiers25 MB par requête (~25 min)

Taille max des fichiersLimite absolue de 25 MB

ID de locuteur d'un bout à l'autreAucun — pas de diarisation

Sortie fichier longPartiels numérotés, vous assemblez

Coût · par minute$0.006 (OpenAI Whisper)

Temps d'ingénierieDes heures à des jours par pipeline

Best forIngénieurs qui veulent du texte brut par segment et n'ont pas besoin de locuteurs, de résumés ou d'une sortie unique.

Tarification et limites exactes en mai 2026. Limite de longueur Otter Pro vérifiée en dernier sur leur page de tarification publique.

92 % se maintient sur un fichier de 5 heures. La qualité reste stable heure après heure.

La partie difficile avec l'audio long n'est pas le modèle — c'est de maintenir la précision stable de la minute 1 à la minute 600. La dérive du locuteur et les erreurs aux limites des segments sont ce qui tue la plupart des pipelines. Les chiffres ci-dessous sont mesurés sur des fichiers clients de longueur complète, pas sur les 10 premières minutes.

8 choses que les gens demandent sur la transcription audio long.

01Quelles sont les limites réelles de longueur et de taille des fichiers ?+

10 heures par fichier sur Pro et Business. Pro limite la taille du fichier à 2 GB, Business à 5 GB. Si vous avez quelque chose de plus long que 10 heures, divisez-le une fois à une pause naturelle — nous garderons les ID de locuteur cohérents si vous les téléchargez côte à côte sur le même projet.

02Je reçois une seule transcription ou un dossier de partiels numérotés ?+

Un fichier. Toujours. DOCX, SRT, TXT, ou JSON — votre choix. Les horodatages s'exécutent continuellement de 00:00:00 à la fin de l'enregistrement, pas de réinitialisation à chaque limite de segment.

03Combien de temps faut-il pour qu'un fichier de 6 heures revienne ?+

Environ 18-25 minutes sur la file Pro, 8-12 sur la priorité Business. Nous traitons les segments de 12 minutes en parallèle, donc le temps d'exécution s'échelonne de manière infra-linéaire avec la longueur du fichier, pas minute après minute.

04Les ID de locuteur restent-ils cohérents d'un bout à l'autre ?+

Oui. Après la diarisation par segment, une passe d'intégration global regroupe les voix sur l'ensemble du fichier. Le locuteur 3 à la minute 12 est le même locuteur 3 à la minute 487. C'est la principale chose que les pipelines Whisper DIY font mal.

05Que se passe-t-il si mon téléchargement s'interrompt à l'heure 3 d'un fichier de 4 GB ?+

Le téléchargement multipart reprendre reprend à partir de la dernière partie terminée. Vous ne re-téléchargez pas les premiers 3 GB. Fonctionne sur le Wi-Fi d'hôtel peu fiable et le partage de connexion cellulaire — nous avons testé les deux.

06Pourquoi l'API Whisper a-t-elle des difficultés avec les fichiers longs ?+

Le point de terminaison Whisper d'OpenAI a une limite absolue de 25 MB par requête — environ 25 minutes d'audio compressé. Tout ce qui est plus long nécessite de segmenter, de transcrire en parallèle, puis d'assembler les transcriptions et d'aligner les locuteurs vous-même. Nous faisons tout cela côté serveur.

07Le prix par minute est-il le même sur un fichier de 10 heures que sur un fichier de 10 minutes ?+

Oui. $0.03 par minute uniforme, indépendamment de la longueur. Un fichier de 10 heures coûte $18. Nous ne surtaxons pas les fichiers longs comme le fait Rev ($1.50/min humain × 10 heures = $900).

08Puis-je obtenir des marqueurs de chapitre ou des horodatages toutes les heures ?+

Basculez « Marqueurs horaires » sur le formulaire de travail et le DOCX exporte avec un saut de titre tous les 60 minutes. SRT garde un timecode continu. JSON a les deux — tableau de chapitre plus horodatages au niveau des mots.

Transcrire les fichiers audio longs.Jusqu'à 10 heures. Pas de délai d'expiration.

Déposez votre audio ou vidéo

Paste a link, we’ll fetch the audio

Enregistrez directement depuis votre navigateur

Des heures traitées. Un fichier unique et propre.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Otter Pro. Segmentation Whisper DIY. Ou nous.

Otter Pro

Transcription.Solutions

Whisper API + DIY chunking

Trois façons dont les outils génériques meurent après la marque de 90 minutes.

Ce qui ne fonctionne pas

Ce qu'il faut changer ici

Paramètres de travail recommandés pour les fichiers longs

92 % se maintient sur un fichier de 5 heures. La qualité reste stable heure après heure.

8 choses que les gens demandent sur la transcription audio long.

Déposez votre fichier long. Obtenez une transcription en retour.