Transcripció per a podcasters.Notes de programa i SRT en una sola passada.

Deixa el master de l'episodi de podcast — MP3, WAV, o un enllaç de YouTube. Obtén un transcript amb etiquetes de parlant, notes de programa generades per IA amb punts clau i etiquetes, més un SRT per al tall de vídeo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Un fitxer dins, quatre artefactes fora

Master de l'episodi dins. Transcript, notes de programa, SRT, etiquetes fora.

La majoria de podcasts arriben en forma d'MP3 estèreo post-producció amb el host i el convidant ja barrejats. Els separem acústicament, detectem la intro musical, i comencem el transcript a la primera paraula parlada.

Master episodi 142REC 2 parlants · 48:21 · MP3 192 kbps
en-US detectat automàticament44.1 kHz estèreo · post-mix
~90s
Transcript · streaming95% precisió
S1

Bienvingut de nou al programa. Avui parlo amb Priya Anand sobre el seu nou llibre sobre cadenes de subministrament.

S2

Gràcies per tenir-me, Jordan. Ha estat una bogeria els últims tres anys des que l'última vegada que vam parlar.

S1

Així que el llibre comença amb el bloqueig de Suez — per què començar allà?

S2

Perquè va ser el moment en què tothom que no era de logística de sobte es va preocupar pels contenidors.

95% en estèreo post-mixSRT · DOCX · TXT · Show notes MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcions reals · comparació honest

Descript. Castmagic. O nosaltres.

Descript és un editor primer, transcripció segon. Castmagic és notes de programa primer, transcript segon. Ens concentrem en la canonada fitxer → transcript → notes de programa i ens mantenim fora del vostre editor.

Option 01

Descript

Editor d'àudio amb transcripció integrada. Genial per a fluxos de treball d'edició per text, més pesant que el que necessiteu si només voleu un transcript.

Ús principalDAW + word-edit
Diarització de parlantsAcústica, EN-potent
Notes de programaComplement AI Underlord
ExportacióSRT · TXT · project file
Nivell gratuït1 hr/mes transcripció
Cost$24/user/mo (Creator)
Best forPodcasters individuals que editen els episodis suprimint paraules d'un transcript i volen una aplicació per a tot.
Option 02

Transcription.Solutions

Deixa el master de l'episodi. Transcript, notes de programa, etiquetes, SRT — els quatre en una sola passada. Cap editor, cap dependència.

Ús principalTranscript + notes de programa
Diarització de parlantsAcústica + pujada per pista
Notes de programaGratuït en tots els plans
ExportacióSRT · VTT · DOCX · MD · JSON
Nivell gratuït30 min/mes, sense targeta
Cost · per min$0.03
Best forProgrames que ja tenen un editor (Logic, Hindenburg, Reaper) i només volen text net + notes després que l'episodi estigui barrejat.
Option 03

Castmagic

Servei de notes de programa. Arrossega el fitxer dins, obtén un paquet de contingut elegant. El transcript és més aviat un producte secundari.

Ús principalReutilització de contingut
Diarització de parlantsSí, ajustat per EN
Notes de programaMoltes plantilles, només de pagament
ExportacióSRT · TXT · template MD
Nivell gratuïtNomés prova
Cost~$23+/mo (Starter)
Best forProgrames orientats al màrqueting que necessiten 12 publicacions socials, 4 esborranys de butlletí i un carrusel de LinkedIn per episodi.

Preus aproximats a 2026 i canvien segons el venedor. Els tiers gratuïts i les funcions IA de complement roten freqüentment.

Específic del podcasting

Tres coses que afecten els podcasters en les eines de transcripció genèriques.

Digueu-nos alguns detalls sobre l'episodi en pujar-lo i la sortida deixa de necessitar una passada de neteja.

Què va malament

  1. 1Intro musical transcrita com a gibberish. El reconeixedor intenta llegir lletres o patrons de tarareig i insereix absurds com 'la la na' al llarg dels primers 30 segons.
  2. 2Nom de convidat escrit fonèticament. 'Priya Anand' surt 'Pria Anan' o 'Prea Ahnand' — i és incorrecte cada vegada que apareix.
  3. 3Risa i solapament de veus es representen com a paraules d'emplenament o s'atribueixen al parlant equivocat, especialment durant els intercanvis enèrgics.

Què canviar aquí

  1. 1Activeu Saltar intro/outro musical al formulari de tasca. Detectem segments no parlat i comencem el transcript a la primera paraula parlada — els desplaçaments de marca de temps s'ajusten automàticament.
  2. 2Enganxeu el nom del convidat i les mencions de marca a Vocabulari personalitzat. L'hi passem com a suggeriment de reconeixedor, així que l'ortografia es manté coherent al llarg de tot l'episodi.
  3. 3Activeu Notes de programa per obtenir un resum de 2-4 oracions, 3-7 punts clau, elements d'acció i 3-8 etiquetes de tema representades en markdown — enganxeu directament al vostre CMS.

Configuració de tasca recomanada per a podcasts

Deixa un episodi i aquests defaults s'activen. Substitueix per tasca del formulari.

Diarització
Tall estèreo si 2 parlants
Detecció musical
Saltar segments intro/outro
Paraules d'emplenament
Eliminades per defecte
Notes de programa
Resum + punts clau + etiquetes
Capítols
Generats a partir de punts clau
Exportació
SRT · DOCX · show notes MD

Accuracy · real-world numbers

97% en episodis de micròfon d'estudi. Es manté en trucades de convidats remots també.

La precisió del podcast depèn principalment de com va ser enregistrat el convidat, no de l'amfitrió. Un amfitrió d'estudi aparellat amb un convidat només de Zoom es comporta com la pitjor cama. Els números de sota provenen de verdaders episodis de clients, no d'àudio de laboratori.

97%
Pujada per pista (Riverside / SquadCast)

Cada parlant en un WAV separat. Transcrivim cada pista independentment i omitem la diarització. El cas més net possible.

95%
Post-mix estèreo, 2 parlants

Amfitrió esquerre, convidant dret, després de masterització. La forma de podcast més comuna. La diarització és essencialment gratuïta del tall estèreo.

91%
Mescla mono, 3-4 parlants

Programes de taula rodona o format de panell barrejats a mono. Les veus similars poden fusionar-se una o dues vegades per hora — una passada de neteja de 2 min la soluciona.

86%
Convidant remot per telèfon / micròfon deficient

Convidant en AirPods a través d'una trucada WiFi d'hotel. Els números i els noms propis pateixen més. El vocabulari personalitzat recupera la majoria.

Preguntes comunes

8 coses que la gent pregunta sobre la transcripció de podcasts.

01Puc enganxar simplement el meu enllaç de YouTube o SoundCloud?+
Sí. Enganxa una URL pública de YouTube o un enllaç d'episodi allotjat (SoundCloud, Buzzsprout, Transistor, Libsyn MP3 directe) i nosaltres extraiem l'àudio del nostre costat. Per als feeds privats, descarregui el fitxer i pugeu-lo.
02Serà l'intro musical transcrita com 'la la la' absurd?+
No si Saltar intro/outro musical està activat (ho està per defecte). Detectem àudio no parlat i comencem el transcript a la primera paraula parlada. Els timestamps a l'SRT es desplaçen per coincidir perquè els subtítols de YouTube segueixen sincronitzant-se.
03Què és exactament al fitxer de notes de programa?+
Un resum de l'episodi de 2-4 oracions, 3-7 punts clau com a llista de punts, elements d'acció si es van mencionar, i 3-8 etiquetes de tema. Representat com a markdown perquè pugueu enganxar directament a WordPress, Ghost, Substack, o la pàgina d'episodis del vostre allotjador de podcast.
04Ho podeu generar marcadors de capítol per a Apple Podcasts i Spotify?+
Sí — els capítols es generen a partir dels punts clau amb timestamps. Exporteu com a chapters.txt separat o integreu al WAV/M4A. Tingueu en compte que Spotify només honra capítols en programes allotjats a Anchor, així que el fitxer txt és la vostra alternativa.
05Tinc fitxers per pista de Riverside / SquadCast — hauria de pujar-los?+
Sí, sisplau. Pugeu cada WAV del parlant per separat i etiqueteu-los amb noms. Transcrivim cada pista independentment i fusionem per timestamp. La precisió es situa al voltant del 97% en aquesta configuració — el cas més net que veiem.
06Ho pot marcar lectura d'esponsor o salts publicitaris?+
No encara — això és al pla de desenvolupament. Per ara, deixeu una marca a la vostra edició (un breu silenci o to) i la superficialitzarem com a timestamp en el transcript. También ho podeu etiquetar els segments d'anunci cercant i passant el nom de marca de l'esponsor posteriorment.
07Quant de temps pot durar l'episodi?+
Fins a 6 hores per fitxer en una pujada. La majoria de programes duren 30-90 minuts, que acaben en 4-8 minuts de rellotge de paret. Per a un episodi d'entrevista de 3 hores, espereu més o menys 12-15 minuts de la pujada fins que els quatre artefactes estiguin llestos.
08Ho reemplaçarà l'SRT els subtítols automàtics de YouTube clarament?+
Sí. L'SRT es trenca en línies ~42 caràcters amb puntuació adequada i prefixos de parlant opcionals. Pugeu-lo a YouTube Studio → Subtítols → Afegir idioma → SRT. Substitueix completament la pista de subtítol generada automàticament.

Deixa el teu episodi. Obtén el transcript, notes, i SRT.

30 minuts gratuïts cada mes. Sense targeta. Etiquetes de parlant, notes de programa, capítols, i tota l'exportació inclosa.

Comença de gratis