Transkription för podcasters.Shownotes och SRT en gång.

Släpp din podcast-episod master — MP3, WAV eller en YouTube-länk. Få en transkription med talaretikett, AI-genererade shownotes med viktiga moment och taggar, plus en SRT för videovarianten.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ En fil in, fyra artefakter ut

Episodmaster in. Transkription, shownotes, SRT, taggar ut.

De flesta podcasts kommer in som en efterproducerad stereo-MP3 med värd och gäst redan blandade tillsammans. Vi delar upp dem akustiskt, detekterar musikintrot och börjar transkriptionen vid det första talade ordet.

Episod 142 masterREC 2 talare · 48:21 · MP3 192 kbps
auto-detekterad en-US44.1 kHz stereo · post-mix
~90s
Transkription · streaming95 % noggrannhet
S1

Välkommen tillbaka till showen. Idag pratar jag med Priya Anand om hennes nya bok om försörjningskedjor.

S2

Tack för att du tar med mig, Jordan. Det har varit tre vilda år sedan vi senast pratade.

S1

Så boken börjar med Suez-blockeringen — varför börja där?

S2

För det var ögonblicket då alla som inte jobbar med logistik plötsligt brydde sig om containrar.

95 % på stereo post-mixSRT · DOCX · TXT · Shownotes MD

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre riktiga alternativ · ärlig jämförelse

Descript. Castmagic. Eller oss.

Descript är en editor först, transkription andra. Castmagic är shownotes först, transkription andra. Vi fokuserar på file → transkription → shownotes pipeline och håller oss borta från din editor.

Option 01

Descript

Ljudeditor med inbyggd transkription. Bra för redigering-med-text-arbetsflöden, tyngre än du behöver om du bara vill ha en transkription.

Primär användningDAW + ordbearbetning
TalardiarisereringAkustisk, EN-stark
ShownotesUnderlord AI add-on
ExportSRT · TXT · projektfil
Gratis nivå1 tim/mån transkription
Kostnad$24/användare/mån (Creator)
Best forSolo podcasters som redigerar episoder genom att ta bort ord från en transkription och vill ha en app för allt.
Option 02

Transcription.Solutions

Släpp episodmastern. Transkription, shownotes, taggar, SRT — alla fyra på en gång. Ingen editor, ingen bindning.

Primär användningTranskription + shownotes
TalardiarisereringAkustisk + per-spår-uppladdning
ShownotesGratis på varje plan
ExportSRT · VTT · DOCX · MD · JSON
Gratis nivå30 min/mån, inget kort
Kostnad · per minut$0.03
Best forShows som redan har en editor (Logic, Hindenburg, Reaper) och bara vill ha ren text + anteckningar efter att episoden är mixad.
Option 03

Castmagic

Shownotes-som-en-tjänst. Dra in filen, få ett snyggt innehållspaket. Transkription är mer en biprodukt.

Primär användningInnehållsåteranvändning
TalardiarisereringJa, EN-inställd
ShownotesMånga mallar, endast betalt
ExportSRT · TXT · mall MD
Gratis nivåEndast testversion
Kostnad~$23+/mån (Starter)
Best forMarknadsföring-tunga shows som behöver 12 inlägg i sociala medier, 4 nyhetsbrevsförslag och en LinkedIn-carousel per episod.

Priser ungefärliga från 2026 och ändras per leverantör. Gratis nivåer och add-on AI-funktioner roteras ofta.

Specifikt för podcastning

Tre saker som plågar podcasters på generiska transkriptionsverktyg.

Berätta några saker om episoden vid uppladdning och utdatan behöver inte en rensningspass längre.

Vad som går fel

  1. 1Musikintro transkriberat som skräpspråk. Igenkänna försöker läsa sångtexter eller humm-mönster och infogar nonsens som 'la la na' under de första 30 sekunderna.
  2. 2Gästens namn stavat fonetiskt. 'Priya Anand' kommer ut som 'Pria Anan' eller 'Prea Ahnand' — och det är fel varje gång det visas.
  3. 3Skratt och samtal återges som fyllerord eller tillskrivs fel talare, särskilt under energiska utbyten.

Vad du ska vrida här

  1. 1Slå på Hoppa över musikintro/outro på jobbformuläret. Vi detekterar icke-tal-segment och börjar transkriptionen vid det första talade ordet — tidsmarkörer justeras automatiskt.
  2. 2Klistra in gästens namn och märkesomtag i Anpassad ordbok. Vi passerar det som ett igenkänningsvisning, så stavningen förblir konsekvent under hela episoden.
  3. 3Slå på Shownotes för att få en 2–4 menings-sammanfattning, 3–7 viktiga moment, åtgärdsobjekt och 3–8 ämnestaggar renderade i markdown — klistra direkt i din CMS.

Rekommenderade jobbinställningar för podcasts

Släpp en episod och dessa standarder slår på. Åsidosätt per-jobb från formuläret.

Talardiariserering
Stereo-uppdelning om 2 talare
Musikdetektering
Hoppa över intro/outro-segment
Fyllerord
Borttagna som standard
Shownotes
Sammanfattning + viktiga moment + taggar
Kapitel
Genererade från viktiga moment
Export
SRT · DOCX · shownotes MD

Accuracy · real-world numbers

97 % på studio-mic-episoder. Håller upp på fjärrsamtal med gäster också.

Podcast-noggrannhet beror främst på hur gästen spelades in, inte värden. En studiomikrafon värd kopplad till en endast-Zoom-gäst beter sig som det värsta benet. Siffror nedan kommer från riktiga kundepisoder, inte labbljud.

97%
Per-spår-uppladdning (Riverside / SquadCast)

Varje talare på en separat WAV. Vi behandlar varje spår oberoende och hoppar över talardiariserering. Renaste möjliga fall.

95%
Stereo post-mix, 2 talare

Värd vänster, gäst höger, efter mastering. Den vanligaste podcast-formen. Talardiariserering är i huvudsak gratis från stereo-uppdelningen.

91%
Mono mix, 3-4 talare

Roundtable-showen eller panelformat mixat till mono. Liknande röster kan smälta samman en eller två gånger per timme — en 2-min rensningspass fixar det.

86%
Fjärrgäst på telefon / dålig mikrofon

Gäst på AirPods genom ett hotell-wifi-samtal. Siffror och egennamn lider mest. Anpassad ordbok återhämtar det mesta.

Vanliga frågor

8 saker som människor frågar om podcast-transkription.

01Kan jag bara klistra in min YouTube- eller SoundCloud-länk?+
Ja. Klistra in en offentlig YouTube-URL eller en värdad episodlänk (SoundCloud, Buzzsprout, Transistor, Libsyn direkt MP3) och vi hämtar ljudet från vår sida. För privata flöden, ladda ner filen och ladda upp den.
02Kommer musikintrot att transkriberas som 'la la la' nonsens?+
Inte om Hoppa över musikintro/outro är på (det är som standard). Vi detekterar icke-tal-ljud och börjar transkriptionen vid det första talade ordet. Tidsmarkörer i SRT:en förskjuts för att matcha så YouTube-undertexter fortfarande synkroniseras.
03Vad finns i shownotes-filen exakt?+
En 2–4 menings episodsammanfattning, 3–7 viktiga moment som en punktlista, åtgärdsobjekt om några nämndes, och 3–8 ämnestaggar. Renderad som markdown så du kan klistra direkt i WordPress, Ghost, Substack eller din podcast-värd episodsida.
04Kan du generera kapitelmarkörer för Apple Podcasts och Spotify?+
Ja — kapitel genereras från de viktiga momenten med tidsmarkörer. Exportera som en separat chapters.txt eller bädda in i WAV/M4A. Observera att Spotify bara respekterar kapitel på Anchor-värdade showen, så txt-filen är din fallback.
05Jag har per-spår-filer från Riverside / SquadCast — bör jag ladda upp dem?+
Ja, vänligen gör det. Ladda upp varje talares WAV separat och tagga dem med namn. Vi transkriberar varje spår oberoende och slår samman efter tidsmarkör. Noggrannheten landar omkring 97 % på denna inställning — det renaste fallet vi ser.
06Kan den flagga sponsorläsningar eller annonspauser?+
Inte automatiskt än — det ligger på vägkartan. För nu, släpp en markör i din redigering (en kort tystnad eller ljud) och vi kommer att presentera det som en tidsmarkör i transkriptionen. Du kan också tagga annonsegment genom att søka efter sponsormärkets namn efteråt.
07Hur lång kan episoden vara?+
Upp till 6 timmar per fil i en uppladdning. De flesta showen är 30–90 minuter, vilket slutförs på 4–8 minuter väggklocka. För en 3-timmar intervjupisod, förvänta dig ungefär 12–15 minuter från uppladdning till alla fyra artefakter klara.
08Kommer SRT:en att ersätta YouTubes autoundertexter helt?+
Ja. SRT:en är radbruten på ~42 tecken med korrekt interpunktion och valfria talarprefix. Ladda upp den i YouTube Studio → Undertexter → Lägg till språk → SRT. Den åsidosätter det autogenererade undertexttecknet helt.

Släpp din episod. Få transkriptionen, anteckningarna och SRT:en.

30 fria minuter varje månad. Inget kort. Talaretikett, shownotes, kapitel och alla exporteringar ingår.

Börja gratis