Transcripció de YouTube — millor que les llegendes automàtiques, més barata que la transcripció humana

Transcripció de YouTube. Millor que les llegendes automàtiques.Més barat que els humans.

Enganxa una URL de vídeo de YouTube. Obtén un transcript de 95%+ exactitud amb etiquetes de parlant, marca de temps de capítol, i SRT/VTT que pots re-pujar — sense Premium, sense extensió de Chrome.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

URL dins. Subtítols i transcript net surt.

Enganxa un enllaç de youtu.be o youtube.com. Ho resolem, extraiem la pista d'àudio de major bitrate del servidor, executem la diarització, i retornem un transcript amb marca de temps més SRT/VTT llest per pujar com a captions de comunitat.

youtu.be/dQw4w9WgXcQREC Entrevista · 2 parlants · 28:14

detectat automàticament en-USopus 160 kbps · 48 kHz

~90s

Transcript · streaming96% exactitud

Així que el canal va arribar a 100k subscriptors en vuit mesos — què va moure l'agulla?

Honestament, publicar Shorts diàriament durant sis setmanes. El temps de reproducció de format llarg va venir després.

I el redisseny de la miniatura — va ser prova A/B a YouTube Studio?

Sí, l'eina nova Test & Compare. Dos de tres guanyadors no tenien cara.

96% en àudio de talking-headSRT · VTT · DOCX · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Llegendes automàtiques de YouTube

Gratuït, integrat en cada vídeo públic. Sense puntuació completa, sense etiquetes de parlant.

CostGratuït

Exactitud~80% en parla neta

Etiquetes de parlantCap

PuntuacióEscassa, sense paràgrafs

ExportacióCopia-enganxa des del panell de transcript

Funciona enNomés vídeos públics

Best forEscannejar ràpidament vídeos que no posseixes quan la precisió no importa.

Option 02

Transcription.Solutions

Enganxa l'URL. Tres minuts més tard: transcript net, SRT/VTT, resum d'IA amb enllaços de capítol.

Cost · per min$0.03 en Pro

Exactitud95%+ en talking-head

Etiquetes de parlantSí (Pro i Business)

PuntuacióCompleta, amb paràgrafs

ExportacióSRT · VTT · DOCX · TXT · JSON

Funciona enURLs públiques + no listades

Best forCreadors re-pujant captions, podcasters reutilitzant vídeo en blog, investigadors traient cites d'entrevistes.

Option 03

Transcripció humana Rev

Un humà ho escriu. Màxima exactitud, turnaround més lent, preu per minut.

Cost · per min$1.50

Exactitud99%+ garantit

Etiquetes de parlantSí

PuntuacióCompleta, nivell editorial

Turnaround12-24 hores típic

Funciona enQualsevol fitxer pujat

Best forContingut admissible en judici, subtítols broadcast, o entrevistes on una paraula perduda mata la cita.

Preus exactes a partir de 2026. Les tarifes de Rev reflecteixen el seu nivell de servei estàndard; les tarifes només d'IA de competitors no es comparen aquí.

95%+ en vídeos de talking-head. La música i l'àudio del joc són més baixos.

El contingut de YouTube varia molt — un podcast d'estudi i una transmissió Fortnite no són el mateix problema. Talking-head amb micròfon de solap és el millor cas; la música de fons i l'àudio de joc superposat arrosseguen l'exactitud més ràpid. Els números de sota provenen d'URLs reals de YouTube de clients en producció.

8 coses que la gent pregunta sobre la transcripció de YouTube.

01Simplement enganxo l'URL, o he de descarregar el vídeo primer?+

Només enganxa l'URL. Acceptem youtube.com/watch, enllaços curts youtu.be, i URLs de vídeo no listats. Ho resolem del servidor, extraiem només la pista d'àudio (no el vídeo), i comencem a transcriure — normalment dins de 10 segons de l'enganxament.

02Funciona en vídeos privats o no listats?+

No listats sí, privats no. Els URLs no listats són resolts públicament si tens l'enllaç, així que els podem recuperar. Els vídeos privats requereixen estar connectat a la teva compte de Google — no podem suplantarte. Descarrega primer l'MP4 des de YouTube Studio, després puja el fitxer.

03Per què el vostre transcript és molt millor que les llegendes automàtiques de YouTube?+

Les llegendes automàtiques de YouTube executem un model de streaming ajustat pel cost a escala en miliards de vídeos. Executem un model més gran amb decodificació de context complet, vocabulari personalitzat, i una passa de diarització separada. Resultat: ~95% vs ~80%, més etiquetes de parlant i puntuació correcta.

04Puc pujar l'SRT a YouTube com captions de comunitat?+

Sí. Exporta com a SRT segur per a YouTube, obri YouTube Studio → Subtítols → Afegir → Pujar fitxer. Les nostres longituds de línia i marques de temps coincideixen amb les regles de visualització de YouTube, així que les cues no desbordarán en mòbil ni es trencaran a la meitat de la paraula.

05Què sobre drets d'autor — és legal transcriure vídeos d'altres?+

La transcripció per a ús personal, recerca, periodisme, o comentari és generalment fair use als EUA. Re-publicar el transcript complet comercialment és més incert. No allotgem l'àudio o vídeo, et passem el text — el que en fas és teu. No és consell legal.

06Pots manejar vídeos llargs com episodis de podcast de 4 hores?+

Sí. El nostre límit dur és 8 hores per fitxer. Un episodi de 4 hores estil Lex Fridman es transcriu en uns 8-12 minuts wall-clock i costa al voltant de $7.20 en preus Pro. La diarització acústica es manté la longitud completa.

07Manegeu vídeos de YouTube en idiomes que no són l'anglès?+

Sí — 99 idiomes auto-detectats. Espanyol, hindi, portuguès i japonès aterren tots dins de 2-3 punts de la precisió de l'anglès en àudio net. El code-switching (anglès + espanyol a la mateixa frase) funciona però es degrada en ~5 punts.

08Puc obtenir marques de temps de capítol com els auto-capítols de YouTube?+

Sí. El resum d'IA inclou marques de temps estil capítol als canvis de tema més enllaços de moment clau. Enganxa'ls a la teva descripció de vídeo com `00:00 Intro / 03:42 Setup / …` — YouTube les mostra com a capítols clicables automàticament.

Transcripció de YouTube. Millor que les llegendes automàtiques.Més barat que els humans.

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

URL dins. Subtítols i transcript net surt.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Llegendes automàtiques de YouTube. Rev humà. O nosaltres.

Llegendes automàtiques de YouTube

Transcription.Solutions

Transcripció humana Rev

Tres coses que fan problema amb les eines de transcripció genèrica.

Què va malament

Què activa aquí

Configuració de tasca recomanada per a YouTube

95%+ en vídeos de talking-head. La música i l'àudio del joc són més baixos.

8 coses que la gent pregunta sobre la transcripció de YouTube.

Enganxa una URL de YouTube. Mira què surt.