Transcripción de YouTube. Mellor que os subtítulos automáticos.Máis económico que humano.

Pega un URL de vídeo de YouTube. Obtén unha transcripción con 95%+ de precisión con etiquetas de altofalante, marcas de tempo de capítulos, e subtítulos SRT/VTT que podes re-subir — sen Premium, sen extensión de Chrome.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira o que sae

URL dentro. Subtítulos e transcripción limpa fora.

Pega un enlace de youtu.be ou youtube.com. Resolvémolo, extraemos a pista de audio de maior taxa de bits do lado do servidor, executamos diarización, e devolvemos unha transcripción con marcas de tempo máis SRT/VTT listo para subir coma subtítulos da comunidade.

youtu.be/dQw4w9WgXcQREC Entrevista · 2 altofalantes · 28:14
auto-detectado en-USopus 160 kbps · 48 kHz
~90s
Transcripción · en tempo real96% de precisión
S1

Polo que o canal chegou a 100k seguidores en oito meses — que foi o que realmente moveu a agulla?

S2

Honestamente, publicar Shorts a diario durante seis semanas. O tempo de visualización de longa duración viñou despois.

S1

E a reformulación da miniatura — foi probada con A/B en YouTube Studio?

S2

Si, coa nova ferramenta Probar e comparar. Dous de tres gañadores non tiñan cara deles.

96% en audio de locuciónSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcións reais · comparación honesta

Subtítulos automáticos de YouTube. Rev humano. Ou nós.

YouTube inclúe subtítulos automáticos en cada vídeo de forma gratuíta — só que non teñen moita precisión e non teñen etiquetas de altofalante. Rev vende transcripcións mecanografiadas por humanos a $1.50/min. Nós estamos no medio: IA con 95%+, etiquetas de altofalante, devolución en tres minutos.

Option 01

Subtítulos automáticos de YouTube

Gratis, integrados en cada vídeo público. Sen pase de puntuación, sen etiquetas de altofalante.

CustoGratis
Precisión~80% en fala limpa
Etiquetas de altofalanteNingunha
PuntuaciónEscasa, sen parágrafos
ExportaciónCopiar e pegar desde o panel de transcripción
Funciona enSó vídeos públicos
Best forEscanear rapidamente un vídeo que non é teu cando a precisión non importa.
Option 02

Transcription.Solutions

Pega o URL. Tres minutos despois: transcripción limpa, SRT/VTT, resumo con IA con enlaces de capítulos.

Custo · por min$0.03 en Pro
Precisión95%+ en locución
Etiquetas de altofalanteSi (Pro e Business)
PuntuaciónCompleta, con parágrafos
ExportaciónSRT · VTT · DOCX · TXT · JSON
Funciona enURLs públicas + sen listar
Best forCreadores re-subindo subtítulos, podcasters reutilizando vídeo en blog, investigadores sacando citas de entrevistas.
Option 03

Transcripción humana Rev

Un humano o mecanografa. Máxima precisión, devolución máis lenta, prezo por minuto.

Custo · por min$1.50
Precisión99%+ garantida
Etiquetas de altofalanteSi
PuntuaciónCompleta, nivel editorial
Devolución12-24 horas típico
Funciona enCalquera ficheiro subido
Best forContido admisible en tribunal, subtítulos de radiodifusión, ou entrevistas onde unha palabra perdida mata a cita.

Prezos precisos a partir de 2026. As taxas de Rev reflicten a súa capa de servizo estándar; capas só con IA de competidores non comparadas aquí.

Específico para YouTube

Tres cousas que morder á xente con ferramentas de transcripción xenéricas.

O audio de YouTube ten particularidades que os transcritores estándar non manexan. Xira a configuración correcta e a transcripción volve lista para re-subir coma subtítulos.

Que vai mal

  1. 1Os músicas de fondo confunden o recoñecedor. Os stings de introdución e a música de fondo transcríbense coma palabras desordenadas. A IA xenérica non sabe ignoralas.
  2. 2Os lonxitudes de liña SRT non coinciden coas regras de subtítulos de YouTube. Os subtítulos se solapan da área segura en móbil, ou se cortan a media palabra porque o chunker non foi axustado para vídeo.
  3. 3Os nomes específicos de canal (marcas patrocinadas, títulos de xogo, manexos de convidados coma @MKBHD) se escriben foneticamente. Un erro de escritura e a cita é insearchable.

Que xira aquí

  1. 1Activa segmentación consciente de música no formulario de traballo. Etiquetamos rexións de música con `[music]` en lugar de alucinamos letras, e retomamos a transcripción limpa cando a voz volve.
  2. 2Escolle SRT seguro para YouTube coma exportación. As liñas tapenan a 42 caracteres, máximo dúas liñas por clave, e os descansos aterran en límites de frases — bota o ficheiro directamente en YouTube Studio.
  3. 3Pega o vocabulario do canal (nomes de patrocinadores, convidados recorrentes, títulos de xogo) en Vocabulario personalizado. Aliméntao ao recoñecedor coma sugorrencia para que os nomes de marca se manteñan correctos.

Configuración de traballo recomendada para YouTube

Pega un URL de YouTube e estas xiran por defecto. Anula por traballo desde o formulario.

Fonte
Pegar URL · auto-resolver youtu.be
Diarización
Acústica · 1-4 altofalantes
Manexo de música
Etiquetar [music], saltar letras
Palabras de recheo
Eliminadas por defecto
Resumo
Marcas de tempo de capítulos + momentos clave
Exportación
SRT seguro para YouTube · VTT · DOCX

Accuracy · real-world numbers

95%+ en vídeos de locución. Audio de música e xogos teñen límites máis baixos.

O contido de YouTube varía enormemente — un podcast de estudio e unha stream de Fortnite non son o mesmo problema. A locución con micrófono de solapa en estudio é o mellor caso; a música de fondo e o audio de xogo solapado arrastran a precisión máis rápido. Os números abaixo son de URLs de YouTube reais en produción.

97%
Podcast de estudio · micrófono por convidado

Configuración estilo Joe Rogan: cada convidado nun micrófono boom separado, tratamento de sala lixeiro, sen pista de música. A diarización é trivial cando as voces non se solapan.

95%
Locución única · micrófono de solapa/USB

Tutorial estándar ou ensaio de vídeo. Un altofalante, audio interior, música de intro baixada baixo a voz. A maioría dos subidas de YouTube chegan aquí.

89%
Vlog con material B-roll · audio exterior

Vento, tráfico, música ambiente baixo voiceover. As palabras aínda se usan; espera fallos ocasionais en nomes propios e nomes de marca.

84%
Stream de xogos · voz sobre audio de xogo

SFX de xogo, música, e lectura de chat a volume variable. A voz do streamer adoita ser clara; os compañeiros de equipo en Discord caen máis rápido. Peor caso nos nosos datos.

Preguntas frecuentes

8 cousas que a xente pregunta sobre transcripción de YouTube.

01Simplemente pego o URL, ou descargo o vídeo primeiro?+
Simplemente pega o URL. Aceptamos youtube.com/watch, enlaces cortos de youtu.be, e URLs de vídeo sen listar. O resolvemos do lado do servidor, extraemos só a pista de audio (non o vídeo), e comezamos a transcribir — adoitamente dentro de 10 segundos de pegada.
02Funciona en vídeos privados ou sen listar?+
Sen listar si, privado non. Os URLs sen listar son publicamente resolubles se tes a ligazón, polo que podemos traeles. Os vídeos privados requiren estar conectado na túa conta de Google — non podemos suplantarte. Descarga primeiro o MP4 desde YouTube Studio, despois sube o ficheiro.
03Por que a túa transcripción é moito mellor que os subtítulos automáticos de YouTube?+
Os subtítulos automáticos de YouTube executan un modelo de streaming axustado polo custo a escala entre miles de millóns de vídeos. Executamos un modelo máis grande con decodificación de contexto completo, vocabulario personalizado, e un pase de diarización separado. Resultado: ~95% vs ~80%, máis etiquetas de altofalante e puntuación apropiada.
04Podo subir o SRT de volta a YouTube coma subtítulos da comunidade?+
Si. Exporta coma SRT seguro para YouTube, abre YouTube Studio → Subtítulos → Engadir → Subir ficheiro. Os nosos lonxitudes de liña e tempos coinciden coas regras de pantalla de YouTube, polo que as claves non se solapan en móbil ou se rompen a media palabra.
05Que tal dereitos de autor — é legal transcribir o vídeo de alguén?+
Transcribir para uso persoal, investigación, xornalismo, ou comentario é xeralmente fair use nos EE.UU. Re-publicar a transcripción completa comercialmente é máis confuso. Non almacenamos o audio ou vídeo, te damos o texto — o que fagas con el é a túa chamada. Non é asesoramento legal.
06Podes manexar vídeos longos coma episodios de podcast de 4 horas?+
Si. O noso límite difícil é 8 horas por ficheiro. Un episodio de 4 horas de Lex Fridman transcribese en aproximadamente 8-12 minutos de reloxo de parede e chega a uns $7.20 en prezos de Pro. A diarización de altofalante se mantén toda a lonxitude.
07Manexas vídeos de YouTube en idiomas que non son inglés?+
Si — 99 idiomas auto-detectados. Español, hindi, portugués e xaponés aterran dentro de 2-3 puntos da precisión do inglés en audio limpo. O cambio de código (inglés + español na mesma oración) funciona pero se degrada uns 5 puntos.
08Podo obter marcas de tempo de capítulos coma os auto-capítulos de YouTube?+
Si. O resumo de IA inclúe marcas de tempo estilo capítulo para transicións de tema máis enlaces de momentos clave. Pégate nunha descrición de vídeo coma `00:00 Intro / 03:42 Setup / …` — YouTube renderízaas coma capítulos clicables automaticamente.

Pega un URL de YouTube. Mira o que sae.

30 minutos gratis cada mes. Sen tarxeta. Etiquetas de altofalante, SRT seguro para YouTube, resumo con IA con marcas de tempo de capítulos — todo incluído.

Comeza gratis