Transcripción de YouTube. Mejor que subtítulos automáticos.Más económica que transcriptores humanos.

Pega una URL de vídeo de YouTube. Obtén una transcripción con precisión del 95%+, etiquetas de locutor, capítulos con marca de tiempo, y subtítulos SRT/VTT que puedes volver a cargar — sin Premium, sin extensión de Chrome.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

Pega URL. Obtén subtítulos y transcripción limpia.

Pega un enlace de youtu.be o youtube.com. Lo resolvemos, extraemos la pista de audio de mayor calidad del lado del servidor, ejecutamos diarización y te devolvemos una transcripción con marca de tiempo más SRT/VTT listo para cargar como subtítulos de comunidad.

youtu.be/dQw4w9WgXcQREC Entrevista · 2 locutores · 28:14
auto-detectado es-MXopus 160 kbps · 48 kHz
~90s
Transcripción · en directo96% de precisión
S1

Así que el canal llegó a 100k suscriptores en ocho meses — ¿qué movió realmente la aguja?

S2

Honestamente, publicar Shorts a diario durante seis semanas. El tiempo de visualización de vídeos largos vino después.

S1

¿Y la revisión de la miniatura — fue probada en YouTube Studio?

S2

Sí, la herramienta Probar y comparar nueva. Dos de tres ganadores no tenían rostro.

96% en audio de persona hablandoSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Subtítulos automáticos de YouTube. Rev humano. O nosotros.

YouTube envía subtítulos automáticos en cada vídeo de forma gratuita — solo que no son muy precisos y no tienen etiquetas de locutor. Rev vende transcripciones mecanografiadas por humanos a $1.50/min. Nosotros estamos en el medio: IA al 95%+, etiquetas de locutor, entrega en tres minutos.

Option 01

Subtítulos automáticos de YouTube

Gratis, integrado en cada vídeo público. Sin corrección de puntuación, sin etiquetas de locutor.

PrecioGratis
Precisión~80% en voz clara
Etiquetas de locutorNinguna
PuntuaciónEscasa, sin párrafos
ExportaciónCopiar-pegar del panel de transcripción
Funciona enSolo vídeos públicos
Best forEscanear rápidamente un vídeo que no es tuyo cuando la precisión no importa.
Option 02

Transcription.Solutions

Pega la URL. Tres minutos después: transcripción limpia, SRT/VTT, resumen con IA y enlaces a capítulos.

Precio · por minuto$0.03 en Pro
Precisión95%+ en de persona hablando
Etiquetas de locutorSí (Pro y Business)
PuntuaciónCompleta, con párrafos
ExportaciónSRT · VTT · DOCX · TXT · JSON
Funciona enURLs públicos y sin listar
Best forCreadores que cargan subtítulos, podcasters que reutilizan vídeos en blogs, investigadores que extraen citas de entrevistas.
Option 03

Transcripción humana Rev

Un humano lo mecanografía. Máxima precisión, entrega más lenta, precio por minuto.

Precio · por minuto$1.50
Precisión99%+ garantizado
Etiquetas de locutor
PuntuaciónCompleta, de nivel editorial
EntregaTípicamente 12-24 horas
Funciona enCualquier archivo cargado
Best forContenido admisible en corte, subtítulos de transmisión, o entrevistas donde una palabra perdida arruina la cita.

Precios precisos a partir de 2026. Las tarifas de Rev reflejan su nivel de servicio estándar; los niveles solo con IA de competidores no se comparan aquí.

Específico de YouTube

Tres cosas que afectan a la gente en herramientas genéricas de transcripción.

El audio de YouTube tiene peculiaridades que los transcriptores genéricos no manejan. Activa la configuración correcta y la transcripción vuelve lista para volver a cargar como subtítulos.

Qué sale mal

  1. 1Las camas de música confunden al reconocedor. Los intros y la música de fondo se transcriben como palabras garbled. La IA genérica no sabe ignorarlas.
  2. 2Las longitudes de línea SRT no coinciden con las reglas de subtítulos de YouTube. Los subtítulos desbordan el área segura en móvil, o se cortan a mitad de palabra porque el divisor no estaba calibrado para vídeo.
  3. 3Los nombres específicos del canal (marcas auspiciadas, títulos de juegos, identificadores de invitados como @MKBHD) se deletrean fonéticamente. Un error tipográfico y la cita no es buscable.

Qué activar aquí

  1. 1Activa segmentación consciente de música en el formulario de trabajo. Etiquetamos regiones de música con `[music]` en lugar de alucinar letras, y reanudamos la transcripción limpia cuando la voz regresa.
  2. 2Elige SRT seguro para YouTube como exportación. Las líneas se limitan a 42 caracteres, máximo dos líneas por pista, y los descansos caen en límites de frase — drop el archivo directamente en YouTube Studio.
  3. 3Pega el vocabulario del canal (nombres de auspiciadores, invitados recurrentes, títulos de juegos) en Vocabulario personalizado. Lo suministramos al reconocedor como una pista para que los nombres de marcas se deletreen correctamente.

Configuración de trabajo recomendada para YouTube

Pega una URL de YouTube y estas se activan por defecto. Anula por trabajo desde el formulario.

Fuente
Pegado de URL · resolución automática youtu.be
Diarización
Acústica · 1-4 locutores
Manejo de música
Etiqueta [music], omite letras
Palabras de relleno
Removidas por defecto
Resumen
Capítulos con marca de tiempo + momentos clave
Exportación
SRT seguro para YouTube · VTT · DOCX

Accuracy · real-world numbers

95%+ en vídeos de persona hablando. La música y el audio de videojuegos reducen la precisión.

El contenido de YouTube varía enormemente — un podcast de estudio y una transmisión de Fortnite no son el mismo problema. El micrófono de solapa en persona hablando es el mejor caso; la música de fondo y el audio de juego superpuesto reducen la precisión más rápido. Los números a continuación provienen de URLs reales de YouTube de clientes en producción.

97%
Podcast de estudio · micrófono separado por invitado

Configuración al estilo Joe Rogan: cada invitado en un micrófono de brazo separado, tratamiento de sala suave, sin cama de música. La diarización es trivial cuando las voces no se superponen.

95%
Persona hablando única · micrófono de solapa/USB

Tutorial o ensayo de vídeo estándar. Un locutor, audio interior, música de introducción reducida bajo la voz. La mayoría de cargas de YouTube caen aquí.

89%
Vlog con B-roll · audio exterior

Viento, tráfico, música ambiental bajo la narración. Las palabras siguen siendo útiles; espera ocasionales errores en nombres propios y marcas.

84%
Transmisión de juegos · voz sobre audio de juego

Efectos de juego, música y lectura de chat a volumen variable. La voz del streamer generalmente clara; los compañeros en Discord se pierden primero. El peor caso en nuestros datos.

Preguntas frecuentes

8 cosas que la gente pregunta sobre transcripción de YouTube.

01¿Solo pego la URL, o descargo el vídeo primero?+
Solo pega la URL. Aceptamos youtube.com/watch, enlaces cortos youtu.be y URLs de vídeos sin listar. Lo resolvemos del lado del servidor, extraemos solo la pista de audio (no el vídeo) y comenzamos a transcribir — típicamente en 10 segundos después de pegar.
02¿Funciona en vídeos privados o sin listar?+
Sin listar sí, privado no. Las URLs sin listar son públicamente resolubles si tienes el enlace, por lo que podemos obtenerlas. Los vídeos privados requieren estar conectado a tu cuenta de Google — no podemos suplantarte. Descarga el MP4 de YouTube Studio primero, luego carga el archivo.
03¿Por qué tu transcripción es mucho mejor que los subtítulos automáticos de YouTube?+
Los subtítulos automáticos de YouTube ejecutan un modelo de transmisión optimizado para costo a escala en miles de millones de vídeos. Ejecutamos un modelo más grande con decodificación de contexto completo, vocabulario personalizado y una pasada de diarización separada. Resultado: ~95% vs ~80%, más etiquetas de locutor y puntuación adecuada.
04¿Puedo cargar los SRT de vuelta a YouTube como subtítulos de comunidad?+
Sí. Exporta como SRT seguro para YouTube, abre YouTube Studio → Subtítulos → Agregar → Cargar archivo. Nuestras longitudes de línea y sincronización coinciden con las reglas de visualización de YouTube, por lo que los subtítulos no desbordará en móvil ni se cortarán a mitad de palabra.
05¿Qué hay sobre el copyright — es legal transcribir vídeo de otra persona?+
Transcribir para uso personal, investigación, periodismo o comentario es generalmente uso legítimo en EE.UU. Re-publicar la transcripción completa comercialmente es más borroso. No alojamos el audio o vídeo, te entregamos el texto — lo que hagas con él es tu decisión. No es asesoramiento legal.
06¿Pueden manejar vídeos largos como episodios de podcast de 4 horas?+
Sí. Nuestro límite duro es 8 horas por archivo. Un episodio de 4 horas de Lex Fridman se transcribe en aproximadamente 8-12 minutos en reloj de pared y llega alrededor de $7.20 con precio Pro. La diarización de locutor se mantiene en toda la longitud.
07¿Manejan vídeos de YouTube en idiomas que no son inglés?+
Sí — 99 idiomas detectados automáticamente. Español, hindi, portugués y japonés se sitúan dentro de 2-3 puntos de precisión del inglés en audio limpio. El cambio de código (inglés + español en la misma oración) funciona pero se degrada en ~5 puntos.
08¿Puedo obtener marcas de tiempo de capítulos como los capítulos automáticos de YouTube?+
Sí. El resumen con IA incluye marcas de tiempo al estilo de capítulos para transiciones de tema más enlaces a momentos clave. Pégatelos en la descripción de tu vídeo como `00:00 Intro / 03:42 Configuración / …` — YouTube los renderiza como capítulos que se pueden hacer clic automáticamente.

Pega una URL de YouTube. Mira qué sale.

30 minutos gratis cada mes. Sin tarjeta. Etiquetas de locutor, SRT seguro para YouTube, resumen con IA con marcas de tiempo de capítulos — todo incluido.

Comienza gratis