Transcripciones de YouTube. Mejor que subtítulos automáticos.Más barato que humanos.

Pega una URL de video de YouTube. Obtén una transcripción precisa al 95%+ con etiquetas de orador, capítulos con marca de tiempo, y captions SRT/VTT que puedas volver a subir — sin Premium, sin extensión de Chrome.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

URL adentro. Captions y transcripción limpia afuera.

Pega un enlace youtu.be o youtube.com. Lo resolvemos, extraemos la pista de audio de mayor calidad del servidor, ejecutamos diarización y devolvemos una transcripción con marca de tiempo más SRT/VTT listos para subir como captions comunitarios.

youtu.be/dQw4w9WgXcQREC Entrevista · 2 oradores · 28:14
auto-detectado en-USopus 160 kbps · 48 kHz
~90s
Transcripción · streamingPrecisión del 96%
S1

Entonces el canal llegó a 100k suscriptores en ocho meses — ¿qué fue lo que realmente movió la aguja?

S2

Honestamente, publicar Shorts diariamente durante seis semanas. Después vinieron las vistas de video largo.

S1

Y el rediseño de la miniatura — ¿fue A/B testeado en YouTube Studio?

S2

Sí, la nueva herramienta Test & Compare. Dos de tres ganadores no tenían rostro en ellos.

96% en audio de talking-headSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Subtítulos automáticos de YouTube. Rev humano. O nosotros.

YouTube ofrece subtítulos automáticos en cada video de forma gratuita — simplemente no son muy precisos y no tienen etiquetas de orador. Rev vende transcripciones digitadas por humanos a $1,50/min. Nosotros estamos en el medio: IA al 95%+, etiquetas de orador, respuesta en tres minutos.

Option 01

Subtítulos automáticos de YouTube

Gratis, integrado en cada video público. Sin paso de puntuación, sin etiquetas de orador.

CostoGratis
Precisión~80% en discurso limpio
Etiquetas de oradorNinguna
PuntuaciónEscasez, sin párrafos
ExportaciónCopiar-pegar del panel de transcripción
Funciona enSolo videos públicos
Best forEscanear rápidamente un video que no posees cuando la precisión no importa.
Option 02

Transcription.Solutions

Pega la URL. Tres minutos después: transcripción limpia, SRT/VTT, resumen con IA con enlaces a capítulos.

Costo · por min$0,03 en Pro
Precisión95%+ en talking-head
Etiquetas de oradorSí (Pro y Business)
PuntuaciónCompleta, con párrafos
ExportaciónSRT · VTT · DOCX · TXT · JSON
Funciona enURLs públicas + sin listar
Best forCreadores que vuelven a subir captions, podcasters que repropósito video a blog, investigadores que extraen citas de entrevistas.
Option 03

Transcripción humana Rev

Un humano lo tipea. Máxima precisión, respuesta más lenta, precio por minuto.

Costo · por min$1,50
Precisión99%+ garantizado
Etiquetas de orador
PuntuaciónCompleta, nivel editorial
Tiempo de respuesta12-24 horas típico
Funciona enCualquier archivo subido
Best forContenido admisible en tribunal, subtítulos de transmisión, o entrevistas donde una palabra perdida mata la cita.

Precios precisos a partir de 2026. Las tarifas de Rev reflejan su nivel de servicio estándar; los tiers solo para IA de competidores no se comparan aquí.

Específico de YouTube

Tres cosas que muerden a la gente con herramientas de transcripción genéricas.

El audio de YouTube tiene peculiaridades que los transcriptores de serie no manejan. Voltea las configuraciones correctas y la transcripción vuelve lista para volver a subir como captions.

Qué sale mal

  1. 1Las pistas de música confunden al reconocedor. Los stings de intro y la música de fondo se transcriben como palabras destrozadas. La IA genérica no sabe ignorarlas.
  2. 2Las longitudes de línea SRT no coinciden con las reglas de captions de YouTube. Los subtítulos desbordan el área segura en móvil, o se cortan a mitad de palabra porque el chunker no fue ajustado para video.
  3. 3Nombres específicos de canales (marcas de patrocinador, títulos de juegos, handles de huéspedes como @MKBHD) se deletrean fonéticamente. Un typo y la cita es no buscable.

Qué voltear aquí

  1. 1Activa Segmentación consciente de música en el formulario de trabajo. Etiquetamos regiones de música con `[music]` en lugar de alucinar letras, y reanudamos la transcripción limpia cuando la voz regresa.
  2. 2Elige SRT seguro para YouTube como exportación. Las líneas se limitan a 42 caracteres, máximo dos líneas por cue, y los saltos caen en límites de frases — suelta el archivo directamente en YouTube Studio.
  3. 3Pega vocabulario de canal (nombres de patrocinadores, huéspedes recurrentes, títulos de juegos) en Vocabulario personalizado. Lo alimentamos al reconocedor como una pista para que los deletreos de marca se mantengan correctos.

Configuración de trabajo recomendada para YouTube

Pega una URL de YouTube y estos se activan por defecto. Anula por trabajo desde el formulario.

Fuente
Pasta de URL · auto-resolución youtu.be
Diarización
Acústica · 1-4 oradores
Manejo de música
Etiquetar [music], saltar letras
Palabras de relleno
Eliminadas por defecto
Resumen
Capítulos con marca de tiempo + momentos clave
Exportación
SRT seguro para YouTube · VTT · DOCX

Accuracy · real-world numbers

95%+ en videos de talking-head. Música y audio de juegos capan más bajo.

El contenido de YouTube varía enormemente — un podcast de estudio y una transmisión de Fortnite no son el mismo problema. El talking-head con micrófono de solapa es el mejor caso; la música de fondo y el audio de juego superpuesto reducen la precisión más rápido. Los números de abajo provienen de URLs de YouTube de clientes reales en producción.

97%
Podcast de estudio · micrófono por huésped

Configuración estilo Joe Rogan: cada huésped en un micrófono boom separado, tratamiento de sala ligero, sin música de fondo. La diarización es trivial cuando las voces no se solapan.

95%
Talking-head único · micrófono de solapa/USB

Tutorial estándar o ensayo de video. Un orador, audio de interior, música intro baja bajo la voz. La mayoría de subidas a YouTube caen aquí.

89%
Vlog con B-roll · audio al aire libre

Viento, tráfico, música ambiente bajo la voz en off. Las palabras siguen siendo utilizables; espera misses ocasionales en nombres propios y marcas.

84%
Transmisión de juego · voz sobre audio de juego

SFX de juego, música y lectura de chat a volumen variable. La voz del streamer suele ser clara; los compañeros en Discord caen más rápido. Peor caso en nuestros datos.

Preguntas comunes

8 cosas que preguntan sobre transcripción de YouTube.

01¿Solo pego la URL, o descargo el video primero?+
Solo pega la URL. Aceptamos youtube.com/watch, enlaces cortos youtu.be y URLs de video sin listar. Lo resolvemos del lado del servidor, extraemos solo la pista de audio (no el video) y comenzamos a transcribir — usualmente dentro de 10 segundos del paste.
02¿Funciona en videos privados o sin listar?+
Sin listar sí, privado no. Las URLs sin listar son resolubles públicamente si tienes el enlace, así que podemos obtenerlas. Los videos privados requieren estar conectado a tu cuenta de Google — no podemos hacerte pasar por ti. Descarga el MP4 desde YouTube Studio primero, luego sube el archivo.
03¿Por qué tu transcripción es mucho mejor que los subtítulos automáticos de YouTube?+
Los subtítulos automáticos de YouTube ejecutan un modelo de streaming ajustado para costo a escala a través de miles de millones de videos. Ejecutamos un modelo más grande con decodificación de contexto completo, vocabulario personalizado y un paso de diarización separado. Resultado: ~95% vs ~80%, más etiquetas de orador y puntuación apropiada.
04¿Puedo subir el SRT a YouTube como captions comunitarios?+
Sí. Exporta como SRT seguro para YouTube, abre YouTube Studio → Subtítulos → Añadir → Subir archivo. Nuestras longitudes de línea y timing coinciden con las reglas de pantalla de YouTube, así que los cues no desborden en móvil ni se rompan a mitad de palabra.
05¿Qué pasa con derechos de autor — ¿es legal transcribir el video de alguien más?+
Transcribir para uso personal, investigación, periodismo o comentario es generalmente fair use en EE.UU. Re-publicar la transcripción completa comercialmente es más turbio. No alojamos el audio o video, te entregamos el texto — lo que hagas con él es tu llamada. No es asesoría legal.
06¿Pueden manejar videos largos como episodios de podcast de 4 horas?+
Sí. Nuestro límite duro es 8 horas por archivo. Un episodio de 4 horas de Lex Fridman se transcribe en aproximadamente 8-12 minutos de reloj de pared y cuesta alrededor de $7,20 en precios Pro. La diarización de orador se aguanta a lo largo de la longitud completa.
07¿Manejan videos de YouTube en idiomas que no sean inglés?+
Sí — 99 idiomas detectados automáticamente. Español, hindi, portugués y japonés todos caen dentro de 2-3 puntos de precisión en inglés en audio limpio. Code-switching (inglés + español en la misma oración) funciona pero se degrada por ~5 puntos.
08¿Puedo obtener capítulos con marca de tiempo como los auto-capítulos de YouTube?+
Sí. El resumen con IA incluye marcas de tiempo estilo capítulo hacia transiciones de tema más enlaces de momentos clave. Pégatelos en tu descripción de video como `00:00 Intro / 03:42 Setup / …` — YouTube los renderiza como capítulos clickeables automáticamente.

Pega una URL de YouTube. Mira qué sale.

30 minutos gratis cada mes. Sin tarjeta. Etiquetas de orador, SRT seguro para YouTube, resumen con IA con capítulos con marca de tiempo — todo incluido.

Comienza gratis