Transcrición de YouTube Shorts.60 segundos de vídeo, 10 segundos para transcrición.

Pega unha URL de Shorts ou deixa caer o MP4. Obtén SRT, VTT e texto limpo en segundos — listo para reutilizar o clip de Shorts en Reels, TikTok ou nunha publicación de blog.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira que sae

URL de Shorts entra. Subtítulos sáen.

Extraemos o audio do vídeo de Shorts no servidor, eliminamos a pista de música e devolvemos texto con marcas de tempo máis un SRT con precisión de fotograma. Nada de extensión do navegador, nada de captura OBS, nada de extraer ti mesmo.

youtube.com/shorts/aB3kQ…REC 1 orador · 00:58
auto-detectado en-US44.1 kHz · pista vocal illada
~90s
Transcrición · streaming94% de precisión
S1

Tres configuracións de iPhone que ninguén te contou — a número un está agochada en Accesibilidade.

S1

Vai a Configuración, Accesibilidade, Toque, despois desplázate cara abaixo ata Golpe Traseiro.

S1

Estabelece o toque duplo para facer captura de pantalla. Agora podes facer captura de pantalla cunha man.

S1

Garda isto antes de que se entarre no teu feed.

94% en Shorts de cara a cámaraSRT · VTT · DOCX · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcións reais · comparación honesta

Subtítulos automáticos de YouTube. SubMagic. Ou nós.

YouTube xera subtítulos gratuitamente dentro de Studio. SubMagic e similares (CapCut, Veed) graban subtítulos animados no vídeo. Nós dámosche a transcrición bruta e ficheiros de subtítulos limpios para levar a calquera lugar.

Option 01

Subtítulos automáticos de YouTube

Gratuíto, integrado en Studio. Atrapado en YouTube, orientado ao inglés, sen exportación real.

RequierePosúes o canal de Shorts
Etiquetas de oradorNingunha
Idiomas~13 fiables
ExportaciónSBV / SRT en Studio
Xestión de músicaFrecuentemente inserta [Music]
CustoGratuíto
Best forCreadores que só necesitan subtítulos en YouTube e non reutilizan o clip noutro lugar.
Option 02

Transcription.Solutions

Pega calquera URL pública de Shorts. Obtén SRT, VTT e texto limpo — teu para usar en calquera lugar.

RequiereURL pública ou carga MP4
Etiquetas de oradorDiarización incluída
Idiomas99, detectados automaticamente
ExportaciónSRT · VTT · DOCX · TXT · JSON
Xestión de músicaIllamento vocal activado por defecto
Custo · por min$0.03
Best forCreadores que reutilizan Shorts en TikTok e Reels, axencias xestionando o canal doutro, calquera que queira o texto fóra de Studio.
Option 03

SubMagic / CapCut

Subtítulos animados incrustados. Vese ben na pantalla, pero o texto vive dentro dos píxeles.

RequiereCarga MP4 de orixe
Etiquetas de oradorUn único orador
Idiomas~30, axustado a EN
ExportaciónFicheiro de vídeo (non texto)
Xestión de músicaBoa — deseñada para shorts
Custo~$10–25/mes
Best forCreadores que queren subtítulos word-level emerxentes incorporados na exportación e non precisan a transcrición bruta.

Os prezos e bandeiras de características son aproximados a partir de 2026. O soporte de idioma dos subtítulos de YouTube varía por rexión.

Específico para Shorts

Tres cousas que morden aos creadores nas ferramentas de transcrición xenéricas.

Os Shorts non son pequenos podcasts. A pista de música, a velocidade e o script pesado en hashtags rompen ferramentas construídas para reunións.

Que sae mal

  1. 1Pista de música mesturada alta. ASR xenérica transcribe as letras da canción no medio da túa frase. Obtés '[Music] vai a configuracións [Music] toca en'.
  2. 2Nomes de marcas e hashtags (Notion, Arc, Linear, #buildinpublic) volven en minúsculas e fonético. Os subtítulos vimiñan aficionados ao volver a cargar.
  3. 3Entrega rápida. Os creadores de Shorts falan a 200+ WPM para encaixar un gancho en 60 segundos. As ferramentas axustadas ao ritmo das reunións perden os finais das palabras.

Que axustar aquí

  1. 1Deixa Illamento vocal activado — é o predeterminado. Executamos un paso de supresión de música antes do recoñecemento, polo que as letras non se filtran na transcrición.
  2. 2Deixa a túa lista de marcas en Vocabulario personalizado. Nome do canal, nomes de produtos, hashtags recurrentes. Os pasamos como pistas de sesgo ao recoñecedor.
  3. 3Escolle o modelo de orador Short-form. Está axustado para entrega de un único orador e ritmo rápido e pon máis peso na detección de límites de palabras que o modelo conversacional.

Configuracións recomendadas do traballo para Shorts

Pega unha URL de Shorts e estas actívanse por defecto. Anula por traballo desde o formulario.

Entrada
URL pública ou carga MP4
Modelo de orador
Short-form · 1-2 oradores
Illamento vocal
Activado (supresión de música)
Palabras de relleno
Mantidas — os creadores queren exacto
Resumo
Hook + payoff (Pro/Business)
Exportación
SRT · VTT · word-level JSON

Accuracy · real-world numbers

94% nun Short de cara a cámara. A pista de música marxa o límite.

Os Shorts son curtos, así que unha palabra mala é visible. O illamento vocal contra a pista de música é o que axustamos. Os números inferiores son de URLs reais de Shorts que procesamos, non de clips sintéticos.

96%
Voz en off de estudio, sen música

Gravado nun micrófono, música engadida en post pero mesturada baixo. Caso máis limpo — erro principalmente en nomes propios e xerga.

94%
Cara a cámara, pista de música lixeira

Teléfono ou DSLR, música reducida baixo a voz. O illamento vocal eleva o diálogo de forma limpa. A maioría dos Shorts sitúanse aquí.

87%
Audio de tendencia alto de fondo

A música sitúase ao mesmo nivel que a voz. As palabras se cortan en consoantes duros e en letras que solapan o diálogo.

82%
Voz en off de rúa, campo ou B-roll

Vento, tráfico, multitude ambiente. Texto utilizable pero espera un paso de limpeza de 30 segundos nos números, nomes e mencións de marcas.

Preguntas comúns

8 cousas que os creadores preguntan sobre transcrición de Shorts.

01¿Posso simplemente pegar unha URL youtube.com/shorts/?+
Si — ese é o fluxo principal. Pega a URL, nós obtemos o audio público no servidor e comezamos a transcribir. Sen extensión do navegador, sen captura OBS, sen descargar primeiro o MP4.
02¿Funciona en Shorts que non posúo?+
Si, sempre que o Short sexa público. Non podemos acceder a vídeos sen listar ou privados porque YouTube bloquea as buscas anónimas. Para Shorts privados, descarga o MP4 desde Studio e cárgao directamente.
03¿Aliñarase o SRT co vídeo cargado de novo en TikTok ou Reels?+
Si. As marcas de tempo fan referencia ao inicio do audio, así que sempre que non recortes a cabeza do clip ao volver a cargar, o SRT se cae limpamente. ¿Recortar a fronte? Resta ese desprazamento en calquera editor de subtítulos.
04¿Que pasa coa música — aparece como [Music] como YouTube?+
Non. Executamos illamento vocal antes do recoñecemento, polo que a pista de música se suprime e transcribimos só a voz falada. Non verás etiquetas [Music] espalladas pola transcrición.
05¿Cantos Shorts podo facer no nivel gratuíto?+
30 minutos ao mes. O Short medio é de 30-45 segundos, así que son aproximadamente 40-60 Shorts ao mes antes de chegar a Pro. A diarización e a exportación SRT están incluídas no nivel gratuíto.
06¿Xestionas marcas de tempo a nivel de palabra para subtítulos animados?+
Si, en todos os plans. Escolle word-level JSON no desplegable de exportación. Podes alimentalo directamente en CapCut, Premiere ou un modelo personalizado de Remotion para renderizar subtítulos emerxentes.
07¿Que tal Shorts que non son en inglés?+
99 idiomas admitidos, detectados automaticamente desde o audio. Español, portugués, hindi, tagalo, árabe — todos probados en produción. Os Shorts multilingües (code-switching) funcionan pero a precisión baixa 4-6 puntos.
08¿Posso obter un resumo ou suxestións de título desde a transcrición?+
Si en Pro e Business. O resumo devolve un gancho dunha liña, o payoff e 3-5 variantes de título suxeridas baseadas no script. O nivel gratuíto obtén só a transcrición.

Pega unha URL de Shorts. Mira que sae.

30 minutos gratuítos cada mes — ducias de Shorts. Sen tarxeta. SRT, VTT e word-level JSON incluídos en todos os plans.

Comezar gratuíto