Empezar gratis

Transcribir
grabaciones de vozaudio y vídeovídeos de YouTubearchivos de audioarchivos de vídeovídeos MP4reuniones de ZoomMicrosoft TeamsGoogle Meetentrevistaspodcastsclasesvídeos de TikToknotas de voz de WhatsAppnotas de vozarchivos MP3llamadassermones
a texto. En segundos

Obtén una transcripción limpia con etiquetas de hablantes y resumen de IA, más rápido que en tiempo real.

Suelta tu audio o vídeo

MP3 · MP4 · WAV · M4A · MOV · hasta 10 horas por archivo

Pega un enlace y extraemos el audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · +50 más

Graba directamente desde tu navegador

Registrarse lleva 30 segundos — la grabación se abre justo después, en el panel.

Gratis 30 min/moSin tarjeta100+ 100+ idiomasEtiquetas de hablantes (Pro+)Los archivos se eliminan automáticamente en 24 h

Plan gratuito: 30 minutos al mes, hasta 30 min por archivo. No se requiere tarjeta.

100+
Idiomas detectados automáticamente
Detección automática con anulación manual.
95%+
Precisión en audio limpio
Los principales idiomas, uno o dos hablantes.
10h
Duración máxima de archivo en Business
10 h en Pro · 30 min en Free.
~30×
Más rápido que en tiempo real
Un archivo de 60 min suele estar listo en 2-3 min.
Este es el panel

Haz clic para explorar. Es la versión real

Las pestañas funcionan. Los elementos de acción se pueden activar. Esto es exactamente lo que se carga en tu cuenta después de que un trabajo finalice — mismo diseño, mismos controles.

app.transcription.solutions / jobs / interview-ari-2026-04-26

Resumen

captura automática · saved
TL;DR

Los fundadores necesitan contenido posterior a la llamada, no solo transcripciones. Las herramientas los obligan a unir 5 aplicaciones.

318words2hablantes · 58 / 425temas

Puntos clave 3

  • 01Existe una brecha entre las grabaciones en bruto y el contenido publicable
  • 02Notas del programa, clips sociales, borradores de blog: se esperan al final de la llamada
  • 03Las herramientas actuales están fragmentadas en más de 5 aplicaciones

Elementos de acción 2

  • Investigar un enfoque de tubería única para reemplazar la unión de 5 aplicaciones
  • Simular cómo se vería un borrador de notas del programa a partir de esta transcripción
Temasflujo de trabajo del fundadorcontenido posterior a la llamadafragmentación de herramientasnotas del programatubería única

Transcripción diarizada

4 líneas · 2 hablantes · clip de 30 s
00:12Hablante AEntonces, lo que sigo escuchando de los fundadores es esta brecha entre las grabaciones en bruto y el contenido que realmente se puede publicar.
00:27Hablante BExactamente. Nadie quiere otra transcripción, quieren una nota del programa, un clip, un borrador de blog, para cuando termine la llamada.
00:41Hablante ACierto, y las herramientas actuales te obligan a unir cinco aplicaciones para lograrlo.
00:54Hablante BUna tubería, un lugar. Esa es la apuesta.

Análisis de hablantes

División de canales estéreo · diarización en mono
Hablante A
58% de tiempo al aire
2
Turns
14s
Tiempo de habla
…esta brecha entre las grabaciones en bruto y el contenido que realmente se puede publicar.
Hablante B
42% de tiempo al aire
2
Turns
10s
Tiempo de habla
Una tubería, un lugar. Esa es la apuesta.

Formatos de exportación

Todos los planes, todos los formatos · 7 salidas · sin marcas de agua · TXT · SRT · MD · JSON · VTT · DOCX · PDF
TXT

Texto sin formato

Volcado de texto limpio · todos los planes

SRT

Subtítulo SubRip

Subtítulo con marca de tiempo · todos los planes

MD

Markdown

Encabezados de hablantes + resumen · todos los planes

JSON

JSON estructurado

Esquema público · para flujos de trabajo con API · todos los planes

VTT

Subtítulo WebVTT

Formato de reproductor de vídeo HTML5 · todos los planes

DOCX

Documento de Word

Encabezados de hablantes + marcas de tiempo · todos los planes

PDF

PDF con marca

Listo para imprimir · resumen y hablantes · todos los planes

DEMO · SILENCIADO
0:18 / 1:00
Salida de muestra · 30 segundos de un clip de podcast

Un archivo. Ocho resultados

Pasa el cursor o toca cualquier salida para ver cómo se ve realmente. El mismo clip de podcast de 30 segundos en el centro, ocho artefactos derivados de él.

Transcripción

Puntuado · con marca de tiempo

00:12 Hablante A
Entonces, lo que sigo escuchando de los fundadores es esta brecha…
Resumen de IA

TL;DR · puntos clave

Los fundadores necesitan contenido posterior a la llamada contenido, no solo transcripciones. Las herramientas los obligan a unir 5 aplicaciones.
Hablantes

Diarización · Pro+

División de canales estéreo para llamadas de dos personas. Diarización en mono para todo lo demás.
100+ idiomas

Detección automática

ASR de nivel de investigación. Fuerza un idioma específico si la detección automática elige el incorrecto.
interview-ari-2026-04-26.mp3
Clip de 30 segundos · 2 hablantes
100+ idiomas · detección automática · 95%+ de precisión
Transcripción · ventana de 30 s
00:12
AEntonces, lo que sigo escuchando de los fundadores es esta brecha.
00:14
ALa llamada termina, el trabajo real comienza.
00:18
BCierto — lo posterior a la llamada se come el día.
00:21
ALas herramientas asumen que la transcripción es el entregable.
00:24
AEs el insumo.
00:27
BAsí que unes cinco aplicaciones a mano.
Resumen de IA
TL;DR: Los fundadores necesitan contenido posterior a la llamada contenido, no transcripciones en bruto. Las herramientas actuales obligan a un flujo de trabajo de 5 aplicaciones.
Puntos clave
  • La transcripción es el insumo, no el entregable
  • Los elementos de acción superan al texto sin formato
  • Una tubería única supera a las SaaS cosidas
Diarización · 2 hablantes detectados
Hablante A
Hablante B
0:000:150:30
División de canales estéreo · 62% / 38% de participación
Detección de idioma
Inglés (en-US)99.2%
Otros candidatos
en-GB Inglés (Reino Unido)0.6%
en-AU Inglés (Australia)0.2%
Detectado al subir · anulación en cualquier momento · 100+ idiomas
Exportaciones · 7 formatos · sin marcas de agua
TXT interview-ari-2026-04-26.txt34 KB
SRT interview-ari-2026-04-26.srt52 KB
VTT interview-ari-2026-04-26.vtt51 KB
MD interview-ari-2026-04-26.md38 KB
JSON interview-ari-2026-04-26.json71 KB
DOCX interview-ari-2026-04-26.docx91 KB
PDF interview-ari-2026-04-26.pdf146 KB
Ingesta de URL · 1500+ sitios compatibles
youtube.com/watch?v=Hk8L4mD2pXv
Obtener metadatos0.3s
Descargar audio4.2 MB
Extraer vozestéreo · 44 kHz
Encolar para ASR
REC00:42 / 60:00
Safari en iPhone · Chrome en escritorio
Se detiene automáticamente a los 60 min — sube archivos más largos
Estado del trabajo en vivo
Subir0:08
Extracción de audio0:02
ASR · AssemblyAI U-247%
Diarizaciónen cola
Resumen de IAen cola
Renderizado de exportaciónen cola
Estado actualizado paso a paso · sin necesidad de actualizar
Exportaciones

7 formatos · sin marcas de agua

TXTSRTMDJSONVTTDOCXPDF
Ingesta de URL

YouTube · TikTok · Instagram

Pega cualquier enlace de vídeo. Lo descargamos una vez, transcribimos y descartamos la fuente.
Grabación del navegador

Micrófono en Safari iPhone · Chrome

Presiona grabar, habla, presiona detener. Sin instalación de aplicación. Hasta 60 min por grabación.
Progreso en tiempo real

Estado del trabajo mediante WebSocket

Estado en vivo desde la subida → ASR → diarización → finalizado. Sin sondeos, sin esperar a ciegas.
Quién usa esto

Creado para las personas que realmente hacen el trabajo

Tres patrones que vemos cada semana. La tubería no cambia — lo que envías después sí lo hace.

01Podcasters

Episodio notas del programa publicado

Una entrevista larga se convierte en un resumen de 5 líneas, cuatro capítulos, una transcripción con etiquetas de hablantes y un SRT para clips de formato corto — un trabajo, cada salida que realmente publicas.

7 formatosTXT · SRT · MD · JSON
VTT · DOCX · PDF
02Investigadores

Entrevistas extensas, citadas por marca de tiempo

Grabaciones de Zoom de tres horas con dos voces, de principio a fin. Diarización de hablantes en Pro. Cita por marca de tiempo desde la exportación DOCX. No más rebuscar "¿dónde dijo eso…?".

95%+Precisión de ASR
en audio limpio
03Equipos pequeños

Grabaciones elementos de acción asignados

Sin unión automática, sin permisos de calendario, sin "agente en tu reunión". Suelta la grabación, comparte la transcripción. Elementos de acción extraídos, nombrados, listos para triaje.

2,500Minutos al mes
en el plan Business
Entradas que aceptamos

Suelta un archivo, pega un enlace
o llama a nuestra API

Seis formas de entrada, funcionando hoy. Cada píldora es una ruta de ingesta real que se envía en producción ahora mismo.

YouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooks
Precios

Planes que
realmente se ajustan

Todos los planes incluyen ASR de calidad de diarización. Los niveles superiores desbloquean archivos más grandes, prioridad en la cola y resumen de IA.

MensualAnual −50%
Free
$0para siempre
Sin tarjeta · sin vencimiento de prueba

Para probar, usos ocasionales, clips cortos.

  • 30 minutos al mes
  • Hasta 30 min por archivo
  • Todos los 7 formatos de exportación · sin marcas de agua
  • Cola de baja prioridad
Empezar gratis →
Se requiere verificación de correo electrónico
Más popular
Pro
$19$19/ mes
Cancela cuando quieras · $0.04 / min por exceso

Para personas que realizan entrevistas, podcasts o trabajo extenso repetido.

  • 600 minutos al mes
  • Hasta 60 min por archivo
  • Etiquetas de hablantes + resumen de IA
  • Elementos de acción + etiquetas de tema
  • Pulido de párrafos "hacer legible"
  • Traducción · entrega por webhook
  • Prioridad de cola estándar
Elegir Pro →
Exceso $0.04 / min · cancela cuando quieras
Business
$49$49/ mes
Cancela cuando quieras · $0.02 / min por exceso

Para equipos, agencias y operaciones que trabajan con volumen.

  • 2,500 minutos al mes
  • Hasta 4 horas por archivo
  • Todo lo de Pro · 50 traducciones / mes
  • Cola de alta prioridad
  • API REST pública · nivel de límite de velocidad por clave
  • Soporte prioritario por correo electrónico
Elegir Business →
Exceso $0.02 / min · cancela cuando quieras

La facturación anual ahorra 50% · Política de reembolso · No se requiere tarjeta para Gratuito

Mismo audio · dos salidas

Gratuito te da palabras.
Pro entrega resultados.

Mismo audio, mismo modelo. La diferencia es todo lo que hacemos después de que la transcripción finaliza.

Salida gratuita

Entonces, lo que sigo escuchando de los fundadores es esta brecha entre las grabaciones en bruto y el contenido que realmente pueden publicar. Exactamente, nadie quiere otra transcripción, quieren una nota del programa, un clip, un borrador de blog, para cuando termine la llamada. Cierto, y las herramientas actuales te obligan a unir cinco aplicaciones para lograrlo. Una tubería, un lugar. Esa es la apuesta. Hemos visto este patrón durante meses: el audio llega limpio, pero el flujo de trabajo posterior se sostiene con capturas de pantalla y copiar-pegar entre Notion y Otter y Zapier y lo que sea que esté abierto en otra pestaña cuando la llamada termina y el plazo está en veinte minutos…

Transcripción simpleSin etiquetas de hablantesSin resumenLos 7 formatos

Siguiente: pégalo en algún lado, estructúralo, escribe el resumen tú mismo, extrae los elementos de acción a mano.

Salida Pro
TL;DR

Los fundadores no necesitan transcripciones — necesitan postprocesamiento. Una tubería única supera a unir cinco aplicaciones.

00:12 Hablante AEntonces, lo que sigo escuchando de los fundadores es esta brecha entre las grabaciones en bruto y el contenido que realmente se puede publicar.
00:27 Hablante BExactamente. Nadie quiere otra transcripción, quieren una nota del programa, un clip, un borrador de blog, para cuando termine la llamada.
00:41 Hablante ACierto, y las herramientas actuales te obligan a unir cinco aplicaciones para lograrlo.
00:54 Hablante BUna tubería, un lugar. Esa es la apuesta.
Elementos de acción · 2
  1. Prueba una tubería unificada — audio entra, notas y exportaciones salen, un trabajo.
  2. Reemplaza el stack de Otter + Notion + Zapier antes de la próxima llamada.
TL;DR · 1 líneaHablantes · diarizadosElementos de acción · 2Pulido "hacer legible"

Siguiente: copia el TL;DR en Slack, adjunta el DOCX al correo, publica el clip. Listo antes de que las notas de la llamada se enfríen.

— Mismo audio · Mismo modelo · La diferencia está en el postprocesamiento —

En la práctica

Lo que nuestros usuarios no dejan de mencionar about

Reseñas no solicitadas de usuarios registrados. No ejecutamos campañas de incentivo de reseñas. Pasa el cursor para pausar.

MR
Maya Reyes
@mayarcuts · podcaster

La podcaster abre 5 pestañas para publicar un episodio. Un trabajo en — notas del programa, transcripción, SRT listo para clips. Eso es todo.

18 abr.1 trabajo en
DA
Dr. Diego Alarcón
@diegoalarcon · investigador

14 entrevistas extensas mediante diarización. DER 0.95 en audio limpio es real. Las exportaciones DOCX van directamente al borrador del artículo.

22 abr.DER 0.95
SO
Sora Okafor
@sorawrites · escritora

26 notas de voz. 3 URL de TikTok. Esquema de boletín informativo en 11 minutos. Intenta superar eso con Otter — esperaré.

19 abr.11 min
MR
Maya Reyes
@mayarcuts · podcaster

La podcaster abre 5 pestañas para publicar un episodio. Un trabajo en — notas del programa, transcripción, SRT listo para clips. Eso es todo.

18 abr.1 trabajo en
DA
Dr. Diego Alarcón
@diegoalarcon · investigador

14 entrevistas extensas mediante diarización. DER 0.95 en audio limpio es real. Las exportaciones DOCX van directamente al borrador del artículo.

22 abr.DER 0.95
SO
Sora Okafor
@sorawrites · escritora

26 notas de voz. 3 URL de TikTok. Esquema de boletín informativo en 11 minutos. Intenta superar eso con Otter — esperaré.

19 abr.11 min
JV
Jules Verstappen
@julesverops · operaciones

Webhook + extracción de elementos de acción mató nuestro resumen semanal. Todo el ciclo es 2 minutos ahora.

23 abr.Ciclo de 2 min
RK
Rohan Kapoor
@rohan_legal · abogado

Grabaciones de declaraciones → transcripción diarizada → PDF citado. Solía subcontratar esto en el extranjero. Ahora es una subida.

24 abr.1 subida
EM
Elena Marchetti
@elenamarch · ventas

Llamadas de ventas en italiano → resúmenes en inglés. Mi equipo finalmente los lee. Pequeño detalle, gran impacto.

27 abr.IT → EN
JV
Jules Verstappen
@julesverops · operaciones

Webhook + extracción de elementos de acción mató nuestro resumen semanal. Todo el ciclo es 2 minutos ahora.

23 abr.Ciclo de 2 min
RK
Rohan Kapoor
@rohan_legal · abogado

Grabaciones de declaraciones → transcripción diarizada → PDF citado. Solía subcontratar esto en el extranjero. Ahora es una subida.

24 abr.1 subida
EM
Elena Marchetti
@elenamarch · ventas

Llamadas de ventas en italiano → resúmenes en inglés. Mi equipo finalmente los lee. Pequeño detalle, gran impacto.

27 abr.IT → EN
TN
Tomi Nakamura
@tominaka · traductor

La detección automática de japonés simplemente funciona. La cursiva serif de este sitio es, sin embargo, un crimen de diseño no relacionado que respeto.

21 abr.detección automática
PL
Priya Lakshmi
@priyalbuilds · fundadora

API REST + límite de velocidad por clave = nuestra tubería interna de notas de voz. Tomó 30 minutos configurarlo. $19/mes para todo el equipo.

25 abr.$19/mes
FA
Fatima Al-Rashid
@fatima_writes · periodista

La eliminación automática en 24 h es la función que no sabía que quería hasta que revisé la página de privacidad de cada competidor.

26 abr.eliminación 24h
TN
Tomi Nakamura
@tominaka · traductor

La detección automática de japonés simplemente funciona. La cursiva serif de este sitio es, sin embargo, un crimen de diseño no relacionado que respeto.

21 abr.detección automática
PL
Priya Lakshmi
@priyalbuilds · fundadora

API REST + límite de velocidad por clave = nuestra tubería interna de notas de voz. Tomó 30 minutos configurarlo. $19/mes para todo el equipo.

25 abr.$19/mes
FA
Fatima Al-Rashid
@fatima_writes · periodista

La eliminación automática en 24 h es la función que no sabía que quería hasta que revisé la página de privacidad de cada competidor.

26 abr.eliminación 24h
Preguntas frecuentes

Preguntas que la gente realmente ask

¿Qué tan precisa es la transcripción?+

En audio claro con uno o dos hablantes, la precisión alcanza el 95%+ en la mayoría de los idiomas principales. La calidad disminuye con ruido de fondo, acentos fuertes o habla superpuesta.

¿Qué idiomas?+

Más de 100 idiomas con detección automática. También puedes forzar un idioma específico si la detección automática elige el incorrecto. La interfaz de usuario solo está en inglés — la interfaz multilingüe está en la lista planificada.

¿Por cuánto tiempo conservan mis archivos?+

El medio fuente (el audio/vídeo que subiste) se elimina de nuestra infraestructura dentro de las 24 horas posteriores a la finalización de la transcripción. La transcripción y el resumen permanecen en tu cuenta hasta que los elimines — o 30 días después de que elimines tu cuenta. Nuestros proveedores de voz a texto (AssemblyAI principal, OpenAI como respaldo) procesan el audio bajo sus propias políticas de retención — consulta /privacy para la lista completa de subprocesadores.

¿Entrenan modelos con mis grabaciones?+

No. Nuestro proveedor de ASR ascendente tiene exclusión de entrenamiento por defecto para endpoints pagados — nosotros usamos esos. No agregamos nada adicional: ningún modelo propio entrenado con tus transcripciones, sin análisis encubiertos.

¿Qué sucede si un trabajo falla?+

Tus minutos no se descuentan. La mayoría de las fallas (URL privada, archivo demasiado largo, códec no compatible) vienen con un mensaje de error claro y orientación para reintentar.

¿Puedo cancelar?+

Sí, en cualquier momento desde el portal de clientes de Stripe. Mantienes tu plan durante el período pagado, luego pasas a Gratuito en la próxima fecha de renovación.

¿Cuál es la política de reembolso?+

Reembolso completo dentro de los 7 días si has usado menos del 10% de los minutos de tu plan. Después de eso, reembolsos prorrateados por la parte no utilizada. Envía un correo a [email protected].

¿Tienen una API?+

Sí — la API REST está en vivo, también los webhooks. La autenticación por clave de API está en la lista de próximas funciones. Límites de velocidad según el nivel del plan. Documentación en /docs/api una vez que tengas una cuenta.

Seguridad y privacidad

Lo aburrido, gestionado

Sin certificación SOC 2. Si no implementamos un control aún, no colocamos una insignia.

100%
Eliminación automática
de los archivos fuente en 24 horas, siempre
0
Rastreadores · anuncios · reventa
Tu audio nunca se usa para entrenar modelos
1×
Eliminar con un clic
Cuenta + todos los datos eliminados en 30 días

Archivos fuente borrados en 24 h

El audio y vídeo que subes desaparecen dentro de las 24 horas posteriores a la finalización del trabajo. Contrato firme, no una configuración.

Sin entrenamiento con tus datos

El proveedor de ASR ascendente tiene exclusión de entrenamiento por defecto — usamos esos endpoints. No agregamos nada adicional.

AES-256 + TLS 1.3

Cifrado en reposo y en tránsito, desde el primer día. HSTS aplicado.

Alineado con el RGPD

Derechos de acceso/eliminación/portabilidad de la UE respetados. DPA disponible bajo solicitud.

Eliminación con un clic

Configuración → Eliminar cuenta. Todos los datos eliminados en 30 días. No se requiere ticket de soporte.

Lista de subprocesadores

Lista completa de proveedores con propósito en /privacy. Sin proveedores sorpresa.

— LISTO CUANDO TÚ LO ESTÉS

Suelta un archivo.
Obtén una transcripción
antes de que tu café se enfríe

30 minutos gratis al mes, hasta 30 min por archivo. Sin tarjeta de crédito, sin tarjeta después de la prueba, sin asteriscos. Cancela cualquier plan en cualquier momento con un clic.

Gratis / mes30 min
Idiomas100+
Formatos de exportación7
MP3MP4WAVM4AMOVMKVWEBMYOUTUBETIKTOKINSTAGRAMGRABACIÓN DEL NAVEGADOR