Transcripción para investigadores académicos.Compatible con IRB, lista para CAQDAS, 100+ idiomas.

Sube una entrevista de investigación o grabación de grupo focal. Obtén texto con etiquetas de parlantes y marca de tiempo listo para NVivo, Atlas.ti o MaxQDA — con audio eliminado dentro de 24 horas.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

Grabación de campo adentro. Transcripción lista para codificar afuera.

Marcamos cada intervención de participante con una marca de tiempo al inicio, mantenemos palabras de relleno si solicitas modo verbatim, y exportamos DOCX con estilos de parlante que tu herramienta CAQDAS ya reconoce.

Entrevista semiestructurada · .wavREC 2 parlantes · 1:08:24
auto-detectado en-GB44.1 kHz mono · micrófono lavalier
~90s
Transcripción · en tiempo real94% precisión · modo verbatim
S1

¿Puedes contarme qué fue lo primero que notaste del cambio en el barrio?

S2

Mm, fue probablemente 2019 — la panadería de la esquina cerró, y sí, ahí fue cuando lo sentí.

S1

¿Y cómo se sentía ver eso suceder durante esos meses?

S2

¿Honestamente? Como si el lugar que había conocido durante treinta años estuviera desapareciendo, poco a poco.

94% en entrevista con lavalierDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Rev human. NVivo Transcription. O nosotros.

El servicio humano de Rev es el estándar histórico para citas de calidad para tesis. NVivo incluye transcripción IA dentro de la herramienta CAQDAS. Nos ubicamos en el medio — más rápido que Rev, más preciso y compatible con IRB que el sistema integrado de NVivo.

Option 01

Rev (human transcription)

Lo transcriben humanos. Lento, costoso, pero el estándar de oro para verbatim publicable.

Tiempo de entrega12–24 horas (típico)
Costo · por minuto$1.50 humano / $0.25 IA
Etiquetas de parlantesSí, colocadas manualmente
Retención de audioAlmacenado en servidores de Rev
IdiomasEN humano · ~30 IA
Exportación CAQDASDOCX, TXT (manual)
Best forEntrevistas de alto riesgo destinadas a citación directa en un artículo publicado, donde el presupuesto no es una limitación.
Option 02

Transcription.Solutions

Transcripción IA en minutos, audio eliminado en 24h, DOCX estilizado para importar en NVivo y Atlas.ti.

Tiempo de entrega~5 min para un archivo de 60 min
Costo · por minuto$0.03
Etiquetas de parlantesDiarizadas, renombra en la app
Retención de audioEliminado dentro de 24h
Idiomas100+, auto-detectado
Exportación CAQDASEstilos de encabezado DOCX + TXT
Best forInvestigadores que ejecutan 20+ entrevistas que necesitan transcripciones rápidas de primer paso, luego corrigen manualmente el 5% de citas destinadas a publicación.
Option 03

NVivo Transcription / Otter

Transcripción IA incluida en tu herramienta CAQDAS o aplicación de notas. Conveniente, enfocada en EN, menos control.

Tiempo de entregaComparable (IA)
CostoPaquetes de crédito · ~$0.30/min
Etiquetas de parlantesAcústica, ajustada para EN
Retención de audioVinculada a suscripción
IdiomasPrecisión non-EN disminuida
Exportación CAQDASNativa solo en NVivo
Best forEstudiantes de PhD que trabajan enteramente en inglés dentro de un ecosistema CAQDAS único que quieren una sola factura.

Precios y banderas de características precisos a partir de 2026. La división IA/humano de Rev y los precios de crédito de NVivo Transcription varían por región y licencia académica.

Específico para investigación cualitativa

Tres cosas que duelen a investigadores en herramientas de transcripción genéricas.

Cambia la configuración correcta antes de cargar y la transcripción se importa directamente a tu proyecto CAQDAS.

Qué sale mal

  1. 1Palabras de relleno eliminadas silenciosamente. La IA genérica remueve "mm", "como", falsos inicios — bien para notas de reunión, fatal para análisis de conversación o trabajo discursivo.
  2. 2Terminología de dominio (marcos teóricos, nombres de drogas, nombres de lugares, términos de parentesco) se transcribe fonéticamente. La codificación entonces necesita un paso de buscar y reemplazar.
  3. 3El audio permanece en los servidores del proveedor indefinidamente. La mayoría de planes de gestión de datos IRB requieren eliminación o retención controlada — los proveedores rara vez documentan esto claramente.

Qué cambiar aquí

  1. 1Cambia a modo Verbatim en el formulario de trabajo. Mantenemos rellenos, falsos inicios, repeticiones, y marcadores de risa — el modo limpio es opt-in, no predeterminado para investigadores.
  2. 2Pega tus términos de codebook y sustantivos propios en vocabulario personalizado. Lo pasamos como una pista de reconocimiento, no una sustitución dura, así que el contexto aún gana.
  3. 3El audio se elimina dentro de 24 horas de la finalización del trabajo. La transcripción permanece en tu cuenta. Podemos emitir una confirmación de eliminación para tu archivo IRB bajo solicitud.

Configuración recomendada de trabajos para entrevistas de investigación

Sube una grabación de campo y estas se activan por defecto. Anula por trabajo desde el formulario.

Modo
Verbatim (rellenos + falsos inicios activados)
Modelo de parlante
Entrevista · 2–8 parlantes
Idioma
Auto-detectar · tolerante con acento
Marcas de tiempo
Cada turno de parlante
Retención de audio
Eliminar dentro de 24h
Exportación
DOCX (estilos CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% en una entrevista con lavalier limpia. Honesto sobre lo que el trabajo de campo rompe.

El audio de campo es el caso difícil en transcripción — habitaciones abiertas, inglés con acento, speech solapado en grupos focales. Las entrevistas diádicas con micrófono lavalier alcanzan el techo; las grabaciones de campo ambiente y los grupos focales grandes se degradan más rápido. Los números de abajo provienen de cargas de investigadores reales, no benchmarks sintéticos.

95%
1 a 1, micrófono lavalier o USB

Habitación silenciosa, hablante L2 único o nativo, grabadora sobre la mesa. Mejor caso para entrevistas semiestructuradas — la mayoría de estudios diádicos caen aquí.

91%
Grabadora portátil, 2–3 parlantes

Zoom H4n o grabadora de teléfono al centro de la mesa. Sillas de parlantes identificadas por dirección. Planifica un paso de relabeling de 5 min.

85%
Entrevista de campo, ruido ambiente

Café, mercado, entrevista al caminar. La charla de fondo y el tráfico afectan respuestas cortas; los turnos principales siguen siendo codificables.

80%
Grupo focal, 5–8 participantes

Speech solapado y micrófono compartido. La diarización fusionará algunas voces más tranquilas — espera desambiguar al momento de la codificación.

Preguntas frecuentes

8 cosas que investigadores preguntan sobre transcripción académica.

01¿Es esto aceptable bajo un plan típico de gestión de datos IRB?+
La mayoría de planes que hemos visto nos aprueban una vez leen dos hechos: el audio se elimina dentro de 24 horas de la finalización del trabajo, y las transcripciones permanecen solo en la cuenta del investigador. No somos un IRB nosotros mismos — tu junta directiva hace la llamada final — pero emitiremos una descripción de procesamiento escrita para tu protocolo bajo solicitud.
02¿Mantienes el audio de mi entrevista?+
No. El archivo de audio se elimina dentro de 24 horas de que finaliza el trabajo. Solo la transcripción permanece en tu cuenta, y puedes eliminarla en cualquier momento. No usamos audio de investigación para entrenar modelos.
03¿Puedes hacer verdadero verbatim — con rellenos, falsos inicios, y solapamientos — para análisis de conversación?+
Sí. Activa el modo Verbatim en el formulario de trabajo y mantenemos "mm", "uh", repeticiones, falsos inicios, y marcadores de risa. El solapamiento se marca con un símbolo de llave en el límite del turno. No hacemos notación Jefferson automáticamente — eso aún es un paso humano.
04¿Se importará el DOCX limpiamente en NVivo, Atlas.ti, o MaxQDA?+
Sí. Nuestro DOCX usa los estilos de encabezado y parlante que cada herramienta espera para auto-codificación por parlante. En NVivo, usa Archivo → Importar → Transcripciones. En Atlas.ti y MaxQDA, la estructura párrafo-parlante se preserva así que la auto-codificación por parlante funciona lista para usar.
05¿Cómo maneja inglés con acento o entrevistas multilingües?+
Soportamos 100+ idiomas con auto-detección, incluyendo cambio de código dentro de una sola grabación. Acentos L2 pesados ​​aterrizan alrededor del 85–90% en audio limpio. Para idiomas minoritarios con datos de entrenamiento escasos (p. ej., algunos idiomas africanos e indígenas), la precisión es menor y lo decimos en el selector de idioma.
06¿Grupos focales con 6–8 personas — la diarización realmente funciona?+
En parte. La diarización acústica separa confiablemente 4–5 voces distintas en un micrófono compartido. Más allá de eso, espera que el modelo fusione los dos participantes más tranquilos. La solución es un paso de renombrado en el editor de transcripciones — la mayoría de transcripciones de grupos focales necesitan 10–15 minutos de limpieza.
07¿Pueden mi co-PI y estudiantes de posgrado acceder a transcripciones en el mismo proyecto?+
Sí. Los espacios de trabajo soportan carpetas compartidas con permisos por usuario — PI puede ver todas las entrevistas, RAs ven solo su cohorte asignada. Útil para estudios multi-sitio donde no quieres que un estudiante exporte datos de otro.
08¿Para citas directas de calidad de publicación, ofrecen un pase humano?+
Aún no, y no pretenderemos que lo hacemos. Para citas que van en una tesis o artículo, nuestra recomendación es: ejecuta primero la transcripción IA, codifica en tu herramienta CAQDAS, luego corrige manualmente los 30–60 segundos específicos alrededor de cada cita contra el audio antes de que sea eliminado. Ese es el flujo de trabajo que usa la mayoría de nuestros usuarios investigadores.

Carga una entrevista. Ve si la transcripción se codifica como la codificarías tú.

30 minutos gratis cada mes. Sin tarjeta. Modo verbatim, 100+ idiomas, DOCX lista para CAQDAS, audio eliminado en 24h.

Empezar gratis