Transcripción para investigadores académicos.Compatible con IRB, lista para CAQDAS, 100+ idiomas.

Carga una entrevista de investigación o grabación de grupo focal. Obtén texto con etiquetas de participante e indicado con marca de tiempo listo para NVivo, Atlas.ti, o MaxQDA — con audio eliminado en 24 horas.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

Grabación de campo dentro. Transcripción lista para codificar fuera.

Marcamos cada turno de participante con una marca de tiempo al inicio, mantenemos palabras de relleno si solicita modo verbatim, y exportamos DOCX con estilos de participante que su herramienta CAQDAS ya reconoce.

Entrevista semiestructurada · .wavREC 2 participantes · 1:08:24
detectado automáticamente en-GB44.1 kHz mono · micrófono de solapa
~90s
Transcripción · en tiempo realprecisión del 94% · modo verbatim
S1

¿Puedes caminar conmigo a través de la primera vez que notaste el cambio en el vecindario?

S2

Um, probablemente fue en 2019 — la panadería de la esquina cerró, y, sí, ahí es cuando me golpeó.

S1

¿Y cómo se sintió eso, viendo eso suceder durante esos meses?

S2

¿Honestamente? Como si el lugar que había conocido durante treinta años estuviera desapareciendo, pieza por pieza.

94% en entrevista con micrófono de solapaDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Rev humano. Transcripción de NVivo. O nosotros.

El servicio humano de Rev es el estándar histórico para citas de nivel de tesis. NVivo agrupa la transcripción de IA dentro de la herramienta CAQDAS. Nos posicionamos en medio — más rápido que Rev, más preciso e IRB-amigable que el incorporado de NVivo.

Option 01

Rev (transcripción humana)

Los humanos lo escriben. Lento, caro, pero el estándar de oro para verbatim publicable.

Turnaround12–24 horas (típico)
Costo · por minuto$1.50 humano / $0.25 IA
Etiquetas de participanteSí, colocadas manualmente
Retención de audioAlmacenado en servidores de Rev
IdiomasEN humano · ~30 IA
Exportación CAQDASDOCX, TXT (manual)
Best forEntrevistas de alto riesgo destinadas a citas directas en un artículo publicado, donde el presupuesto no es una limitación.
Option 02

Transcription.Solutions

Transcripción de IA en minutos, audio eliminado en 24h, DOCX estilizado para importación de NVivo y Atlas.ti.

Turnaround~5 min para archivo de 60 minutos
Costo · por minuto$0.03
Etiquetas de participanteDiarizadas, renombrar en la aplicación
Retención de audioEliminado en 24 h
Idiomas100+, detectado automáticamente
Exportación CAQDASEstilos de encabezado DOCX + TXT
Best forInvestigadores que realizan 20+ entrevistas que necesitan transcripción rápida de primer paso, luego corrigen a mano el 5% de citas destinadas a publicación.
Option 03

NVivo Transcription / Otter

Transcripción de IA agrupada dentro de su herramienta CAQDAS o tomador de notas. Conveniente, inclinado hacia EN, menos control.

TurnaroundComparable (IA)
CostoPaquetes de crédito · ~$0.30/min
Etiquetas de participanteAcústicas, ajustadas a EN
Retención de audioVinculado a la suscripción
IdiomasLa precisión de no-EN disminuye
Exportación CAQDASNativo solo de NVivo
Best forEstudiantes de doctorado independientes que trabajan completamente en inglés dentro de un ecosistema CAQDAS que desean una sola factura.

Precios y banderas de características precisos a partir de 2026. La división de IA/humano de Rev y los precios de crédito de Transcripción de NVivo varían según la región y la licencia académica.

Específico para investigación cualitativa

Tres cosas que muerden a los investigadores en herramientas de transcripción genéricas.

Cambia la configuración correcta antes de cargar y la transcripción se importa directamente a tu proyecto CAQDAS.

Qué sale mal

  1. 1Palabras de relleno eliminadas silenciosamente. La IA genérica elimina "um", "like", falsos comienzos — está bien para notas de reunión, fatal para análisis de conversación o investigación de discurso.
  2. 2Terminología de dominio (marcos teóricos, nombres de medicamentos, nombres de lugares, términos de parentesco) se transcribe fonéticamente. La codificación entonces necesita una pasada de buscar y reemplazar.
  3. 3El audio se queda en los servidores del proveedor indefinidamente. La mayoría de los planes de gestión de datos de IRB requieren eliminación o retención controlada — los proveedores raramente documentan esto claramente.

Qué cambiar aquí

  1. 1Cambia a modo Verbatim en el formulario de trabajo. Mantenemos rellenos, falsos comienzos, repeticiones y marcadores de risa — el modo limpio es opcional, no predeterminado para investigadores.
  2. 2Pega tus términos de codebook y nombres propios en Vocabulario personalizado. Lo pasamos como una pista de reconocimiento, no como una sustitución dura, así que el contexto sigue ganando.
  3. 3El audio es eliminado en 24 horas después de la finalización del trabajo. La transcripción permanece en su cuenta. Podemos emitir una confirmación de eliminación para su archivo de IRB si lo solicita.

Configuración de trabajo recomendada para entrevistas de investigación

Carga una grabación de campo y estos se activan de forma predeterminada. Anula por trabajo desde el formulario.

Modo
Verbatim (rellenos + falsos comienzos activados)
Modelo de participante
Entrevista · 2–8 participantes
Idioma
Detección automática · tolerante al acento
Marcas de tiempo
Cada turno de participante
Retención de audio
Eliminar en 24 h
Exportación
DOCX (estilos CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% en una entrevista limpia con micrófono de solapa. Honesto sobre lo que rompe el trabajo de campo.

El audio de campo es el caso difícil en transcripción — salas abiertas, inglés acentuado, discurso superpuesto en grupos focales. Las entrevistas diádicas con micrófono de solapa alcanzan el techo; las grabaciones de campo ambiental y los grupos focales grandes se degradan más rápido. Los números a continuación provienen de cargas reales de investigadores, no de puntos de referencia sintéticos.

95%
1 a 1, micrófono de solapa o USB

Sala silenciosa, L2 único o hablante nativo, grabadora sobre la mesa. Mejor caso para entrevistas semiestructuradas — la mayoría de los estudios diádicos terminan aquí.

91%
Grabadora portátil, 2–3 participantes

Grabadora Zoom H4n o de teléfono en el centro de la mesa. Sillas de participantes identificadas por dirección. Planifica una pasada de renombrado de 5 minutos.

85%
Entrevista de campo, ruido ambiental

Café, mercado, entrevista caminando. El parloteo de fondo y el tráfico afectan las respuestas cortas; los turnos principales siguen siendo codificables.

80%
Grupo focal, 5–8 participantes

Discurso superpuesto y micrófono compartido. La diarización fusionará algunas voces más tranquilas — espera desambiguar en el momento de codificación.

Preguntas frecuentes

8 cosas que los investigadores preguntan sobre transcripción académica.

01¿Es esto aceptable bajo un plan típico de gestión de datos de IRB?+
La mayoría de los planes que hemos visto nos aprueban una vez que leen dos hechos: el audio se elimina dentro de 24 horas de la finalización del trabajo, y las transcripciones se mantienen solo en la cuenta del investigador. No somos un IRB nosotros mismos — tu junta toma la decisión final — pero emitiremos una descripción escrita del procesamiento para tu protocolo si lo solicitas.
02¿Mantienen mi audio de entrevista?+
No. El archivo de audio es eliminado en 24 horas después de que se termine el trabajo. Solo la transcripción permanece en tu cuenta, y puedes eliminarla en cualquier momento. No usamos audio de investigación para entrenar modelos.
03¿Pueden hacer verbatim verdadero — con rellenos, falsos comienzos y superposiciones — para análisis de conversación?+
Sí. Activa el modo Verbatim en el formulario de trabajo y mantenemos "um", "uh", repeticiones, falsos comienzos y tokens de risa. La superposición está marcada con un símbolo de llave en el límite del turno. No hacemos la notación de Jefferson automáticamente — eso sigue siendo una pasada humana.
04¿Se importará el DOCX limpiamente en NVivo, Atlas.ti, o MaxQDA?+
Sí. Nuestro DOCX utiliza los estilos de encabezado y participante que cada herramienta espera para auto-codificación por participante. En NVivo, usa Archivo → Importar → Transcripciones. En Atlas.ti y MaxQDA, se preserva la estructura de párrafo de participante para que la auto-codificación por participante funcione de inmediato.
05¿Cómo maneja el inglés acentuado o las entrevistas multilingües?+
Soportamos 100+ idiomas con detección automática, incluido el cambio de código dentro de una sola grabación. Los acentos L2 fuertes caen alrededor del 85–90% en audio limpio. Para idiomas minoritarios con datos de entrenamiento escasos (por ejemplo, algunos idiomas africanos e indígenas), la precisión es menor y lo indicamos en el selector de idioma.
06Grupos focales con 6–8 personas — ¿realmente funciona la diarización?+
Parcialmente. La diarización acústica separa confiablemente 4–5 voces distintas en un micrófono compartido. Más allá de eso, espera que el modelo fusione a los dos participantes más tranquilos. La solución es una pasada de cambio de nombre en el editor de transcripción — la mayoría de las transcripciones de grupos focales necesitan 10–15 minutos de limpieza.
07¿Pueden mi co-PI y estudiantes de posgrado acceder a transcripciones en el mismo proyecto?+
Sí. Los espacios de trabajo soportan carpetas compartidas con permisos por usuario — PI puede ver todas las entrevistas, RAs ven solo su cohorte asignada. Útil para estudios multisitio donde no quieres que un estudiante exporte los datos de otro.
08Para citas directas de nivel de publicación, ¿ofrecen una pasada humana?+
Todavía no, y no fingiremos que lo hacemos. Para citas que van a una tesis o artículo, nuestra recomendación es: ejecuta la transcripción de IA primero, codifica en tu herramienta CAQDAS, luego corrige manualmente los 30–60 segundos específicos alrededor de cada cita contra el audio antes de que se elimine. Ese es el flujo de trabajo que la mayoría de nuestros usuarios investigadores usan.

Carga una entrevista. Ve si la transcripción se codifica como la codificarías.

30 minutos gratis cada mes. Sin tarjeta. Modo verbatim, 100+ idiomas, DOCX listo para CAQDAS, audio eliminado en 24 h.

Comenzar gratis