Transcripción para investigadores académicos.Consciente de IRB, listo para CAQDAS, 100+ idiomas.

Suelta una entrevista de investigación o grabación de grupo focal. Obtén texto etiquetado por hablante y con marca de tiempo listo para NVivo, Atlas.ti o MaxQDA — con audio eliminado en 24 horas.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

Grabación de campo dentro. Transcripción lista para codificar fuera.

Marcamos cada turno de participante con una marca de tiempo al principio, mantenemos palabras de relleno si solicitas modo verbatim, y exportamos DOCX con estilos de hablante que tu herramienta CAQDAS ya reconoce.

Entrevista semiestructurada · .wavREC 2 hablantes · 1:08:24
en-GB detectado automáticamente44.1 kHz mono · micrófono de solapa
~90s
Transcripción · transmisión94% de precisión · modo verbatim
S1

¿Puedes contarme cómo fue la primera vez que notaste el cambio en el barrio?

S2

Um, probablemente fue 2019 — la panadería de la esquina cerró, y, sí, ese fue el momento.

S1

¿Y cómo se sintió ver eso suceder durante esos meses?

S2

¿Honestamente? Como si el lugar que había conocido durante treinta años desapareciera, pieza por pieza.

94% en entrevista de solapaDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Rev humano. Transcripción NVivo. O nosotros.

El servicio humano de Rev es el estándar histórico para citas de grado de disertación. NVivo agrupa transcripción de IA dentro de la herramienta CAQDAS. Nos sentamos en el medio — más rápido que Rev, más preciso y compatible con IRB que el de NVivo.

Option 01

Rev (transcripción humana)

Los humanos lo escriben. Lento, caro, pero el estándar de oro para verbatim publicable.

Plazo12–24 horas (típico)
Costo · por minuto$1.50 humano / $0.25 IA
Etiquetas de hablanteSí, colocadas manualmente
Retención de audioAlmacenado en servidores de Rev
IdiomasEN humano · ~30 IA
Exportación CAQDASDOCX, TXT (manual)
Best forEntrevistas únicas de alto riesgo destinadas a citas directas en un artículo publicado, donde el presupuesto no es la restricción.
Option 02

Transcription.Solutions

Transcripción de IA en minutos, audio eliminado en 24h, DOCX estilizado para importación en NVivo y Atlas.ti.

Plazo~5 min para un archivo de 60 min
Costo · por minuto$0.03
Etiquetas de hablanteDiarizadas, renombra en la app
Retención de audioEliminado en 24h
Idiomas100+, detectado automáticamente
Exportación CAQDASDOCX estilos de encabezado + TXT
Best forInvestigadores que realizan 20+ entrevistas que necesitan transcripciones rápidas de primer-paso, luego corrigen mano el 5% de citas destinadas a publicación.
Option 03

NVivo Transcription / Otter

Transcripción de IA incluida en tu herramienta CAQDAS o tomador de notas. Conveniente, orientado a EN, menos control.

PlazoComparable (IA)
CostoPaquetes de crédito · ~$0.30/min
Etiquetas de hablanteAcústica, afinada EN
Retención de audioVinculado a suscripción
IdiomasPrecisión no-EN cae
Exportación CAQDASNativo a NVivo solamente
Best forEstudiantes de PhD solitarios trabajando completamente en inglés dentro de un ecosistema CAQDAS que quieren una sola factura.

Precios y características de bandera precisos a partir de 2026. La división AI/humana de Rev y la fijación de precios de créditos de transcripción de NVivo varían por región y licencias académicas.

Específico para investigación cualitativa

Tres cosas que comen investigadores en herramientas de transcripción genéricas.

Voltea la configuración correcta antes de cargar y la transcripción se importa directamente a tu proyecto CAQDAS.

Qué sale mal

  1. 1Palabras de relleno eliminadas silenciosamente. La IA genérica elimina "um", "como", falsos comienzos — bien para notas de reuniones, fatal para análisis de conversación o trabajo de discurso.
  2. 2Terminología de dominio (marcos teóricos, nombres de drogas, nombres de lugares, términos de parentesco) se transcribe fonéticamente. La codificación luego necesita una pasada de buscar y reemplazar.
  3. 3El audio se queda en los servidores del proveedor indefinidamente. La mayoría de los planes de gestión de datos de IRB requieren eliminación o retención controlada — los proveedores raramente documentan esto claramente.

Qué voltear aquí

  1. 1Cambia a modo Verbatim en el formulario de trabajo. Mantenemos rellenos, falsos comienzos, repeticiones y marcadores de risa — el modo limpio es opt-in, no predeterminado para investigadores.
  2. 2Pega tu términos de código y palabras clave en vocabulario personalizado. Lo pasamos como una pista de reconocimiento, no una sustitución fija, para que el contexto todavía gane.
  3. 3El audio se elimina dentro de 24 horas de la finalización del trabajo. La transcripción se queda en tu cuenta. Podemos emitir una confirmación de eliminación para tu archivo IRB bajo solicitud.

Configuración de trabajo recomendada para entrevistas de investigación

Suelta una grabación de campo y estas se activen por defecto. Anula por trabajo desde el formulario.

Modo
Verbatim (rellenos + falsos comienzos activados)
Modelo de hablante
Entrevista · 2–8 hablantes
Idioma
Autodetectar · tolerante a acento
Marcas de tiempo
Cada turno de hablante
Retención de audio
Eliminar en 24h
Exportación
DOCX (estilos CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% en una entrevista limpia de solapa. Honesto sobre qué rompe el trabajo de campo.

El audio de campo es el caso difícil en transcripción — salas abiertas, inglés con acento, discurso superpuesto en grupos focales. Las entrevistas diádicas con micrófono de solapa alcanzan el techo; las grabaciones de campo ambiente y los grupos focales grandes se degradan más rápido. Los números a continuación provienen de cargas reales de investigadores, no puntos de referencia sintéticos.

95%
1-a-1, solapa o micrófono USB

Habitación silenciosa, hablante L2 único o nativo, grabadora sobre la mesa. Mejor caso para entrevistas semiestructuradas — la mayoría de los estudios diádicos llegan aquí.

91%
Grabadora portátil, 2–3 hablantes

Zoom H4n o grabadora de teléfono a media mesa. Sillas de hablante identificadas por dirección. Planifica una pasada de relabel de 5 min.

85%
Entrevista de campo, ruido ambiente

Café, mercado, entrevista caminando. El chatter de fondo y el tráfico afectan respuestas cortas; los turnos principales permanecen codificables.

80%
Grupo focal, 5–8 participantes

Discurso superpuesto y micrófono compartido. La diarización fusionará algunas voces más tranquilas — espera desambiguar en el momento de la codificación.

Preguntas comunes

8 cosas que investigadores preguntan sobre transcripción académica.

01¿Esto es aceptable bajo un plan típico de gestión de datos de IRB?+
La mayoría de los planes que hemos visto nos aprueban una vez que leen dos hechos: el audio se elimina dentro de 24 horas de la finalización del trabajo, y las transcripciones permanecen solo en la cuenta del investigador. No somos un IRB nosotros mismos — tu junta toma la decisión final — pero emitiremos una descripción de procesamiento escrita para tu protocolo bajo solicitud.
02¿Mantienes mi audio de entrevista?+
No. El archivo de audio se elimina en 24 horas de terminar el trabajo. Solo la transcripción permanece en tu cuenta, y puedes eliminarla en cualquier momento. No usamos audio de investigación para entrenar modelos.
03¿Puedes hacer verbatim verdadero — con rellenos, falsos comienzos y superposiciones — para análisis de conversación?+
Sí. Activa el modo Verbatim en el formulario de trabajo y mantenemos "um", "uh", repeticiones, falsos comienzos y tokens de risa. La superposición se marca con un símbolo de llave en el límite de turno. No hacemos notación de Jefferson automáticamente — eso sigue siendo una pasada humana.
04¿El DOCX se importará limpiamente en NVivo, Atlas.ti o MaxQDA?+
Sí. Nuestro DOCX usa los estilos de encabezado y hablante que cada herramienta espera para codificación automática por hablante. En NVivo, usa Archivo → Importar → Transcripciones. En Atlas.ti y MaxQDA, la estructura de párrafo-hablante se preserva para que la codificación automática por hablante funcione lista para usar.
05¿Cómo maneja inglés con acento o entrevistas multilingües?+
Soportamos 100+ idiomas con autodetección, incluido code-switching dentro de una sola grabación. Los acentos L2 pesados llegan alrededor del 85–90% en audio limpio. Para idiomas minoritarios con datos de entrenamiento dispersos (p. ej., algunos idiomas africanos e indígenas), la precisión es más baja y lo decimos en el selector de idiomas.
06Grupos focales con 6–8 personas — ¿la diarización realmente funciona?+
Parcialmente. La diarización acústica separa de manera confiable 4–5 voces distintas en un micrófono compartido. Más allá de eso, espera que el modelo fusione los dos participantes más tranquilos. La corrección es una pasada de relabel en el editor de transcripción — la mayoría de las transcripciones de grupos focales necesitan 10–15 minutos de limpieza.
07¿Mi co-PI y estudiantes de posgrado pueden acceder a transcripciones en el mismo proyecto?+
Sí. Los espacios de trabajo soportan carpetas compartidas con permisos por usuario — PI puede ver todas las entrevistas, RAs ven solo su cohorte asignada. Útil para estudios multisitio donde no quieres que un estudiante exporte los datos de otro.
08Para citas directas de grado de publicación, ¿ofreces una pasada humana?+
Aún no, y no fingiremos hacerlo. Para citas que van a una tesis o artículo, nuestra recomendación es: ejecuta primero la transcripción de IA, codifica en tu herramienta CAQDAS, luego corrige mano los específicos 30–60 segundos alrededor de cada cita contra el audio antes de que se elimine. Ese es el flujo que la mayoría de nuestros usuarios investigadores usan.

Carga una entrevista. Mira si la transcripción codifica como lo harías tú.

30 minutos gratis cada mes. Sin tarjeta. Modo verbatim, 100+ idiomas, DOCX listo para CAQDAS, audio eliminado en 24h.

Comienza gratis