Transcripción de grupos fokales.Cada orador etiquetado, cada palabra.

Dejá una grabación de grupo fokal con 6, 8, incluso 10 voces. Obtenés una transcripción verbatim con cada participante etiquetado, solapamiento de voces marcado, y un DOCX que se carga directo en NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mirá qué sale

Ocho participantes adentro. Verbatim etiquetado afuera.

Los grupos fokales son el caso de diarización más difícil de nuestra cola — demográficos similares, voces parecidas, solapamiento de voces frecuente. Etiquetamos el solapamiento en línea en lugar de descartarlo, después vos renombrás Orador 3 → 'Participante_F2' una sola vez y se propaga.

Grabación de grupo fokalREC Moderador + 7 participantes · 1:23:14
auto-detectado en-US44 kHz micrófono de límite · WAV
~90s
Transcripción · en directo91% precisión · 8 oradores
S1

Entonces cuando abriste el empaque por primera vez — contame qué notaste.

S2

¿Honestamente? Lo primero fue el olor. Como un hospital, algo clínico —

S3

Sí, lo mismo. Pensé que era supposed to be el de lavanda.

S2

Exacto, y la etiqueta dice lavanda pero realmente no —

91% en sala de 8 oradores con micrófono de límiteDOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Rev humano. IA genérica. O nosotros.

Los investigadores generalmente eligen entre pagar a un transcriptor humano (lento, preciso, costoso) o pasar el archivo por una herramienta IA genérica que no fue construida para salas de 8 voces. Nosotros estamos en el medio — velocidad de IA, diarización ajustada para grabaciones de investigación, y un DOCX que se carga en NVivo sin necesidad de cirugía.

Option 01

Rev verbatim humano

Un humano lo escribe. Precisión alta, pero retorno de 24 horas y el precio escala linealmente con las horas.

Precisión~99% (humano)
Retorno12–24 horas típico
Solapamiento de vocesMarcado [crosstalk]
Exportación QDADOCX, limpieza manual
Costo · por minuto$1.50 verbatim
Grupo de 90 min~$135
Best forTrabajo de tesis o investigación regulada donde cada disfluencia debe ser verificada por humano.
Option 02

Transcription.Solutions

Diarización ajustada para 6-10 voces, solapamiento de voces etiquetado en línea, exportación DOCX dimensionada para NVivo, ATLAS.ti, y Dedoose.

Precisión88–94% en audio de grupo
Retorno~1× tiempo real
Solapamiento de vocesEtiquetado, no descartado
Exportación QDADOCX con turnos de orador
Costo · por minuto$0.03
Grupo de 90 min~$2.70
Best forInvestigadores que ejecutan múltiples grupos que necesitan una transcripción de primer paso en NVivo mañana por la mañana, no la próxima semana.
Option 03

Otter / Sonix

IA genérica construida para reuniones. Decente en 2-3 oradores, colapsa después de 5 — y las exportaciones no anticipan software de QDA.

PrecisiónCae después de 5 oradores
RetornoRápido
Solapamiento de vocesFrecuentemente descartado
Exportación QDASin formato NVivo nativo
Límite de oradorLímite flexible ~6
Costo$17–22/usuario/mes
Best forEntrevistas pequeñas y 1-a-1 donde la grabación tiene 2-3 voces y vive en un flujo de calendario.

Precios precisos a partir de mayo 2026. Los rangos de precisión provienen de nuestra muestra interna de archivos de grupos fokales de clientes, no de benchmarks sintéticos.

Específico para grupos fokales

Tres cosas que muerden a los investigadores en herramientas IA genérica.

Ajustá la configuración correcta de entrada y la transcripción se carga en NVivo sin un fin de semana de limpieza.

Qué sale mal

  1. 1El solapamiento de voces se descarta. La mayoría de herramientas de consumo eligen un orador durante solapamiento y descartan el resto. Perdés exactamente los momentos donde ocurre consenso o objeción.
  2. 2Los oradores colapsan a 3. Las herramientas asumen salas del tamaño de una reunión y limitan bajo los clusters de diarización. Tus ocho participantes vuelven como 'Orador 1' / 'Orador 2' / 'Orador 3'.
  3. 3La exportación es una pared de texto. Sin saltos de párrafo por turno de orador, sin estructura DOCX que NVivo pueda auto-codificar en la importación.

Qué activar aquí

  1. 1Activá Etiquetar solapamiento de voces en el formulario de trabajo. El solapamiento de voces obtiene marcadores inline `[overlap]` y ambos oradores retienen sus enunciados.
  2. 2Establecé Oradores esperados: 8-12 explícitamente. Dimensionamos el tamaño del cluster de diarización para coincidir en lugar de adivinar bajo.
  3. 3Elegí exportación DOCX (QDA-ready). Los turnos de orador se vuelven párrafos prefijados con la etiqueta — NVivo, ATLAS.ti, y Dedoose todos auto-detectan este formato en la importación.

Configuración de trabajo recomendada para grupos fokales

Dejá un archivo de grupo fokal con la plantilla 'research' y estos se activan por defecto. Anulá por trabajo desde el formulario.

Diarización
Acústica · 6-10 oradores esperados
Modo verbatim
Completo — disfluencias conservadas
Manejo de solapamiento
Etiquetar inline [overlap]
Vocabulario personalizado
Nombres de producto / marca del screener
Etiquetas de orador
Editable después del trabajo, propagar-todo
Exportación
DOCX (QDA-ready) · TXT con marca de tiempo

Accuracy · real-world numbers

94% con lavalier-por-participante. Se mantiene en 82% con un micrófono de sala único.

La precisión del grupo fokal está limitada por topología de micrófono, no el modelo. Un lavalier en cada participante nos da canales limpios por orador — la diarización se vuelve trivial. Un micrófono de límite en una mesa de conferencia con 8 voces es el caso difícil. Los números debajo provienen de grabaciones de investigación reales en nuestro pipeline.

94%
Lavalier por participante

Cada participante en su propia pista, mezclado a WAV multicanal. Diarización omitida — error solo de texto. Mejor caso para trabajo de calidad de tesis.

91%
Micrófono de conferencia, 4-6 participantes

Micrófono de límite centrado en la mesa, tratamiento de sala moderado. Voces distinguibles, confusión ocasional entre participantes del mismo género con edad similar.

86%
Micrófono de sala único, 7-10 participantes

Solapamiento de voces frecuente, voces similares se fusionan bajo diarización acústica. Esperá un pase de 10 minutos de renombrado y fusión en los chips de orador antes del análisis.

82%
Grupo remoto en Zoom mono

Mezcla mono comprimida, sin división por canal disponible. Las palabras aún son usables para codificación temática, pero los reclamos verbatim de nivel de disfluencia se debilitan aquí.

Preguntas comunes

8 cosas que la gente pregunta sobre **transcripción de grupos fokales**.

01¿Puedo renombrar Orador 1 al nombre real del participante o ID?+
Sí. Hacé clic en cualquier chip de orador en el editor, escribí el nombre o ID del screener (p. ej. 'P04_F_34'), y se propaga a cada turno de ese orador en la transcripción. La exportación DOCX usa las etiquetas renombradas.
02¿Cómo maneja el solapamiento de voces y el habla superpuesta?+
Lo etiquetamos inline con marcadores `[overlap]` y conservamos los enunciados de ambos oradores en la transcripción. Las herramientas genéricas generalmente eligen una voz y descartan la otra — nosotros no, porque los momentos de solapamiento son frecuentemente donde vive la dinámica real del grupo fokal.
03¿El DOCX realmente se importa limpio en NVivo y ATLAS.ti?+
Sí. Exportamos con etiquetas de orador como encabezados de estilo de párrafo, que NVivo auto-codifica durante la importación y ATLAS.ti reconoce como turnos de orador. Dedoose acepta el mismo DOCX a través de su ruta de importación de transcripción.
04¿Cuántos oradores puedes diarizar en un archivo?+
Límite flexible alrededor de 12. Más allá de eso, el clustering acústico comienza a fusionar voces similares — lo que generalmente significa un pase de 10-15 minutos de renombrado de tu parte. Establecé 'Oradores esperados' explícitamente en el formulario de trabajo para mejores resultados.
05¿Verbatim o limpio — puedo elegir?+
Ambos. El modo verbatim conserva cada 'um', falso comienzo, y palabra repetida para análisis de discurso. Limpio elimina disfluencias para legibilidad. Vos elegís por trabajo; el defecto para la plantilla de research es verbatim.
06¿Qué hay sobre requisitos IRB y confidencialidad de participantes?+
Los archivos se procesan en nuestra infraestructura, no se envían a APIs de terceros. Ofrecemos una bandera de auto-eliminar-después-de-N-días por trabajo para protocolos IRB. Somos SOC 2 Type II y compatibles con GDPR; el DPA está en la página legal si tu IRB lo necesita.
07¿Debería grabar video o solo audio?+
Solo audio está bien — no usamos video para diarización. Si tenés video para identificación de participantes, mantenlo localmente para tu propio código; subir solo la pista de audio es más rápido y más barato.
08¿Cómo se compara el costo con Rev verbatim humano?+
Un grupo fokal de 90 minutos cuesta alrededor de $2.70 aquí versus aproximadamente $135 en Rev verbatim. El trade-off es precisión: nosotros llegamos a 86-94% dependiendo de la configuración del micrófono, los transcriptores humanos de Rev alcanzan ~99%. La mayoría de investigadores nos usan para el primer pase y solo escalan grupos específicos a humano si es necesario.

Dejá una grabación de grupo fokal. Veé la transcripción en NVivo mañana.

30 minutos gratis cada mes. Sin tarjeta. Etiquetas de orador, etiquetado de solapamiento de voces, exportación DOCX lista para QDA incluida en cada plan.

Empezá gratis