Transcripción de grupos fokales — transcribí un grupo fokal con etiquetas de orador para cada participante

Transcripción de grupos fokales.Cada orador etiquetado, cada palabra.

Dejá una grabación de grupo fokal con 6, 8, incluso 10 voces. Obtenés una transcripción verbatim con cada participante etiquetado, solapamiento de voces marcado, y un DOCX que se carga directo en NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Ocho participantes adentro. Verbatim etiquetado afuera.

Los grupos fokales son el caso de diarización más difícil de nuestra cola — demográficos similares, voces parecidas, solapamiento de voces frecuente. Etiquetamos el solapamiento en línea en lugar de descartarlo, después vos renombrás Orador 3 → 'Participante_F2' una sola vez y se propaga.

Grabación de grupo fokalREC Moderador + 7 participantes · 1:23:14

auto-detectado en-US44 kHz micrófono de límite · WAV

~90s

Transcripción · en directo91% precisión · 8 oradores

Entonces cuando abriste el empaque por primera vez — contame qué notaste.

¿Honestamente? Lo primero fue el olor. Como un hospital, algo clínico —

Sí, lo mismo. Pensé que era supposed to be el de lavanda.

Exacto, y la etiqueta dice lavanda pero realmente no —

91% en sala de 8 oradores con micrófono de límiteDOCX (QDA-ready) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev humano. IA genérica. O nosotros.

Los investigadores generalmente eligen entre pagar a un transcriptor humano (lento, preciso, costoso) o pasar el archivo por una herramienta IA genérica que no fue construida para salas de 8 voces. Nosotros estamos en el medio — velocidad de IA, diarización ajustada para grabaciones de investigación, y un DOCX que se carga en NVivo sin necesidad de cirugía.

Option 01

Rev verbatim humano

Un humano lo escribe. Precisión alta, pero retorno de 24 horas y el precio escala linealmente con las horas.

Precisión~99% (humano)

Retorno12–24 horas típico

Solapamiento de vocesMarcado [crosstalk]

Exportación QDADOCX, limpieza manual

Costo · por minuto$1.50 verbatim

Grupo de 90 min~$135

Best forTrabajo de tesis o investigación regulada donde cada disfluencia debe ser verificada por humano.

Option 02

Transcription.Solutions

Diarización ajustada para 6-10 voces, solapamiento de voces etiquetado en línea, exportación DOCX dimensionada para NVivo, ATLAS.ti, y Dedoose.

Precisión88–94% en audio de grupo

Retorno~1× tiempo real

Solapamiento de vocesEtiquetado, no descartado

Exportación QDADOCX con turnos de orador

Costo · por minuto$0.03

Grupo de 90 min~$2.70

Best forInvestigadores que ejecutan múltiples grupos que necesitan una transcripción de primer paso en NVivo mañana por la mañana, no la próxima semana.

Option 03

Otter / Sonix

IA genérica construida para reuniones. Decente en 2-3 oradores, colapsa después de 5 — y las exportaciones no anticipan software de QDA.

PrecisiónCae después de 5 oradores

RetornoRápido

Solapamiento de vocesFrecuentemente descartado

Exportación QDASin formato NVivo nativo

Límite de oradorLímite flexible ~6

Costo$17–22/usuario/mes

Best forEntrevistas pequeñas y 1-a-1 donde la grabación tiene 2-3 voces y vive en un flujo de calendario.

Precios precisos a partir de mayo 2026. Los rangos de precisión provienen de nuestra muestra interna de archivos de grupos fokales de clientes, no de benchmarks sintéticos.

94% con lavalier-por-participante. Se mantiene en 82% con un micrófono de sala único.

La precisión del grupo fokal está limitada por topología de micrófono, no el modelo. Un lavalier en cada participante nos da canales limpios por orador — la diarización se vuelve trivial. Un micrófono de límite en una mesa de conferencia con 8 voces es el caso difícil. Los números debajo provienen de grabaciones de investigación reales en nuestro pipeline.

8 cosas que la gente pregunta sobre **transcripción de grupos fokales**.

01¿Puedo renombrar Orador 1 al nombre real del participante o ID?+

Sí. Hacé clic en cualquier chip de orador en el editor, escribí el nombre o ID del screener (p. ej. 'P04_F_34'), y se propaga a cada turno de ese orador en la transcripción. La exportación DOCX usa las etiquetas renombradas.

02¿Cómo maneja el solapamiento de voces y el habla superpuesta?+

Lo etiquetamos inline con marcadores `[overlap]` y conservamos los enunciados de ambos oradores en la transcripción. Las herramientas genéricas generalmente eligen una voz y descartan la otra — nosotros no, porque los momentos de solapamiento son frecuentemente donde vive la dinámica real del grupo fokal.

03¿El DOCX realmente se importa limpio en NVivo y ATLAS.ti?+

Sí. Exportamos con etiquetas de orador como encabezados de estilo de párrafo, que NVivo auto-codifica durante la importación y ATLAS.ti reconoce como turnos de orador. Dedoose acepta el mismo DOCX a través de su ruta de importación de transcripción.

04¿Cuántos oradores puedes diarizar en un archivo?+

Límite flexible alrededor de 12. Más allá de eso, el clustering acústico comienza a fusionar voces similares — lo que generalmente significa un pase de 10-15 minutos de renombrado de tu parte. Establecé 'Oradores esperados' explícitamente en el formulario de trabajo para mejores resultados.

05¿Verbatim o limpio — puedo elegir?+

Ambos. El modo verbatim conserva cada 'um', falso comienzo, y palabra repetida para análisis de discurso. Limpio elimina disfluencias para legibilidad. Vos elegís por trabajo; el defecto para la plantilla de research es verbatim.

06¿Qué hay sobre requisitos IRB y confidencialidad de participantes?+

Los archivos se procesan en nuestra infraestructura, no se envían a APIs de terceros. Ofrecemos una bandera de auto-eliminar-después-de-N-días por trabajo para protocolos IRB. Somos SOC 2 Type II y compatibles con GDPR; el DPA está en la página legal si tu IRB lo necesita.

07¿Debería grabar video o solo audio?+

Solo audio está bien — no usamos video para diarización. Si tenés video para identificación de participantes, mantenlo localmente para tu propio código; subir solo la pista de audio es más rápido y más barato.

08¿Cómo se compara el costo con Rev verbatim humano?+

Un grupo fokal de 90 minutos cuesta alrededor de $2.70 aquí versus aproximadamente $135 en Rev verbatim. El trade-off es precisión: nosotros llegamos a 86-94% dependiendo de la configuración del micrófono, los transcriptores humanos de Rev alcanzan ~99%. La mayoría de investigadores nos usan para el primer pase y solo escalan grupos específicos a humano si es necesario.

Transcripción de grupos fokales.Cada orador etiquetado, cada palabra.

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

Ocho participantes adentro. Verbatim etiquetado afuera.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Rev humano. IA genérica. O nosotros.

Rev verbatim humano

Transcription.Solutions

Otter / Sonix

Tres cosas que muerden a los investigadores en herramientas IA genérica.

Qué sale mal

Qué activar aquí

Configuración de trabajo recomendada para grupos fokales

94% con lavalier-por-participante. Se mantiene en 82% con un micrófono de sala único.

8 cosas que la gente pregunta sobre transcripción de grupos fokales.

Dejá una grabación de grupo fokal. Veé la transcripción en NVivo mañana.