Transcrición de grupos de discusión.Cada orador identificado, cada palabra.

Sube unha gravación de grupo de discusión con 6, 8, incluso 10 voces. Obtén unha transcrición íntegra con cada participante identificado, fala simultánea etiquetada e un DOCX que se carga directamente en NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira o que sae

Oito participantes dentro. Texto etiquetado fóra.

Os grupos de discusión son o caso máis difícil de diarización na nosa cola — demografía similar, voces parecidas, solapamento de falas frecuente. Etiquetamos o solapamento en liña fronte a eliminalo, entón ti renomeas Orador 3 → 'Participante_F2' unha vez e propágase.

Gravación de grupo de discusiónREC Moderador + 7 participantes · 1:23:14
en-US auto-detectado44 kHz micrófono de límite · WAV
~90s
Transcrición · en directo91% de precisión · 8 oradores
S1

Entón cando abriche o embalaxe primeiro — conta-me o que notaches.

S2

Honestamente? O primeiro foi o cheiro. Coma un hospital, certa forma clínico —

S3

Si, igual. Pensei que debería ser o da lavanda.

S2

Vale, e a etiqueta di lavanda pero realmente non —

91% en sala de 8 oradores con micrófono de límiteDOCX (listo para QDA) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcións reais · comparación honesta

Rev humano. IA xenérica. Ou nós.

Os investigadores adoitan escoller entre pagar a un transcriptor humano (lento, preciso, caro) ou executar o arquivo a través dunha ferramenta IA xenérica que non foi construída para salas de 8 voces. Nós estamos no medio — velocidade de IA, diarización axustada para gravacións de investigación e un DOCX que se carga en NVivo sen cirurxía.

Option 01

Rev verbatim humano

Un humano o escribe. Precisión alta, pero 24 horas de tempo de procesamento e o prezo escala linealmente coas horas.

Precisión~99% (humano)
Tempo de procesamento12–24 horas típico
Fala simultáneaMarcada [crosstalk]
Exportación QDADOCX, limpeza manual
Custo · por min$1.50 verbatim
Grupo de 90 min~$135
Best forTraballo de tese ou investigación regulada onde todos os erros de dicción deben ser verificados por humano.
Option 02

Transcription.Solutions

Diarización axustada para 6-10 voces, fala simultánea etiquetada en liña, exportación DOCX dimensionada para NVivo, ATLAS.ti e Dedoose.

Precisión88–94% en audio de grupo
Tempo de procesamento~1× en tempo real
Xestión de fala simultáneaEtiquetada, non eliminada
Exportación QDADOCX con intervencións do orador
Custo · por min$0.03
Grupo de 90 min~$2.70
Best forInvestigadores que executan múltiples grupos que necesitan unha transcrición de primeiro paso en NVivo mañá á mañá, non a próxima semana.
Option 03

Otter / Sonix

IA xenérica construída para reunións. Decente en 2-3 oradores, colápsa paso a 5 — e as exportacións non anticipan software QDA.

PrecisiónCae paso a 5 oradores
Tempo de procesamentoRápido
Fala simultáneaAdoita ser eliminada
Exportación QDASen formato NVivo nativo
Límite de oradoresLímite suave ~6
Custo$17–22/usuario/mes
Best forPequenas entrevistas e 1 a 1 onde a gravación ten 2-3 voces e vive nun fluxo de calendario.

Prezos exactos a partir de maio de 2026. Os rangos de precisión proceden da nosa mostra interna de ficheiros de grupo de discusión de clientes, non de referencias sintéticas.

Específico para grupos de discusión

Tres cousas que comen aos investigadores coas ferramentas IA xenéricas.

Pincha a configuración correcta ao principio e a transcrición cárgase en NVivo sen un fin de semana de limpeza.

O que sae mal

  1. 1A fala simultánea elimínase. A maioría das ferramentas de consumo eligen un orador durante o solapamento e descartan o resto. Perdes exactamente os momentos onde acontecen o consenso ou a obxección.
  2. 2Os oradores colapsan a 3. As ferramentas asumen salas de tamaño de reunión e límitan os clusters de diarización baixos. Os teus oito participantes volven coma 'Orador 1' / 'Orador 2' / 'Orador 3'.
  3. 3A exportación é un parede de texto. Sen saltos de parágrafo por intervención do orador, sen estrutura DOCX que NVivo poida auto-codificar á importación.

O que pinchar aquí

  1. 1Activa Etiquetar fala simultánea no formulario de traballo. A fala simultánea obtén marcadores `[overlap]` en liña e ambos os oradores retienen as súas expresiones.
  2. 2Estabelece Oradores esperados: 8-12 explicitamente. Dimensionamos o número de clusters de diarización para concordar fronte a adiviñar baixo.
  3. 3Escolle DOCX (listo para QDA) exportación. As intervencións do orador convértense en parágrafos prefixados co rótulo — NVivo, ATLAS.ti e Dedoose todos auto-detectan este formato á importación.

Configuración recomendada de traballo para grupos de discusión

Sube un ficheiro de grupo de discusión coa plantilla 'research' e estas pincha por defecto. Anula por traballo desde o formulario.

Diarización
Acústica · esperado 6-10 oradores
Modo verbatim
Completo — erros de dicción mantidos
Xestión de solapamento
Etiquetar en liña [overlap]
Vocabulario personalizado
Nomes de produto / marca da pantalla
Etiquetas de orador
Editable post-traballo, propagar-todo
Exportación
DOCX (listo para QDA) · TXT con selos de tempo

Accuracy · real-world numbers

94% en lavalier por participante. Holds at 82% nun micrófono de sala única.

A precisión do grupo de discusión está engarolada pola topoloxía do micrófono, non polo modelo. Un lavalier en cada participante dános canles limpas por orador — a diarización convértese en trivial. Un micrófono límite nunha táboa de conferencia con 8 voces é o caso difícil. Os números inferiores proceden de gravacións de investigación reais na nosa tubería.

94%
Lavalier por participante

Cada participante na súa propia pista, mesturada a WAV multicanle. Diarización omitida — só erro de texto. Mellor caso para traballo de tese a nivel de disertación.

91%
Micrófono de conferencia, 4-6 participantes

Micrófono límite centrado na táboa, tratamento moderado de sala. Voces distinguíbeis, ocasional confusión entre participantes do mesmo xénero de idade similar.

86%
Micrófono de sala única, 7-10 participantes

Fala simultánea frecuente, voces similares fúndense baixo diarización acústica. Espera un pase de 10 minutos para renomear e fusionar os chips de orador antes da análise.

82%
Grupo remoto en mono Zoom

Mestura mono comprimida, sen división por canal dispoñible. As palabras aínda son útiles para codificación temática, pero as afirmacións verbatim a nivel de erros de dicción debilítanse aquí.

Preguntas comúns

8 cousas que a xente pregunta sobre transcrición de grupos de discusión.

01¿Podo renomear Orador 1 ao nome real dun participante ou ID?+
Si. Fai clic en calquera chip de orador no editor, escribe o nome ou ID de pantalla (ex. 'P04_F_34'), e propágase a cada volta dese orador na transcrición. A exportación DOCX usa as etiquetas renomeadas.
02¿Como xestionas a fala simultánea e a fala solapada?+
Etiquetámola en liña con marcadores `[overlap]` e mantemos as expresiones de ambos os oradores na transcrición. As ferramentas xenéricas adoitan escoller unha voz e descartan a outra — nós non, porque os momentos de solapamento son adoitadamente onde vive a dinámica real do grupo de discusión.
03¿O DOCX realmente se importa limpiamente en NVivo e ATLAS.ti?+
Si. Exportamos con etiquetas de orador como encabezamentos de estilo de parágrafo, que NVivo auto-codifica durante a importación e ATLAS.ti recoñece como intervencións do orador. Dedoose acepta o mesmo DOCX vía a súa ruta de importación de transcrición.
04¿Cantos oradores podes diarizar nun ficheiro?+
Límite suave arredor de 12. Paso a iso, o clustering acústico comeza a fusionar voces similares — o que adoitadamente significa un pase de 10-15 minutos de renomeado da túa banda. Estabelece 'Oradores esperados' explicitamente no formulario de traballo para mellores resultados.
05Verbatim ou limpo — podo escoller?+
Ambos. Modo verbatim mantén cada 'um', falso comezo e palabra repetida para análise de discurso. Limpo elimina erros de dicción para lexibilidade. Ti escolles por traballo; o predeterminado para a plantilla de investigación é verbatim.
06¿E os requisitos IRB e confidencialidade dos participantes?+
Os ficheiros procésanse na nosa infraestrutura, non se envían a APIs de terceiros. Ofrecemos un indicador de auto-eliminar-despois-de-N-días por traballo para protocolos IRB. Somos SOC 2 Tipo II e compatibles con GDPR; o DPA está na páxina legal se o teu IRB o necesita.
07¿Debo gravar vídeo ou só audio?+
Só audio está ben — non usamos vídeo para diarización. Se tes vídeo para identificación de participantes, mantéño localmente para a túa propia codificación; subir só a pista de audio é máis rápido e barato.
08¿Como se compara o custo a Rev verbatim humano?+
Un grupo de discusión de 90 minutos custa uns $2.70 aquí fronte a aproximadamente $135 en Rev verbatim. A compensación é precisión: chegamos a 86-94% dependendo da configuración do micrófono, os transcritores humanos de Rev chegan a ~99%. A maioría dos investigadores usannos para o primeiro pase e só escalan grupos específicos a humanos se é necesario.

Sube unha gravación de grupo de discusión. Mira a transcrición en NVivo mañá.

30 minutos gratuítos cada mes. Sen tarxeta. Etiquetas de orador, etiquetado de fala simultánea, exportación DOCX lista para QDA incluída en todos os plans.

Comeza gratis