Transcrición de grupos de discusión — transcreve grupos de discusión con etiquetas de participante para cada membro

Transcrición de grupos de discusión.Cada orador identificado, cada palabra.

Sube unha gravación de grupo de discusión con 6, 8, incluso 10 voces. Obtén unha transcrición íntegra con cada participante identificado, fala simultánea etiquetada e un DOCX que se carga directamente en NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Oito participantes dentro. Texto etiquetado fóra.

Os grupos de discusión son o caso máis difícil de diarización na nosa cola — demografía similar, voces parecidas, solapamento de falas frecuente. Etiquetamos o solapamento en liña fronte a eliminalo, entón ti renomeas Orador 3 → 'Participante_F2' unha vez e propágase.

Gravación de grupo de discusiónREC Moderador + 7 participantes · 1:23:14

en-US auto-detectado44 kHz micrófono de límite · WAV

~90s

Transcrición · en directo91% de precisión · 8 oradores

Entón cando abriche o embalaxe primeiro — conta-me o que notaches.

Honestamente? O primeiro foi o cheiro. Coma un hospital, certa forma clínico —

Si, igual. Pensei que debería ser o da lavanda.

Vale, e a etiqueta di lavanda pero realmente non —

91% en sala de 8 oradores con micrófono de límiteDOCX (listo para QDA) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev humano. IA xenérica. Ou nós.

Os investigadores adoitan escoller entre pagar a un transcriptor humano (lento, preciso, caro) ou executar o arquivo a través dunha ferramenta IA xenérica que non foi construída para salas de 8 voces. Nós estamos no medio — velocidade de IA, diarización axustada para gravacións de investigación e un DOCX que se carga en NVivo sen cirurxía.

Option 01

Rev verbatim humano

Un humano o escribe. Precisión alta, pero 24 horas de tempo de procesamento e o prezo escala linealmente coas horas.

Precisión~99% (humano)

Tempo de procesamento12–24 horas típico

Fala simultáneaMarcada [crosstalk]

Exportación QDADOCX, limpeza manual

Custo · por min$1.50 verbatim

Grupo de 90 min~$135

Best forTraballo de tese ou investigación regulada onde todos os erros de dicción deben ser verificados por humano.

Option 02

Transcription.Solutions

Diarización axustada para 6-10 voces, fala simultánea etiquetada en liña, exportación DOCX dimensionada para NVivo, ATLAS.ti e Dedoose.

Precisión88–94% en audio de grupo

Tempo de procesamento~1× en tempo real

Xestión de fala simultáneaEtiquetada, non eliminada

Exportación QDADOCX con intervencións do orador

Custo · por min$0.03

Grupo de 90 min~$2.70

Best forInvestigadores que executan múltiples grupos que necesitan unha transcrición de primeiro paso en NVivo mañá á mañá, non a próxima semana.

Option 03

Otter / Sonix

IA xenérica construída para reunións. Decente en 2-3 oradores, colápsa paso a 5 — e as exportacións non anticipan software QDA.

PrecisiónCae paso a 5 oradores

Tempo de procesamentoRápido

Fala simultáneaAdoita ser eliminada

Exportación QDASen formato NVivo nativo

Límite de oradoresLímite suave ~6

Custo$17–22/usuario/mes

Best forPequenas entrevistas e 1 a 1 onde a gravación ten 2-3 voces e vive nun fluxo de calendario.

Prezos exactos a partir de maio de 2026. Os rangos de precisión proceden da nosa mostra interna de ficheiros de grupo de discusión de clientes, non de referencias sintéticas.

94% en lavalier por participante. Holds at 82% nun micrófono de sala única.

A precisión do grupo de discusión está engarolada pola topoloxía do micrófono, non polo modelo. Un lavalier en cada participante dános canles limpas por orador — a diarización convértese en trivial. Un micrófono límite nunha táboa de conferencia con 8 voces é o caso difícil. Os números inferiores proceden de gravacións de investigación reais na nosa tubería.

8 cousas que a xente pregunta sobre transcrición de grupos de discusión.

01¿Podo renomear Orador 1 ao nome real dun participante ou ID?+

Si. Fai clic en calquera chip de orador no editor, escribe o nome ou ID de pantalla (ex. 'P04_F_34'), e propágase a cada volta dese orador na transcrición. A exportación DOCX usa as etiquetas renomeadas.

02¿Como xestionas a fala simultánea e a fala solapada?+

Etiquetámola en liña con marcadores `[overlap]` e mantemos as expresiones de ambos os oradores na transcrición. As ferramentas xenéricas adoitan escoller unha voz e descartan a outra — nós non, porque os momentos de solapamento son adoitadamente onde vive a dinámica real do grupo de discusión.

03¿O DOCX realmente se importa limpiamente en NVivo e ATLAS.ti?+

Si. Exportamos con etiquetas de orador como encabezamentos de estilo de parágrafo, que NVivo auto-codifica durante a importación e ATLAS.ti recoñece como intervencións do orador. Dedoose acepta o mesmo DOCX vía a súa ruta de importación de transcrición.

04¿Cantos oradores podes diarizar nun ficheiro?+

Límite suave arredor de 12. Paso a iso, o clustering acústico comeza a fusionar voces similares — o que adoitadamente significa un pase de 10-15 minutos de renomeado da túa banda. Estabelece 'Oradores esperados' explicitamente no formulario de traballo para mellores resultados.

05Verbatim ou limpo — podo escoller?+

Ambos. Modo verbatim mantén cada 'um', falso comezo e palabra repetida para análise de discurso. Limpo elimina erros de dicción para lexibilidade. Ti escolles por traballo; o predeterminado para a plantilla de investigación é verbatim.

06¿E os requisitos IRB e confidencialidade dos participantes?+

Os ficheiros procésanse na nosa infraestrutura, non se envían a APIs de terceiros. Ofrecemos un indicador de auto-eliminar-despois-de-N-días por traballo para protocolos IRB. Somos SOC 2 Tipo II e compatibles con GDPR; o DPA está na páxina legal se o teu IRB o necesita.

07¿Debo gravar vídeo ou só audio?+

Só audio está ben — non usamos vídeo para diarización. Se tes vídeo para identificación de participantes, mantéño localmente para a túa propia codificación; subir só a pista de audio é máis rápido e barato.

08¿Como se compara o custo a Rev verbatim humano?+

Un grupo de discusión de 90 minutos custa uns $2.70 aquí fronte a aproximadamente $135 en Rev verbatim. A compensación é precisión: chegamos a 86-94% dependendo da configuración do micrófono, os transcritores humanos de Rev chegan a ~99%. A maioría dos investigadores usannos para o primeiro pase e só escalan grupos específicos a humanos se é necesario.