Transcrição de grupo focal — transcrever um grupo focal com identificação de participantes para cada um

Transcrição de grupo focal.Cada participante identificado, cada palavra.

Envie uma gravação de grupo focal com 6, 8, até 10 vozes. Recebi uma transcrição verbatim com cada participante identificado, fala simultânea marcada, e um DOCX que abre direto no NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Oito participantes entram. Saída verbatim rotulada.

Grupos focais são o caso mais difícil de diarização na nossa fila — demografia similar, vozes parecidas, sobreposição frequente. Marcamos a sobreposição em linha em vez de descartá-la, depois você renomeia Participante 3 → 'Participante_F2' uma vez e a mudança se propaga.

Gravação de grupo focalREC Moderador + 7 participantes · 1:23:14

auto-detectado en-US44 kHz microfone de limite de presença · WAV

~90s

Transcrição · em tempo real91% de precisão · 8 participantes

Então quando você abriu a embalagem — me descreva o que percebeu.

Honestamente? A primeira coisa foi o cheiro. Como um hospital, bem clínico —

É, verdade. Eu achei que era o da lavanda.

Certo, e o rótulo diz lavanda, mas realmente não —

91% em sala com 8 participantesDOCX (pronto para QDA) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev humano. AI genérico. Ou a gente.

Pesquisadores normalmente escolhem entre pagar um transcriptor humano (lento, preciso, caro) ou rodar o arquivo em uma ferramenta AI genérica que não foi feita para salas com 8 vozes. A gente fica no meio — velocidade AI, diarização ajustada para gravações de pesquisa, e um DOCX que cai no NVivo sem gambiarras.

Option 01

Rev verbatim humano

Um humano digita. Precisão alta, mas 24 horas de espera e o preço escala linearmente com as horas.

Precisão~99% (humano)

Prazo12–24 horas típico

Fala simultâneaMarcada [crosstalk]

Exportação QDADOCX, limpeza manual

Custo · por minuto$1.50 verbatim

Grupo de 90 min~$135

Best forDissertações ou pesquisa regulada onde cada disfluência precisa de verificação humana.

Option 02

Transcription.Solutions

Diarização ajustada para 6-10 vozes, sobreposição marcada em linha, exportação DOCX dimensionada para NVivo, ATLAS.ti e Dedoose.

Precisão88–94% em áudio de grupo

Prazo~1× tempo real

Fala simultâneaMarcada, não descartada

Exportação QDADOCX com turnos de participante

Custo · por minuto$0.03

Grupo de 90 min~$2.70

Best forPesquisadores rodando múltiplos grupos que precisam de uma transcrição de primeira passagem no NVivo amanhã de manhã, não semana que vem.

Option 03

Otter / Sonix

AI genérica feita para reuniões. Decente em 2-3 participantes, cai aos pedaços acima de 5 — e as exportações não preveem software QDA.

PrecisãoCai acima de 5 participantes

PrazoRápido

Fala simultâneaFrequentemente descartada

Exportação QDASem formato nativo NVivo

Limite de participantesLimite suave ~6

Custo$17–22/usuário/mês

Best forEntrevistas pequenas e 1-para-1 onde a gravação tem 2-3 vozes e vive em um fluxo de calendário.

Preços precisos em maio de 2026. Os intervalos de precisão vêm de nossa amostra interna de arquivos de grupos focais de clientes, não de benchmarks sintéticos.

94% com lavalier por participante. Mantém 82% com microfone único.

A precisão de grupo focal é limitada pela topologia do microfone, não pelo modelo. Um lavalier em cada participante nos dá canais limpos por participante — diarização fica trivial. Um microfone de limite em uma mesa de conferência com 8 vozes é o caso difícil. Os números abaixo vêm de gravações de pesquisa reais no nosso pipeline.

8 perguntas frequentes sobre transcrição de grupo focal.

01Posso renomear Participante 1 com o nome ou ID real do participante?+

Sim. Clique em qualquer chip de participante no editor, digite o nome ou ID do screener (ex: 'P04_F_34'), e se propaga para cada turno desse participante em toda a transcrição. A exportação DOCX usa os rótulos renomeados.

02Como você trata fala simultânea e sobreposição?+

Marcamos em linha com marcadores `[overlap]` e mantemos os enunciados de ambos os participantes na transcrição. Ferramentas genéricas normalmente escolhem uma voz e descartam a outra — a gente não faz isso, porque os momentos de sobreposição são frequentemente onde a dinâmica real do grupo focal vive.

03O DOCX realmente importa limpo no NVivo e ATLAS.ti?+

Sim. Exportamos com rótulos de participante como estilos de parágrafo de cabeçalho, que o NVivo auto-codifica durante importação e ATLAS.ti reconhece como turnos de participante. Dedoose aceita o mesmo DOCX via seu caminho de importação de transcrição.

04Quantos participantes você consegue diarizar em um arquivo?+

Limite suave ao redor de 12. Passando disso, clustering acústico começa a mesclar vozes similares — o que normalmente significa uma passagem de 10-15 minutos de renomeação de sua parte. Configure 'Participantes esperados' explicitamente no formulário de job para melhores resultados.

05Verbatim ou limpeza — posso escolher?+

Ambas. Modo verbatim mantém cada 'hã', falso começo e palavra repetida para análise de discurso. Limpo remove disfluências para legibilidade. Você escolhe por job; o padrão para o template research é verbatim.

06E os requisitos de IRB e confidencialidade de participantes?+

Arquivos são processados na nossa infraestrutura, não enviados para APIs de terceiros. Oferecemos um sinalizador de auto-exclusão-após-N-dias por job para protocolos IRB. Somos SOC 2 Type II e compatíveis com GDPR; o DPA está na página legal se seu IRB precisar.

07Devo gravar vídeo ou apenas áudio?+

Apenas áudio fica ótimo — não usamos vídeo para diarização. Se você tem vídeo para identificação de participante, mantenha localmente para sua própria codificação; enviar apenas a faixa de áudio é mais rápido e barato.

08Como o custo se compara a Rev verbatim humano?+

Um grupo focal de 90 minutos custa cerca de $2.70 aqui versus aproximadamente $135 no Rev verbatim. O trade-off é precisão: a gente fica 86-94% dependendo de setup de mic, transcritores humanos da Rev batem ~99%. A maioria dos pesquisadores usa a gente para a primeira passagem e só escalona grupos específicos para humano se precisar.