Transcrição de grupo focal.Cada participante identificado, cada palavra.

Envie uma gravação de grupo focal com 6, 8, até 10 vozes. Recebi uma transcrição verbatim com cada participante identificado, fala simultânea marcada, e um DOCX que abre direto no NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Veja o resultado

Oito participantes entram. Saída verbatim rotulada.

Grupos focais são o caso mais difícil de diarização na nossa fila — demografia similar, vozes parecidas, sobreposição frequente. Marcamos a sobreposição em linha em vez de descartá-la, depois você renomeia Participante 3 → 'Participante_F2' uma vez e a mudança se propaga.

Gravação de grupo focalREC Moderador + 7 participantes · 1:23:14
auto-detectado en-US44 kHz microfone de limite de presença · WAV
~90s
Transcrição · em tempo real91% de precisão · 8 participantes
S1

Então quando você abriu a embalagem — me descreva o que percebeu.

S2

Honestamente? A primeira coisa foi o cheiro. Como um hospital, bem clínico —

S3

É, verdade. Eu achei que era o da lavanda.

S2

Certo, e o rótulo diz lavanda, mas realmente não —

91% em sala com 8 participantesDOCX (pronto para QDA) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Três opções reais · comparação honesta

Rev humano. AI genérico. Ou a gente.

Pesquisadores normalmente escolhem entre pagar um transcriptor humano (lento, preciso, caro) ou rodar o arquivo em uma ferramenta AI genérica que não foi feita para salas com 8 vozes. A gente fica no meio — velocidade AI, diarização ajustada para gravações de pesquisa, e um DOCX que cai no NVivo sem gambiarras.

Option 01

Rev verbatim humano

Um humano digita. Precisão alta, mas 24 horas de espera e o preço escala linearmente com as horas.

Precisão~99% (humano)
Prazo12–24 horas típico
Fala simultâneaMarcada [crosstalk]
Exportação QDADOCX, limpeza manual
Custo · por minuto$1.50 verbatim
Grupo de 90 min~$135
Best forDissertações ou pesquisa regulada onde cada disfluência precisa de verificação humana.
Option 02

Transcription.Solutions

Diarização ajustada para 6-10 vozes, sobreposição marcada em linha, exportação DOCX dimensionada para NVivo, ATLAS.ti e Dedoose.

Precisão88–94% em áudio de grupo
Prazo~1× tempo real
Fala simultâneaMarcada, não descartada
Exportação QDADOCX com turnos de participante
Custo · por minuto$0.03
Grupo de 90 min~$2.70
Best forPesquisadores rodando múltiplos grupos que precisam de uma transcrição de primeira passagem no NVivo amanhã de manhã, não semana que vem.
Option 03

Otter / Sonix

AI genérica feita para reuniões. Decente em 2-3 participantes, cai aos pedaços acima de 5 — e as exportações não preveem software QDA.

PrecisãoCai acima de 5 participantes
PrazoRápido
Fala simultâneaFrequentemente descartada
Exportação QDASem formato nativo NVivo
Limite de participantesLimite suave ~6
Custo$17–22/usuário/mês
Best forEntrevistas pequenas e 1-para-1 onde a gravação tem 2-3 vozes e vive em um fluxo de calendário.

Preços precisos em maio de 2026. Os intervalos de precisão vêm de nossa amostra interna de arquivos de grupos focais de clientes, não de benchmarks sintéticos.

Específico para grupos focais

Três problemas das ferramentas AI genéricas.

Ative as configurações certs no início e a transcrição cai no NVivo sem um fim de semana de limpeza.

O que dá errado

  1. 1Fala simultânea é descartada. A maioria das ferramentas de consumo escolhe um participante durante sobreposição e descarta o resto. Você perde exatamente os momentos onde consenso ou objeção acontece.
  2. 2Participantes colapsam para 3. Ferramentas assumem tamanho de reunião e colocam um limite baixo em clusters de diarização. Seus oito participantes voltam como 'Participante 1' / 'Participante 2' / 'Participante 3'.
  3. 3Exportação é uma parede de texto. Sem quebras de parágrafo por turno de participante, nenhuma estrutura DOCX que NVivo possa auto-codificar na importação.

O que ativar aqui

  1. 1Ative Marcar fala sobreposta no formulário de job. Fala simultânea recebe marcadores `[overlap]` em linha e ambos os participantes mantêm seus enunciados.
  2. 2Configure Participantes esperados: 8-12 explicitamente. Dimensionamos a contagem de cluster de diarização para corresponder em vez de adivinhar baixo.
  3. 3Escolha exportação DOCX (pronto para QDA). Turnos de participante viram parágrafos prefixados com o rótulo — NVivo, ATLAS.ti e Dedoose todos auto-detectam este formato na importação.

Configurações recomendadas de job para grupos focais

Envie um arquivo de grupo focal com o template 'research' e essas opções ativam por padrão. Sobrescreva por job no formulário.

Diarização
Acústica · esperado 6-10 participantes
Modo verbatim
Completo — disfluências mantidas
Tratamento de sobreposição
Marcar em linha [overlap]
Vocabulário personalizado
Nomes de produto / marca do screener
Rótulos de participante
Editável pós-job, propagar tudo
Exportação
DOCX (pronto para QDA) · TXT com timestamps

Accuracy · real-world numbers

94% com lavalier por participante. Mantém 82% com microfone único.

A precisão de grupo focal é limitada pela topologia do microfone, não pelo modelo. Um lavalier em cada participante nos dá canais limpos por participante — diarização fica trivial. Um microfone de limite em uma mesa de conferência com 8 vozes é o caso difícil. Os números abaixo vêm de gravações de pesquisa reais no nosso pipeline.

94%
Lavalier por participante

Cada participante em sua própria faixa, mixado para WAV multitrack. Diarização descartada — erro apenas de texto. Melhor caso para trabalho em nível de dissertação.

91%
Microfone de conferência, 4-6 participantes

Microfone de limite centrado na mesa, tratamento acústico moderado. Vozes distinguíveis, confusão ocasional entre participantes do mesmo gênero com idade similar.

86%
Microfone único, 7-10 participantes

Fala simultânea frequente, vozes similares se misturam sob diarização acústica. Espere uma passagem de 10 minutos de renomeação e fusão nos chips de participante antes da análise.

82%
Grupo remoto em Zoom mono

Mix mono comprimido, sem split por canal disponível. Palavras ainda são usáveis para codificação temática, mas as afirmações de verbatim ao nível de disfluência enfraquecem aqui.

Perguntas frequentes

8 perguntas frequentes sobre transcrição de grupo focal.

01Posso renomear Participante 1 com o nome ou ID real do participante?+
Sim. Clique em qualquer chip de participante no editor, digite o nome ou ID do screener (ex: 'P04_F_34'), e se propaga para cada turno desse participante em toda a transcrição. A exportação DOCX usa os rótulos renomeados.
02Como você trata fala simultânea e sobreposição?+
Marcamos em linha com marcadores `[overlap]` e mantemos os enunciados de ambos os participantes na transcrição. Ferramentas genéricas normalmente escolhem uma voz e descartam a outra — a gente não faz isso, porque os momentos de sobreposição são frequentemente onde a dinâmica real do grupo focal vive.
03O DOCX realmente importa limpo no NVivo e ATLAS.ti?+
Sim. Exportamos com rótulos de participante como estilos de parágrafo de cabeçalho, que o NVivo auto-codifica durante importação e ATLAS.ti reconhece como turnos de participante. Dedoose aceita o mesmo DOCX via seu caminho de importação de transcrição.
04Quantos participantes você consegue diarizar em um arquivo?+
Limite suave ao redor de 12. Passando disso, clustering acústico começa a mesclar vozes similares — o que normalmente significa uma passagem de 10-15 minutos de renomeação de sua parte. Configure 'Participantes esperados' explicitamente no formulário de job para melhores resultados.
05Verbatim ou limpeza — posso escolher?+
Ambas. Modo verbatim mantém cada 'hã', falso começo e palavra repetida para análise de discurso. Limpo remove disfluências para legibilidade. Você escolhe por job; o padrão para o template research é verbatim.
06E os requisitos de IRB e confidencialidade de participantes?+
Arquivos são processados na nossa infraestrutura, não enviados para APIs de terceiros. Oferecemos um sinalizador de auto-exclusão-após-N-dias por job para protocolos IRB. Somos SOC 2 Type II e compatíveis com GDPR; o DPA está na página legal se seu IRB precisar.
07Devo gravar vídeo ou apenas áudio?+
Apenas áudio fica ótimo — não usamos vídeo para diarização. Se você tem vídeo para identificação de participante, mantenha localmente para sua própria codificação; enviar apenas a faixa de áudio é mais rápido e barato.
08Como o custo se compara a Rev verbatim humano?+
Um grupo focal de 90 minutos custa cerca de $2.70 aqui versus aproximadamente $135 no Rev verbatim. O trade-off é precisão: a gente fica 86-94% dependendo de setup de mic, transcritores humanos da Rev batem ~99%. A maioria dos pesquisadores usa a gente para a primeira passagem e só escalona grupos específicos para humano se precisar.

Envie uma gravação de grupo focal. Veja a transcrição no NVivo amanhã.

30 minutos grátis todo mês. Sem cartão. Rótulos de participante, marcação de fala simultânea, exportação DOCX pronta para QDA incluídas em todo plano.

Comece grátis