Transcrição de grupos de foco.Cada palestrante identificado, cada palavra.

Solte uma gravação de grupo de foco com 6, 8, até 10 vozes. Obtenha uma transcrição literal com cada participante identificado, sobreposição de fala marcada, e um DOCX que carrega direto no NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Veja o que sai

Oito participantes dentro. Transcrição literal marcada e pronta.

Grupos de foco são o caso mais difícil de diarização em nossa fila — dados demográficos semelhantes, vozes semelhantes, sobreposição de fala frequente. Marcamos a sobreposição inline em vez de descartá-la, depois você renomeia Palestrante 3 → 'Participante_F2' uma vez e isso propaga.

Gravação de grupo de focoREC Moderador + 7 participantes · 1:23:14
auto-detectado en-USMic de limite 44 kHz · WAV
~90s
Transcrição · streamingPrecisão de 91% · 8 palestrantes
S1

Então, quando você abriu a embalagem pela primeira vez — me explique o que você notou.

S2

Honestamente? A primeira coisa foi o cheiro. Como um hospital, meio clínico —

S3

É, verdade. Eu achava que era a de lavanda.

S2

É, e o rótulo diz lavanda mas realmente não —

91% em mic de sala com 8 palestrantesDOCX (pronto para QDA) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Três opções reais · comparação honesta

Rev humano. IA genérica. Ou a gente.

Pesquisadores geralmente escolhem entre pagar um transcriptor humano (lento, preciso, caro) ou passar o arquivo por uma ferramenta de IA genérica que não foi construída para salas com 8 vozes. Ficamos no meio — velocidade de IA, diarização ajustada para gravações de pesquisa, e um DOCX que entra no NVivo sem cirurgia.

Option 01

Rev transcrição humana

Um humano digita. Alta precisão, mas prazo de 24 horas e o preço aumenta linearmente com as horas.

Precisão~99% (humano)
Prazo12–24 horas típico
Sobreposição de falaMarcada [crosstalk]
Exportação QDADOCX, limpeza manual
Custo · por min$1.50 literal
Grupo de 90 min~$135
Best forTrabalho de dissertação ou pesquisa regulada onde cada disfluência deve ser verificada por humano.
Option 02

Transcription.Solutions

Diarização ajustada para 6-10 vozes, sobreposição de fala marcada inline, exportação DOCX dimensionada para NVivo, ATLAS.ti e Dedoose.

Precisão88–94% em áudio de grupo
Prazo~1× tempo real
Sobreposição de falaMarcada, não descartada
Exportação QDADOCX com turnos de palestrante
Custo · por min$0.03
Grupo de 90 min~$2.70
Best forPesquisadores rodando múltiplos grupos que precisam de uma primeira transcrição no NVivo amanhã de manhã, não na próxima semana.
Option 03

Otter / Sonix

IA genérica construída para reuniões. Funciona bem com 2-3 palestrantes, cai aos pedaços depois de 5 — e as exportações não antecipam software QDA.

PrecisãoDeclina depois de 5 palestrantes
PrazoRápido
Sobreposição de falaFrequentemente descartada
Exportação QDASem formato nativo NVivo
Limite de palestrantesTeto suave ~6
Custo$17–22/usuário/mês
Best forPequenas entrevistas e 1-a-1s onde a gravação tem 2-3 vozes e vive em um fluxo de calendário.

Preços precisos a partir de maio de 2026. As faixas de precisão vêm de nossa amostra interna de arquivos de grupos de foco do cliente, não de benchmarks sintéticos.

Específico para grupos de foco

Três coisas que mordem pesquisadores em ferramentas de IA genéricas.

Ative as configurações certas no início e a transcrição entra no NVivo sem um fim de semana de limpeza.

O que dá errado

  1. 1Sobreposição de fala é perdida. A maioria das ferramentas de consumidor escolhe um palestrante durante a sobreposição e descarta o resto. Você perde exatamente os momentos onde consenso ou resistência acontece.
  2. 2Palestrantes reduzem a 3. Ferramentas assumem salas do tamanho de reunião e limitam clusters de diarização baixo. Seus oito participantes voltam como 'Palestrante 1' / 'Palestrante 2' / 'Palestrante 3'.
  3. 3Exportação é uma parede de texto. Sem quebras de parágrafo por turno de palestrante, sem estrutura DOCX que NVivo possa auto-codificar na importação.

O que ativar aqui

  1. 1Ative Marcar fala sobreposta no formulário de trabalho. Sobreposição de fala recebe marcadores `[sobreposição]` inline e ambos os palestrantes mantêm seus enunciados.
  2. 2Defina Palestrantes esperados: 8-12 explicitamente. Dimensionamos a contagem de clusters de diarização para corresponder em vez de adivinhar baixo.
  3. 3Escolha exportação DOCX (pronto para QDA). Turnos de palestrante se tornam parágrafos prefixados com o rótulo — NVivo, ATLAS.ti e Dedoose todos auto-detectam este formato na importação.

Configurações de trabalho recomendadas para grupos de foco

Solte um arquivo de grupo de foco com o modelo 'pesquisa' e essas ligam por padrão. Anule por trabalho no formulário.

Diarização
Acústica · esperado 6-10 palestrantes
Modo literal
Completo — disfluências mantidas
Manipulação de sobreposição
Marcar inline [sobreposição]
Vocabulário customizado
Nomes de produtos / marcas do screener
Rótulos de palestrante
Editável após o trabalho, propagar tudo
Exportação
DOCX (pronto para QDA) · TXT com timestamp

Accuracy · real-world numbers

94% em lavalier por participante. Mantém 82% em mic de sala único.

A precisão do grupo de foco é limitada por topologia de microfone, não pelo modelo. Um lavalier em cada participante nos dá canais limpos por palestrante — a diarização fica trivial. Um mic de limite em uma mesa de conferência com 8 vozes é o caso difícil. Os números abaixo vêm de gravações de pesquisa reais em nosso pipeline.

94%
Lavalier por participante

Cada participante em sua própria faixa, misturada para WAV multitrack. Diarização pulada — erro apenas de texto. Melhor caso para trabalho de nível dissertação.

91%
Mic de conferência, 4-6 participantes

Mic de limite centrado na mesa, tratamento moderado da sala. Vozes distinguíveis, confusão ocasional entre participantes do mesmo gênero e idade semelhante.

86%
Mic de sala único, 7-10 participantes

Sobreposição de fala frequente, vozes semelhantes se fundem sob diarização acústica. Espere uma passagem de 10-15 minutos de renomeação e mesclagem nos rótulos de palestrante antes da análise.

82%
Grupo remoto em Zoom mono

Mix mono comprimido, sem divisão por canal disponível. Palavras ainda usáveis para codificação temática, mas afirmações de verbatim em nível de disfluência se enfraquecem aqui.

Perguntas comuns

8 coisas que as pessoas perguntam sobre transcrição de grupos de foco.

01Posso renomear Palestrante 1 para o nome real ou ID de um participante?+
Sim. Clique em qualquer chip de palestrante no editor, digite o nome ou ID de screener (ex: 'P04_F_34'), e ele propaga para cada turno daquele palestrante na transcrição. A exportação DOCX usa os rótulos renomeados.
02Como você lida com sobreposição de fala?+
Marcamos com marcadores `[sobreposição]` inline e mantemos os enunciados de ambos os palestrantes na transcrição. Ferramentas genéricas geralmente escolhem uma voz e descartam a outra — não fazemos, porque os momentos de sobreposição são frequentemente onde a dinâmica real do grupo de foco está.
03O DOCX realmente importa limpo para NVivo e ATLAS.ti?+
Sim. Exportamos com rótulos de palestrante como títulos de estilo de parágrafo, que NVivo auto-codifica durante a importação e ATLAS.ti reconhece como turnos de palestrante. Dedoose aceita o mesmo DOCX através de seu caminho de importação de transcrição.
04Quantos palestrantes você pode diarizar em um arquivo?+
Teto suave em torno de 12. Depois disso, o clustering acústico começa a mesclar vozes semelhantes — o que geralmente significa uma passagem de renomeação de 10-15 minutos do seu lado. Defina 'Palestrantes esperados' explicitamente no formulário de trabalho para melhores resultados.
05Literal ou limpo — posso escolher?+
Ambos. Modo literal mantém cada 'um', falso início e palavra repetida para análise de discurso. Limpo remove disfluências para legibilidade. Você escolhe por trabalho; o padrão para o modelo de pesquisa é literal.
06E requisitos de IRB e confidencialidade do participante?+
Os arquivos são processados em nossa infraestrutura, não enviados para APIs de terceiros. Oferecemos um sinalizador de auto-exclusão por trabalho após N dias para protocolos de IRB. Somos SOC 2 Type II e em conformidade com GDPR; o DPA está na página legal se seu IRB precisar.
07Devo gravar vídeo ou apenas áudio?+
Apenas áudio está bom — não usamos vídeo para diarização. Se você tiver vídeo para identificação de participante, mantenha-o localmente para sua própria codificação; fazer upload apenas da faixa de áudio é mais rápido e barato.
08Como o custo se compara à transcrição humana Rev?+
Um grupo de foco de 90 minutos custa cerca de $2,70 aqui versus aproximadamente $135 na transcrição Rev. O trade-off é precisão: chegamos a 86-94% dependendo da configuração do mic, os transcriotres humanos da Rev atingem ~99%. A maioria dos pesquisadores nos usa para a primeira passagem e apenas escala grupos específicos para humano se necessário.

Solte uma gravação de grupo de foco. Veja a transcrição no NVivo amanhã.

30 minutos grátis por mês. Sem cartão. Rótulos de palestrante, marcação de sobreposição de fala, exportação DOCX pronta para QDA incluída em todos os planos.

Começar grátis