Transcrição de grupos de foco — transcrever um grupo de foco com rótulos de palestrante para cada participante

Transcrição de grupos de foco.Cada palestrante identificado, cada palavra.

Solte uma gravação de grupo de foco com 6, 8, até 10 vozes. Obtenha uma transcrição literal com cada participante identificado, sobreposição de fala marcada, e um DOCX que carrega direto no NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Oito participantes dentro. Transcrição literal marcada e pronta.

Grupos de foco são o caso mais difícil de diarização em nossa fila — dados demográficos semelhantes, vozes semelhantes, sobreposição de fala frequente. Marcamos a sobreposição inline em vez de descartá-la, depois você renomeia Palestrante 3 → 'Participante_F2' uma vez e isso propaga.

Gravação de grupo de focoREC Moderador + 7 participantes · 1:23:14

auto-detectado en-USMic de limite 44 kHz · WAV

~90s

Transcrição · streamingPrecisão de 91% · 8 palestrantes

Então, quando você abriu a embalagem pela primeira vez — me explique o que você notou.

Honestamente? A primeira coisa foi o cheiro. Como um hospital, meio clínico —

É, verdade. Eu achava que era a de lavanda.

É, e o rótulo diz lavanda mas realmente não —

91% em mic de sala com 8 palestrantesDOCX (pronto para QDA) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev humano. IA genérica. Ou a gente.

Pesquisadores geralmente escolhem entre pagar um transcriptor humano (lento, preciso, caro) ou passar o arquivo por uma ferramenta de IA genérica que não foi construída para salas com 8 vozes. Ficamos no meio — velocidade de IA, diarização ajustada para gravações de pesquisa, e um DOCX que entra no NVivo sem cirurgia.

Option 01

Rev transcrição humana

Um humano digita. Alta precisão, mas prazo de 24 horas e o preço aumenta linearmente com as horas.

Precisão~99% (humano)

Prazo12–24 horas típico

Sobreposição de falaMarcada [crosstalk]

Exportação QDADOCX, limpeza manual

Custo · por min$1.50 literal

Grupo de 90 min~$135

Best forTrabalho de dissertação ou pesquisa regulada onde cada disfluência deve ser verificada por humano.

Option 02

Transcription.Solutions

Diarização ajustada para 6-10 vozes, sobreposição de fala marcada inline, exportação DOCX dimensionada para NVivo, ATLAS.ti e Dedoose.

Precisão88–94% em áudio de grupo

Prazo~1× tempo real

Sobreposição de falaMarcada, não descartada

Exportação QDADOCX com turnos de palestrante

Custo · por min$0.03

Grupo de 90 min~$2.70

Best forPesquisadores rodando múltiplos grupos que precisam de uma primeira transcrição no NVivo amanhã de manhã, não na próxima semana.

Option 03

Otter / Sonix

IA genérica construída para reuniões. Funciona bem com 2-3 palestrantes, cai aos pedaços depois de 5 — e as exportações não antecipam software QDA.

PrecisãoDeclina depois de 5 palestrantes

PrazoRápido

Sobreposição de falaFrequentemente descartada

Exportação QDASem formato nativo NVivo

Limite de palestrantesTeto suave ~6

Custo$17–22/usuário/mês

Best forPequenas entrevistas e 1-a-1s onde a gravação tem 2-3 vozes e vive em um fluxo de calendário.

Preços precisos a partir de maio de 2026. As faixas de precisão vêm de nossa amostra interna de arquivos de grupos de foco do cliente, não de benchmarks sintéticos.

94% em lavalier por participante. Mantém 82% em mic de sala único.

A precisão do grupo de foco é limitada por topologia de microfone, não pelo modelo. Um lavalier em cada participante nos dá canais limpos por palestrante — a diarização fica trivial. Um mic de limite em uma mesa de conferência com 8 vozes é o caso difícil. Os números abaixo vêm de gravações de pesquisa reais em nosso pipeline.

8 coisas que as pessoas perguntam sobre transcrição de grupos de foco.

01Posso renomear Palestrante 1 para o nome real ou ID de um participante?+

Sim. Clique em qualquer chip de palestrante no editor, digite o nome ou ID de screener (ex: 'P04_F_34'), e ele propaga para cada turno daquele palestrante na transcrição. A exportação DOCX usa os rótulos renomeados.

02Como você lida com sobreposição de fala?+

Marcamos com marcadores `[sobreposição]` inline e mantemos os enunciados de ambos os palestrantes na transcrição. Ferramentas genéricas geralmente escolhem uma voz e descartam a outra — não fazemos, porque os momentos de sobreposição são frequentemente onde a dinâmica real do grupo de foco está.

03O DOCX realmente importa limpo para NVivo e ATLAS.ti?+

Sim. Exportamos com rótulos de palestrante como títulos de estilo de parágrafo, que NVivo auto-codifica durante a importação e ATLAS.ti reconhece como turnos de palestrante. Dedoose aceita o mesmo DOCX através de seu caminho de importação de transcrição.

04Quantos palestrantes você pode diarizar em um arquivo?+

Teto suave em torno de 12. Depois disso, o clustering acústico começa a mesclar vozes semelhantes — o que geralmente significa uma passagem de renomeação de 10-15 minutos do seu lado. Defina 'Palestrantes esperados' explicitamente no formulário de trabalho para melhores resultados.

05Literal ou limpo — posso escolher?+

Ambos. Modo literal mantém cada 'um', falso início e palavra repetida para análise de discurso. Limpo remove disfluências para legibilidade. Você escolhe por trabalho; o padrão para o modelo de pesquisa é literal.

06E requisitos de IRB e confidencialidade do participante?+

Os arquivos são processados em nossa infraestrutura, não enviados para APIs de terceiros. Oferecemos um sinalizador de auto-exclusão por trabalho após N dias para protocolos de IRB. Somos SOC 2 Type II e em conformidade com GDPR; o DPA está na página legal se seu IRB precisar.

07Devo gravar vídeo ou apenas áudio?+

Apenas áudio está bom — não usamos vídeo para diarização. Se você tiver vídeo para identificação de participante, mantenha-o localmente para sua própria codificação; fazer upload apenas da faixa de áudio é mais rápido e barato.

08Como o custo se compara à transcrição humana Rev?+

Um grupo de foco de 90 minutos custa cerca de $2,70 aqui versus aproximadamente $135 na transcrição Rev. O trade-off é precisão: chegamos a 86-94% dependendo da configuração do mic, os transcriotres humanos da Rev atingem ~99%. A maioria dos pesquisadores nos usa para a primeira passagem e apenas escala grupos específicos para humano se necessário.