Trascrizione di focus group.Ogni partecipante etichettato, ogni parola.

Carica una registrazione di focus group con 6, 8, anche 10 voci. Ottieni un trascritto verbatim con ogni partecipante etichettato, cross-talk etichettato, e un DOCX che si carica direttamente in NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Guarda cosa esce

Otto partecipanti dentro. Verbatim etichettato fuori.

I focus group sono la situazione più difficile per la diarizzazione nella nostra coda — demografia simile, voci simili, frequente sovrapposizione di cross-talk. Etichettiamo la sovrapposizione inline anziché scartarla, poi rinomini Speaker 3 → 'Participant_F2' una volta e si propaga.

Registrazione di focus groupREC Moderatore + 7 partecipanti · 1:23:14
rilevato automaticamente en-USMicrofono boundary 44 kHz · WAV
~90s
Trascritto · streamingPrecisione del 91% · 8 parlanti
S1

Quando hai aperto la confezione per la prima volta — descrivi quello che hai notato.

S2

Onestamente? La prima cosa è stato l'odore. Come un ospedale, piuttosto clinico —

S3

Sì, identico. Pensavo fosse quello alla lavanda.

S2

Giusto, e l'etichetta dice lavanda ma in realtà non lo è —

91% su microfono della stanza a 8 parlantiDOCX (pronto per QDA) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tre opzioni reali · confronto onesto

Rev umano. AI generico. O noi.

I ricercatori di solito scelgono tra pagare un trascrittore umano (lento, preciso, costoso) o far passare il file attraverso uno strumento AI generico che non è stato costruito per stanze a 8 voci. Noi siamo nel mezzo — velocità AI, diarizzazione sintonizzata per registrazioni di ricerca, e un DOCX che si inserisce in NVivo senza manomissioni.

Option 01

Rev human verbatim

Un umano lo digita. Alta precisione, ma consegna in 24 ore e il prezzo scala linearmente con le ore.

Accuracy~99% (umano)
Turnaround12–24 ore, tipico
Cross-talkMarcato [crosstalk]
QDA exportDOCX, pulizia manuale
Cost · per min$1,50 verbatim
90-min group~$135
Best forTesi di laurea o ricerca regolata dove ogni disfluenza deve essere verificata da un umano.
Option 02

Transcription.Solutions

Diarizzazione sintonizzata per 6-10 voci, cross-talk etichettato inline, esportazione DOCX dimensionata per NVivo, ATLAS.ti e Dedoose.

Accuracy88–94% su audio di gruppo
Turnaround~1× tempo reale
Cross-talkEtichettato, non eliminato
QDA exportDOCX con turni di parlante
Cost · per min$0,03
90-min group~$2,70
Best forRicercatori che eseguono più gruppi e hanno bisogno di un trascritto di primo passaggio in NVivo domani mattina, non la prossima settimana.
Option 03

Otter / Sonix

AI generico costruito per riunioni. Decente su 2-3 parlanti, crolla oltre 5 — e le esportazioni non prevedono software QDA.

AccuracyCala oltre 5 parlanti
TurnaroundVeloce
Cross-talkSpesso eliminato
QDA exportNessun formato NVivo nativo
Speaker capLimite soft ~6
Cost$17–22/utente/mese
Best forInterviste brevi e colloqui individuali dove la registrazione ha 2-3 voci e si trova in un flusso di lavoro del calendario.

Prezzi accurati a maggio 2026. Gli intervalli di precisione provengono dal nostro campione interno di file di focus group dei clienti, non da benchmark sintetici.

Specifico per i focus group

Tre cose che mordono i ricercatori sugli strumenti AI generici.

Attiva le giuste impostazioni in anticipo e il trascritto si inserisce in NVivo senza un fine settimana di pulizia.

Cosa va male

  1. 1Il cross-talk viene eliminato. La maggior parte degli strumenti consumer selezionano un oratore durante la sovrapposizione e scartano il resto. Perdi esattamente i momenti in cui il consenso o la reazione accade.
  2. 2I parlanti crollano a 3. Gli strumenti assumono stanze di dimensioni di riunione e limitano i cluster di diarizzazione basso. I tuoi otto partecipanti tornano come 'Speaker 1' / 'Speaker 2' / 'Speaker 3'.
  3. 3L'esportazione è un muro di testo. Nessuna pausa di paragrafo per turno di parlante, nessuna struttura DOCX che NVivo possa auto-codificare all'importazione.

Cosa attivare qui

  1. 1Attiva Etichetta linguaggio sovrapposto nel modulo di lavoro. Il cross-talk ottiene marcatori `[overlap]` inline e entrambi i parlanti conservano le loro dichiarazioni.
  2. 2Imposta Parlanti previsti: 8-12 esplicitamente. Dimensioniamo il numero di cluster di diarizzazione per corrispondere invece di indovinare basso.
  3. 3Scegli esportazione DOCX (pronto per QDA). I turni di parlante diventano paragrafi prefissati con l'etichetta — NVivo, ATLAS.ti e Dedoose rilevano automaticamente questo formato all'importazione.

Impostazioni di lavoro consigliate per i focus group

Carica un file di focus group con il modello 'ricerca' e questi si attivano per impostazione predefinita. Sostituisci per ogni lavoro dal modulo.

Diarization
Acustica · previsti 6-10 parlanti
Verbatim mode
Completo — disfluenze mantenute
Overlap handling
Etichetta inline [overlap]
Custom vocabulary
Nomi di prodotti / marchi da screener
Speaker labels
Modificabile dopo il lavoro, propagare tutto
Export
DOCX (pronto per QDA) · TXT con timestamp

Accuracy · real-world numbers

94% su lavalier per partecipante. Si mantiene all'82% su un singolo microfono della stanza.

L'accuratezza del focus group è limitata da topologia del microfono, non dal modello. Un lavalier su ogni partecipante ci dà canali puliti per oratore — la diarizzazione diventa banale. Un microfono boundary su un tavolo di conferenza con 8 voci è il caso difficile. I numeri seguenti provengono da registrazioni di ricerca reali nella nostra pipeline.

94%
Lavalier per partecipante

Ogni partecipante su una traccia propria, mixata in un file WAV multitraccia. Diarizzazione saltata — errore solo testo. Miglior caso per lavori di qualità dissertativa.

91%
Microfono da conferenza, 4-6 partecipanti

Microfono boundary centrato sul tavolo, trattamento acustico moderato. Voci distinguibili, occasionale confusione tra partecipanti dello stesso genere di età simile.

86%
Singolo microfono della stanza, 7-10 partecipanti

Cross-talk frequente, voci simili si fondono sotto diarizzazione acustica. Prevedi un passaggio di ridenominazione e fusione di 10 minuti sui chip dei parlanti prima dell'analisi.

82%
Gruppo remoto su Zoom mono

Mix mono compresso, nessuna divisione per canale disponibile. Le parole sono ancora utilizzabili per la codifica tematica, ma le affermazioni verbatim a livello di disfluenza si indeboliscono qui.

Domande comuni

8 cose che le persone chiedono sulla trascrizione di focus group.

01Posso rinominare Speaker 1 al nome effettivo o all'ID del partecipante?+
Sì. Fai clic su qualsiasi chip del parlante nell'editor, digita il nome o l'ID dello screener (ad es. 'P04_F_34') e si propaga a ogni turno di quel parlante nel trascritto. L'esportazione DOCX utilizza le etichette rinominate.
02Come gestisci il cross-talk e il linguaggio sovrapposto?+
Lo etichettiamo inline con marcatori `[overlap]` e manteniamo le enunciazioni di entrambi i parlanti nel trascritto. Gli strumenti generici di solito scelgono una voce e scartano l'altra — noi no, perché i momenti di sovrapposizione sono spesso dove vivono le dinamiche reali del focus group.
03Il DOCX si importa veramente pulitamente in NVivo e ATLAS.ti?+
Sì. Esportiamo con etichette di parlante come intestazioni in stile paragrafo, che NVivo codifica automaticamente durante l'importazione e ATLAS.ti riconosce come turni di parlante. Dedoose accetta lo stesso DOCX tramite il suo percorso di importazione del trascritto.
04Quanti parlanti puoi diarizzare in un file?+
Limite soft intorno a 12. Oltre ciò, il clustering acustico inizia a fondere voci simili — il che di solito significa un passaggio di ridenominazione di 10-15 minuti da parte tua. Imposta 'Parlanti previsti' esplicitamente nel modulo di lavoro per i migliori risultati.
05Verbatim o pulito — posso scegliere?+
Entrambi. Modalità verbatim mantiene ogni 'um', falsa partenza e parola ripetuta per l'analisi del discorso. Pulito rimuove le disfluenze per la leggibilità. Scegli per ogni lavoro; il default per il modello di ricerca è verbatim.
06Che dire dei requisiti dell'IRB e della riservatezza dei partecipanti?+
I file vengono elaborati nella nostra infrastruttura, non inviati ad API di terze parti. Offriamo un flag di auto-eliminazione dopo N giorni per protocollo IRB. Siamo SOC 2 Type II e conformi a GDPR; il DPA è sulla pagina legale se il tuo IRB ne ha bisogno.
07Dovrei registrare video o solo audio?+
Solo audio va bene — non usiamo il video per la diarizzazione. Se hai video per l'identificazione dei partecipanti, conservalo localmente per la tua codifica; caricare solo la traccia audio è più veloce e più economico.
08Come si confronta il costo con Rev human verbatim?+
Un focus group di 90 minuti costa circa $2,70 qui rispetto a circa $135 su Rev verbatim. Il compromesso è l'accuratezza: arriviamo all'86-94% a seconda della configurazione del microfono, i trascrittori umani di Rev raggiungono ~99%. La maggior parte dei ricercatori ci usa per il primo passaggio e solo escalate gruppi specifici a umano se necessario.

Carica una registrazione di focus group. Visualizza il trascritto in NVivo domani.

30 minuti gratuiti ogni mese. Nessuna carta richiesta. Etichette di parlante, tagging di cross-talk, esportazione DOCX pronta per QDA inclusa in ogni piano.

Inizia gratuitamente