Trascrizione di focus group — trascrivi un focus group con etichette per ogni partecipante

Trascrizione di focus group.Ogni partecipante etichettato, ogni parola.

Carica una registrazione di focus group con 6, 8, anche 10 voci. Ottieni un trascritto verbatim con ogni partecipante etichettato, cross-talk etichettato, e un DOCX che si carica direttamente in NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Otto partecipanti dentro. Verbatim etichettato fuori.

I focus group sono la situazione più difficile per la diarizzazione nella nostra coda — demografia simile, voci simili, frequente sovrapposizione di cross-talk. Etichettiamo la sovrapposizione inline anziché scartarla, poi rinomini Speaker 3 → 'Participant_F2' una volta e si propaga.

Registrazione di focus groupREC Moderatore + 7 partecipanti · 1:23:14

rilevato automaticamente en-USMicrofono boundary 44 kHz · WAV

~90s

Trascritto · streamingPrecisione del 91% · 8 parlanti

Quando hai aperto la confezione per la prima volta — descrivi quello che hai notato.

Onestamente? La prima cosa è stato l'odore. Come un ospedale, piuttosto clinico —

Sì, identico. Pensavo fosse quello alla lavanda.

Giusto, e l'etichetta dice lavanda ma in realtà non lo è —

91% su microfono della stanza a 8 parlantiDOCX (pronto per QDA) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev umano. AI generico. O noi.

I ricercatori di solito scelgono tra pagare un trascrittore umano (lento, preciso, costoso) o far passare il file attraverso uno strumento AI generico che non è stato costruito per stanze a 8 voci. Noi siamo nel mezzo — velocità AI, diarizzazione sintonizzata per registrazioni di ricerca, e un DOCX che si inserisce in NVivo senza manomissioni.

Option 01

Rev human verbatim

Un umano lo digita. Alta precisione, ma consegna in 24 ore e il prezzo scala linearmente con le ore.

Accuracy~99% (umano)

Turnaround12–24 ore, tipico

Cross-talkMarcato [crosstalk]

QDA exportDOCX, pulizia manuale

Cost · per min$1,50 verbatim

90-min group~$135

Best forTesi di laurea o ricerca regolata dove ogni disfluenza deve essere verificata da un umano.

Option 02

Transcription.Solutions

Diarizzazione sintonizzata per 6-10 voci, cross-talk etichettato inline, esportazione DOCX dimensionata per NVivo, ATLAS.ti e Dedoose.

Accuracy88–94% su audio di gruppo

Turnaround~1× tempo reale

Cross-talkEtichettato, non eliminato

QDA exportDOCX con turni di parlante

Cost · per min$0,03

90-min group~$2,70

Best forRicercatori che eseguono più gruppi e hanno bisogno di un trascritto di primo passaggio in NVivo domani mattina, non la prossima settimana.

Option 03

Otter / Sonix

AI generico costruito per riunioni. Decente su 2-3 parlanti, crolla oltre 5 — e le esportazioni non prevedono software QDA.

AccuracyCala oltre 5 parlanti

TurnaroundVeloce

Cross-talkSpesso eliminato

QDA exportNessun formato NVivo nativo

Speaker capLimite soft ~6

Cost$17–22/utente/mese

Best forInterviste brevi e colloqui individuali dove la registrazione ha 2-3 voci e si trova in un flusso di lavoro del calendario.

Prezzi accurati a maggio 2026. Gli intervalli di precisione provengono dal nostro campione interno di file di focus group dei clienti, non da benchmark sintetici.

94% su lavalier per partecipante. Si mantiene all'82% su un singolo microfono della stanza.

L'accuratezza del focus group è limitata da topologia del microfono, non dal modello. Un lavalier su ogni partecipante ci dà canali puliti per oratore — la diarizzazione diventa banale. Un microfono boundary su un tavolo di conferenza con 8 voci è il caso difficile. I numeri seguenti provengono da registrazioni di ricerca reali nella nostra pipeline.

8 cose che le persone chiedono sulla trascrizione di focus group.

01Posso rinominare Speaker 1 al nome effettivo o all'ID del partecipante?+

Sì. Fai clic su qualsiasi chip del parlante nell'editor, digita il nome o l'ID dello screener (ad es. 'P04_F_34') e si propaga a ogni turno di quel parlante nel trascritto. L'esportazione DOCX utilizza le etichette rinominate.

02Come gestisci il cross-talk e il linguaggio sovrapposto?+

Lo etichettiamo inline con marcatori `[overlap]` e manteniamo le enunciazioni di entrambi i parlanti nel trascritto. Gli strumenti generici di solito scelgono una voce e scartano l'altra — noi no, perché i momenti di sovrapposizione sono spesso dove vivono le dinamiche reali del focus group.

03Il DOCX si importa veramente pulitamente in NVivo e ATLAS.ti?+

Sì. Esportiamo con etichette di parlante come intestazioni in stile paragrafo, che NVivo codifica automaticamente durante l'importazione e ATLAS.ti riconosce come turni di parlante. Dedoose accetta lo stesso DOCX tramite il suo percorso di importazione del trascritto.

04Quanti parlanti puoi diarizzare in un file?+

Limite soft intorno a 12. Oltre ciò, il clustering acustico inizia a fondere voci simili — il che di solito significa un passaggio di ridenominazione di 10-15 minuti da parte tua. Imposta 'Parlanti previsti' esplicitamente nel modulo di lavoro per i migliori risultati.

05Verbatim o pulito — posso scegliere?+

Entrambi. Modalità verbatim mantiene ogni 'um', falsa partenza e parola ripetuta per l'analisi del discorso. Pulito rimuove le disfluenze per la leggibilità. Scegli per ogni lavoro; il default per il modello di ricerca è verbatim.

06Che dire dei requisiti dell'IRB e della riservatezza dei partecipanti?+

I file vengono elaborati nella nostra infrastruttura, non inviati ad API di terze parti. Offriamo un flag di auto-eliminazione dopo N giorni per protocollo IRB. Siamo SOC 2 Type II e conformi a GDPR; il DPA è sulla pagina legale se il tuo IRB ne ha bisogno.

07Dovrei registrare video o solo audio?+

Solo audio va bene — non usiamo il video per la diarizzazione. Se hai video per l'identificazione dei partecipanti, conservalo localmente per la tua codifica; caricare solo la traccia audio è più veloce e più economico.

08Come si confronta il costo con Rev human verbatim?+

Un focus group di 90 minuti costa circa $2,70 qui rispetto a circa $135 su Rev verbatim. Il compromesso è l'accuratezza: arriviamo all'86-94% a seconda della configurazione del microfono, i trascrittori umani di Rev raggiungono ~99%. La maggior parte dei ricercatori ci usa per il primo passaggio e solo escalate gruppi specifici a umano se necessario.