Transcripció de grups de discussió.Cada orador etiquetat, cada paraula.

Deixa una gravació de grup de discussió amb 6, 8, fins a 10 veus. Obtén una transcripció verbatim amb cada participant etiquetat, superposició d'orador marcada, i un DOCX que es carrega directament a NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira què surt

Vuit participants dins. Etiquetat verbatim fora.

Els grups de discussió són el cas de diarització més difícil de la nostra cua — demogràfics similars, veus similars, superposició d'orador freqüent. Etiquetam la superposició en línia en lloc de descartar-la, després canvies el nom d'Orador 3 → 'Participant_F2' una vegada i es propaga.

Gravació de grup de discussióREC Moderador + 7 participants · 1:23:14
detectat automàticament en-US44 kHz micròfon de límit · WAV
~90s
Transcripció · streaming91% precisió · 8 oradors
S1

Així que quan primer vas obrir l'embalatge — explica'm què vas notar.

S2

De veritat? La primera cosa va ser l'olor. Com un hospital, una mica clínica —

S3

Sí, el mateix. Pensava que era l'un de lavanda.

S2

Clar, i l'etiqueta diu lavanda però realment no ho és —

91% en micròfon de sala de 8 oradorsDOCX (QDA-ready) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcions reals · comparació honesta

Rev humà. IA genèrica. O nosaltres.

Els investigadors normalment trien entre pagar un transcriptor humà (lent, precís, car) o executar l'arxiu a través d'una eina IA genèrica que no va ser construïda per a sales de 8 veus. Ens situem en mitjà — velocitat IA, diarització afinada per a enregistraments de recerca, i un DOCX que cau a NVivo sense cirurgia.

Option 01

Rev human verbatim

Un humà la escriu. Alta precisió, però termini de 24 hores i el preu es gradua linealment amb les hores.

Precisió~99% (humà)
Termini12–24 hores típiques
SuperposicióMarcada [crosstalk]
Exportació QDADOCX, neteja manual
Cost · per minut$1.50 verbatim
Grup de 90 min~$135
Best forTreball de dissertació o recerca regulada on cada superfluïtat ha de ser verificada pel humà.
Option 02

Transcription.Solutions

Diarització afinada per a 6-10 veus, superposició marcada en línia, exportació DOCX dimensionada per a NVivo, ATLAS.ti i Dedoose.

Precisió88–94% en àudio de grup
Termini~1× realtime
Gestió de superposicióMarcada, no descartada
Exportació QDADOCX amb tomants d'orador
Cost · per minut$0.03
Grup de 90 min~$2.70
Best forInvestigadors que executen múltiples grups que necessiten una transcripció de primer pas a NVivo demà al matí, no la setmana vinent.
Option 03

Otter / Sonix

IA genèrica construïda per a reunions. Decent en 2-3 oradors, falla més amunt de 5 — i les exportacions no anticiben programari QDA.

PrecisióCau per sobre de 5 oradors
TerminiRàpid
SuperposicióSovint descartada
Exportació QDASense format NVivo natiu
Límit d'oradorsLímit suau ~6
Cost$17–22/usuari/mes
Best forEntrevistes petites i 1-a-1 on l'enregistrament té 2-3 veus i viu en un flux de calendari.

Preus precisos a partir de maig de 2026. Els rangs de precisió provenen de la nostra mostra interna de fitxers de grups de discussió de clients, no de referències sintètiques.

Específic per a grups de discussió

Tres coses que causen problemes als investigadors en eines IA genèriques.

Gira la configuració correcta al principi i la transcripció cau a NVivo sense cap serena de neteja.

Què funciona malament

  1. 1Superposició es descarta. La majoria d'eines de consum trien un orador durant la superposició i descarten la resta. Perds exactament els moments on passa el consens o la reacció.
  2. 2Els oradors es col·lapsen a 3. Les eines assumeixen sales de mida de reunió i plafen els clusters de diarització baix. Els teus vuit participants torna com 'Orador 1' / 'Orador 2' / 'Orador 3'.
  3. 3L'exportació és una paret de text. Sense salt de paràgraf per tomant d'orador, sense estructura DOCX que NVivo pugui codificar automàticament en importació.

Què girar aquí

  1. 1Posa en marxa Marca superposició de veu en el formulari de tasca. Superposició obté marcadors `[overlap]` en línia i tots dos oradors mantenen les seves enunciacions.
  2. 2Estableix Oradors esperats: 8-12 explícitament. Dimensionam el nombre de clusters de diarització per coincidir en lloc de suposar baix.
  3. 3Tria DOCX (QDA-ready) exportació. Els tomants d'orador es converteixen en paràgrafs amb prefix de l'etiqueta — NVivo, ATLAS.ti i Dedoose tots detecten automàticament aquest format en importació.

Configuració de tasca recomanada per a grups de discussió

Deixa un fitxer de grup de discussió amb la plantilla 'research' i aquestes es giren per defecte. Substitueix per tasca des del formulari.

Diarització
Acústica · esperats 6-10 oradors
Mode verbatim
Sencer — disfluències mantingudes
Gestió de superposició
Marca en línia [overlap]
Vocabulari personalitzat
Noms de producte / marca del cribador
Etiquetes d'orador
Editable després de la tasca, propaga-tot
Exportació
DOCX (QDA-ready) · TXT amb marques temporals

Accuracy · real-world numbers

94% en lavalier-per-participant. Es manté al 82% en un micròfon de sala únic.

La precisió del grup de discussió està embotellada per topologia del micròfon, no pel model. Un lavalier en cada participant ens dóna canals nets per orador — la diarització esdevé trivial. Un micròfon de límit en una taula de conferències amb 8 veus és el cas difícil. Els números a continuació provenen d'enregistraments de recerca reals en el nostre gasoducte.

94%
Lavalier per participant

Cada participant en la seva pròpia pista, mesclada a WAV multipista. Diarització omesa — error només de text. Millor cas per al treball de grau de dissertació.

91%
Micròfon de conferència, 4-6 participants

Micròfon de límit centrat en la taula, tractament de sala moderat. Veus distingibles, ocasional confusió entre participants del mateix gènere i edat similar.

86%
Micròfon de sala únic, 7-10 participants

Superposició freqüent, veus similars es fusionen en diarització acústica. Espera un pas de 10 minuts renombrar i fusionar en els xips d'orador abans d'anàlisi.

82%
Grup remot en mono Zoom

Mescla mono comprimida, sense divisió per canal disponible. Les paraules són útils per a codificació temàtica, però les reclamacions verbatim a nivell de disfluència s'enfosqueixen aquí.

Preguntes freqüents

8 coses que la gent pregunta sobre transcripció de grups de discussió.

01Puc canviar el nom d'Orador 1 al nom real d'un participant o ID?+
Sí. Fes clic en qualsevol xip d'orador a l'editor, escriu el nom o ID del cribador (p. ex., 'P04_F_34'), i es propaga a cada tomant d'aquest orador en la transcripció. L'exportació DOCX utilitza les etiquetes renombrades.
02Com gestiones la superposició i el solapament de veu?+
La marquem en línia amb marcadors `[overlap]` i mantenim les enunciacions dels dos oradors en la transcripció. Les eines genèriques normalment trien una veu i descartem l'altra — no ho fem, perquè els moments de superposició són sovint on viuen les dinàmiques reals del grup de discussió.
03El DOCX s'importa realment net a NVivo i ATLAS.ti?+
Sí. Exportam amb etiquetes d'orador com a encapçalaments d'estil de paràgraf, que NVivo codifica automàticament durant la importació i ATLAS.ti reconeix com a tomants d'orador. Dedoose accepta el mateix DOCX a través de la seva ruta d'importació de transcripció.
04Quants oradors pots diaritzar en un fitxer?+
Límit suau al voltant de 12. Per sobre d'això, el clustering acústic comença a fusionar veus similars — què normalment significa un pas de 10-15 minuts renombrar del teu costat. Estableix 'Oradors esperats' explícitament en el formulari de tasca per a millors resultats.
05Verbatim o netejat — puc triar?+
Ambdós. Mode verbatim manté cada 'um', fals inici, i paraula repetida per a anàlisi de discurs. Netejat elimina disfluències per a llegibilitat. Trias per tasca; el valor per defecte per a la plantilla de recerca és verbatim.
06Què passa amb els requisits IRB i la confidencialitat dels participants?+
Els fitxers es processen a la nostra infraestructura, no s'envien a APIs de tercers. Oferim una bandera de supressió automàtica après-N-dies per tasca per a protocols IRB. Som SOC 2 Type II i conformes a GDPR; el DPA es troba a la pàgina legal si la teva IRB la necessita.
07Hauria de gravar vídeo o només àudio?+
Només àudio va bé — no utilitzem vídeo per a diarització. Si tens vídeo per a identificació de participants, mantén-lo localment per al teu própri codificació; carregar només la pista d'àudio és més ràpid i més barato.
08Com es compara el cost amb Rev human verbatim?+
Un grup de discussió de 90 minuts corre alrededor de $2.70 aquí versus aproximadament $135 en Rev verbatim. El compromís és precisió: aterrem al 86-94% depenent de la configuració del micròfon, els transcriptors humans de Rev són ~99%. La majoria d'investigadors ens utilitzen per al primer pas i només escalonen grups específics al humà si és necessari.

Deixa una gravació de grup de discussió. Mira la transcripció a NVivo demà.

30 minuts gratis cada mes. Sense targeta. Etiquetes d'orador, marcat de superposició, exportació DOCX llista per QDA inclosa en cada pla.

Comença gratis