Transcripció de grups de discussió — transcriu grups de discussió amb etiquetes d'orador per a cada participant

Transcripció de grups de discussió.Cada orador etiquetat, cada paraula.

Deixa una gravació de grup de discussió amb 6, 8, fins a 10 veus. Obtén una transcripció verbatim amb cada participant etiquetat, superposició d'orador marcada, i un DOCX que es carrega directament a NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Vuit participants dins. Etiquetat verbatim fora.

Els grups de discussió són el cas de diarització més difícil de la nostra cua — demogràfics similars, veus similars, superposició d'orador freqüent. Etiquetam la superposició en línia en lloc de descartar-la, després canvies el nom d'Orador 3 → 'Participant_F2' una vegada i es propaga.

Gravació de grup de discussióREC Moderador + 7 participants · 1:23:14

detectat automàticament en-US44 kHz micròfon de límit · WAV

~90s

Transcripció · streaming91% precisió · 8 oradors

Així que quan primer vas obrir l'embalatge — explica'm què vas notar.

De veritat? La primera cosa va ser l'olor. Com un hospital, una mica clínica —

Sí, el mateix. Pensava que era l'un de lavanda.

Clar, i l'etiqueta diu lavanda però realment no ho és —

91% en micròfon de sala de 8 oradorsDOCX (QDA-ready) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev humà. IA genèrica. O nosaltres.

Els investigadors normalment trien entre pagar un transcriptor humà (lent, precís, car) o executar l'arxiu a través d'una eina IA genèrica que no va ser construïda per a sales de 8 veus. Ens situem en mitjà — velocitat IA, diarització afinada per a enregistraments de recerca, i un DOCX que cau a NVivo sense cirurgia.

Option 01

Rev human verbatim

Un humà la escriu. Alta precisió, però termini de 24 hores i el preu es gradua linealment amb les hores.

Precisió~99% (humà)

Termini12–24 hores típiques

SuperposicióMarcada [crosstalk]

Exportació QDADOCX, neteja manual

Cost · per minut$1.50 verbatim

Grup de 90 min~$135

Best forTreball de dissertació o recerca regulada on cada superfluïtat ha de ser verificada pel humà.

Option 02

Transcription.Solutions

Diarització afinada per a 6-10 veus, superposició marcada en línia, exportació DOCX dimensionada per a NVivo, ATLAS.ti i Dedoose.

Precisió88–94% en àudio de grup

Termini~1× realtime

Gestió de superposicióMarcada, no descartada

Exportació QDADOCX amb tomants d'orador

Cost · per minut$0.03

Grup de 90 min~$2.70

Best forInvestigadors que executen múltiples grups que necessiten una transcripció de primer pas a NVivo demà al matí, no la setmana vinent.

Option 03

Otter / Sonix

IA genèrica construïda per a reunions. Decent en 2-3 oradors, falla més amunt de 5 — i les exportacions no anticiben programari QDA.

PrecisióCau per sobre de 5 oradors

TerminiRàpid

SuperposicióSovint descartada

Exportació QDASense format NVivo natiu

Límit d'oradorsLímit suau ~6

Cost$17–22/usuari/mes

Best forEntrevistes petites i 1-a-1 on l'enregistrament té 2-3 veus i viu en un flux de calendari.

Preus precisos a partir de maig de 2026. Els rangs de precisió provenen de la nostra mostra interna de fitxers de grups de discussió de clients, no de referències sintètiques.

94% en lavalier-per-participant. Es manté al 82% en un micròfon de sala únic.

La precisió del grup de discussió està embotellada per topologia del micròfon, no pel model. Un lavalier en cada participant ens dóna canals nets per orador — la diarització esdevé trivial. Un micròfon de límit en una taula de conferències amb 8 veus és el cas difícil. Els números a continuació provenen d'enregistraments de recerca reals en el nostre gasoducte.

8 coses que la gent pregunta sobre transcripció de grups de discussió.

01Puc canviar el nom d'Orador 1 al nom real d'un participant o ID?+

Sí. Fes clic en qualsevol xip d'orador a l'editor, escriu el nom o ID del cribador (p. ex., 'P04_F_34'), i es propaga a cada tomant d'aquest orador en la transcripció. L'exportació DOCX utilitza les etiquetes renombrades.

02Com gestiones la superposició i el solapament de veu?+

La marquem en línia amb marcadors `[overlap]` i mantenim les enunciacions dels dos oradors en la transcripció. Les eines genèriques normalment trien una veu i descartem l'altra — no ho fem, perquè els moments de superposició són sovint on viuen les dinàmiques reals del grup de discussió.

03El DOCX s'importa realment net a NVivo i ATLAS.ti?+

Sí. Exportam amb etiquetes d'orador com a encapçalaments d'estil de paràgraf, que NVivo codifica automàticament durant la importació i ATLAS.ti reconeix com a tomants d'orador. Dedoose accepta el mateix DOCX a través de la seva ruta d'importació de transcripció.

04Quants oradors pots diaritzar en un fitxer?+

Límit suau al voltant de 12. Per sobre d'això, el clustering acústic comença a fusionar veus similars — què normalment significa un pas de 10-15 minuts renombrar del teu costat. Estableix 'Oradors esperats' explícitament en el formulari de tasca per a millors resultats.

05Verbatim o netejat — puc triar?+

Ambdós. Mode verbatim manté cada 'um', fals inici, i paraula repetida per a anàlisi de discurs. Netejat elimina disfluències per a llegibilitat. Trias per tasca; el valor per defecte per a la plantilla de recerca és verbatim.

06Què passa amb els requisits IRB i la confidencialitat dels participants?+

Els fitxers es processen a la nostra infraestructura, no s'envien a APIs de tercers. Oferim una bandera de supressió automàtica après-N-dies per tasca per a protocols IRB. Som SOC 2 Type II i conformes a GDPR; el DPA es troba a la pàgina legal si la teva IRB la necessita.

07Hauria de gravar vídeo o només àudio?+

Només àudio va bé — no utilitzem vídeo per a diarització. Si tens vídeo per a identificació de participants, mantén-lo localment per al teu própri codificació; carregar només la pista d'àudio és més ràpid i més barato.

08Com es compara el cost amb Rev human verbatim?+

Un grup de discussió de 90 minuts corre alrededor de $2.70 aquí versus aproximadament $135 en Rev verbatim. El compromís és precisió: aterrem al 86-94% depenent de la configuració del micròfon, els transcriptors humans de Rev són ~99%. La majoria d'investigadors ens utilitzen per al primer pas i només escalonen grups específics al humà si és necessari.