Transcripció per a investigadors acadèmics.Conscient de l'IRB, preparada per a CAQDAS, més de 100 idiomes.

Puja una entrevista d'investigació o enregistrament de grup de discussió. Obté text etiquetat per parlants amb marca de temps preparat per a NVivo, Atlas.ti o MaxQDA — amb àudio suprimit dins de 24 hores.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira què surt

Enregistrament de camp dins. Transcript preparat per a codificar fora.

Marquem cada torn de participant amb una marca de temps al principi, mantenim les paraules de farciment si ho demanis literal, i exportem DOCX amb estils de parlant que la teva ferramenta CAQDAS ja reconeix.

Entrevista semi-estructurada · .wavREC 2 parlants · 1:08:24
en-GB detectat automàticament44.1 kHz mono · micròfon de solapa
~90s
Transcript · streaming94% precisió · mode literal
S1

Em pots explicar la primera vegada que vas notar el canvi del barri?

S2

Um, va ser probablement el 2019 — la panaderia de la cantonada va tancar, i, sí, va ser quan ho vaig notar.

S1

I com va ser, veure que passava això durant aquells mesos?

S2

Honestament? Com si el lloc que havia conegut durant trenta anys es desaparegués, peça per peça.

94% en entrevista de solapaDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opcions reals · comparació honesta

Rev humana. NVivo Transcription. O nosaltres.

El servei humà de Rev és l'opció històrica per defecte per a citacions de grau de dissertació. NVivo agrupa la transcripció de l'IA dins de la mateixa ferramenta CAQDAS. Nosaltres sém entre — més ràpid que Rev, més precís i amigable amb l'IRB que la transcripció integrada de NVivo.

Option 01

Rev (transcripció humana)

Els humans ho escriuen. Lent, car, però l'estàndard d'or per a literal publicable.

Temps de resposta12–24 hores (típic)
Cost · per minut$1.50 humà / $0.25 IA
Etiquetes de parlantSí, col·locades manualment
Retenció d'àudioEmmagatzemat als servidors de Rev
IdiomesEN humà · ~30 IA
Exportació CAQDASDOCX, TXT (manual)
Best forEntrevistes solitàries d'alt stake destinades a citació directa en un article publicat, on el pressupost no és la limitació.
Option 02

Transcription.Solutions

Transcript de l'IA en minuts, àudio suprimit en 24 h, DOCX estilitzat per a importació NVivo i Atlas.ti.

Temps de resposta~5 min per un arxiu de 60 min
Cost · per minut$0.03
Etiquetes de parlantDiaritzat, reanomena a l'app
Retenció d'àudioSuprimit dins de 24 h
Idiomes100+, detecció automàtica
Exportació CAQDASDOCX estils de capçalera + TXT
Best forInvestigadors que realitzen 20+ entrevistes que necessiten transcripts de primer pas ràpids, després correccions manuals del 5% de citacions destinades a publicació.
Option 03

NVivo Transcription / Otter

Transcripció de l'IA agrupada dins de la teva ferramenta CAQDAS o anotador. Convenient, EN-inclinada, menys control.

Temps de respostaComparable (IA)
CostPaquets de crèdit · ~$0.30/min
Etiquetes de parlantAcústic, EN-afinat
Retenció d'àudioVinculat a la subscripció
IdiomesLa precisió fora de EN cau
Exportació CAQDASNatiu només a NVivo
Best forEstudiants de PhD solitaris que treballen totalment en anglès dins d'un ecosistema CAQDAS que volen una sola factura.

Preus i banderes de funcionalitats precisos a partir del 2026. La divisió IA/humana de Rev i la tarificació de crèdit de transcripció de NVivo varien segons la regió i la llicència acadèmica.

Específic per a investigació qualitativa

Tres coses que mosseguen els investigadors en ferramentes de transcripció genèriques.

Activa els paràmetres correctes abans de pujar i la transcripció s'importa directament al teu projecte CAQDAS.

Què surt malament

  1. 1Paraules de farciment eliminades silenciosament. L'IA genèrica elimina "um", "com", inicis falsos — bé per a notes de reunió, fatal per a anàlisi de conversació o treball de discurs.
  2. 2Terminologia de domini (marcs teòrics, noms de fàrmacs, noms de lloc, termes de parentiu) es transcriu fonèticament. La codificació després necessita una passada de cercar i reemplaçar.
  3. 3L'àudio rau als servidors del venedor indefinidament. La majoria dels plans de gestió de dades de l'IRB requereixen supressió o retenció controlada — els venedors rarament documenten això clarament.

Què activar aquí

  1. 1Canvia a mode literal al formulari de tasca. Mantenim farciments, inicis falsos, repeticions i marcadors de riure — el mode net és opt-in, no per defecte per a investigadors.
  2. 2Enganxa els termes de codebook i noms propis al vocabulari personalitzat. El passem com una pista de reconeixedor, no una substitució dura, així el context encara guanya.
  3. 3L'àudio es suprimeix dins de 24 hores de la conclusió de la tasca. La transcripció es manté al teu compte. Podem emetre una confirmació de supressió per al teu fitxer IRB sota demanda.

Paràmetres de tasca recomanats per a entrevistes d'investigació

Puja un enregistrament de camp i aquests s'activen per defecte. Modifica per tasca des del formulari.

Mode
Literal (farciments + inicis falsos activats)
Model de parlant
Entrevista · 2–8 parlants
Idioma
Detecció automàtica · tolerant amb accents
Marques de temps
Cada torn de parlant
Retenció d'àudio
Suprimeix dins de 24 h
Exportació
DOCX (estils CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% en una entrevista diàdica de solapa neta. Honesta sobre què trenca el treball de camp.

L'àudio de camp és el cas difícil en transcripció — habitacions obertes, anglès amb accent, superposició de parla en grups de discussió. Les entrevistes diadiques amb micròfon de solapa toquen el màxim; els enregistraments de camp ambiental i els grups de discussió grans es degraden més ràpidament. Els números següents provenen de carregades d'investigadors reals, no de tests sintètics.

95%
1-a-1, solapa o micròfon USB

Habitació tranquil·la, parlant únic L2 o natiu, gravadora sobre la taula. Millor cas per a entrevistes semi-estructurades — la majoria d'estudis diàdics cauen aquí.

91%
Gravadora manual, 2–3 parlants

Zoom H4n o gravadora de telèfon al mig de la taula. Cadires de parlants identificades per direcció. Planifica una passada de 5 min de reanomenació.

85%
Entrevista de camp, soroll ambiental

Cafè, mercat, entrevista mentre camines. El murmuri de fons i el trànsit afecten respostes curtes; els torns principals es mantenen codificables.

80%
Grup de discussió, 5–8 participants

Superposició de parla i micròfon compartit. La diarització fusionarà algunes veus més silencioses — espera desambiguar en temps de codificació.

Preguntes freqüents

8 coses que els investigadors pregunten sobre transcripció acadèmica.

01És acceptable segons un pla típic de gestió de dades de l'IRB?+
La majoria dels plans que hem vist ens aproven una vegada que llegeixen dos fets: l'àudio es suprimeix dins de 24 hores de la conclusió de la tasca, i els transcripts es queden només al compte de l'investigador. No som un IRB nosaltres — el teu consell fa la trucada final — però emetrem una descripció escrita de processament per al teu protocol sota demanda.
02Manteniu l'àudio de l'entrevista?+
No. L'arxiu d'àudio es suprimeix dins de 24 hores de que acabi la tasca. Només la transcripció es queda al teu compte, i pots suprimir-la en qualsevol moment. No usem àudio de recerca per entrenar models.
03Podeu fer literal real — amb farciments, inicis falsos i superposicions — per a anàlisi de conversació?+
Sí. Activa el mode literal al formulari de tasca i mantenim "um", "uh", repeticions, inicis falsos i marques de riure. La superposició es marca amb un símbol de brace al límit de gir. No fem notació de Jefferson automàticament — això és encara una passada humana.
04La DOCX s'importarà netejon a NVivo, Atlas.ti o MaxQDA?+
Sí. La nostra DOCX usa els estils de capçalera i parlant que cada ferramenta espera per a autocoding per parlant. A NVivo, usa Fitxer → Importar → Transcripts. A Atlas.ti i MaxQDA, l'estructura de paràgraf de parlant es conserva perquè autocoding per parlant funciona sense més.
05Com gestiona l'anglès amb accent o entrevistes multilingües?+
Suportem més de 100 idiomes amb detecció automàtica, incloent canvi de codi dins d'un sol enregistrament. Els accents pesats L2 cauen al voltant del 85–90% en àudio net. Per a idiomes minoritaris amb dades d'entrenament escasses (p. ex., alguns idiomes africans i indígenes), la precisió és més baixa i ho diem al selector d'idioma.
06Grups de discussió amb 6–8 persones — la diarització realment funciona?+
Parcialment. La diarització acústica separa de forma fiable 4–5 veus distintes sobre un micròfon compartit. Més que això, espera que el model fusioni els dos participants més silenciosos. La solució és una passada de reanomenació a l'editor de transcripció — la majoria de transcripts de grups de discussió necessiten 10–15 minuts de netejar.
07Pot el meu co-PI i estudiants de grau accedir als transcripts al mateix projecte?+
Sí. Els espais de treball suporten carpetes compartides amb permisos per usuari — co-PI pot veure totes les entrevistes, RAs veuen només la seva cohort assignada. Útil per a estudis de multi-lloc on no vols que un estudiant exporti les dades de l'altre.
08Per a citacions directes de grau de publicació, oferiu una passada humana?+
Encara no, i no pretendrem que ho fem. Per a citacions que van a una tesi o article, la nostra recomanació és: executa primer el transcript de l'IA, codifica a la teva ferramenta CAQDAS, després corregeix a mà els 30–60 segons específics al voltant de cada citació contra l'àudio abans que es suprimeixi. Això és el flux de treball que la majoria dels nostres usuaris investigadors usen.

Puja una entrevista. Mira si la transcripció codifica la manera que ho codificaries.

30 minuts gratuïts cada mes. Cap targeta. Mode literal, més de 100 idiomes, DOCX preparada per a CAQDAS, àudio suprimit en 24 h.

Comença gratis