Transcrição de entrevistas — transcreva uma entrevista com identificação de oradores e marcas de tempo

Transcrição de entrevistas.Métodos diferentes, mesmo resultado.

Anotação de voz, chamada do Zoom, microfone de lapela ou gravador portátil — envie a gravação de entrevista e obtenha texto com identificação de oradores e marcas de tempo para citação.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Duas vozes entram. Duas vozes saem, identificadas.

A maioria das entrevistas tem duas pessoas em um dispositivo — um telefone sobre a mesa, um gravador entre vocês. Separamos o áudio da entrevista em repórter e fonte mesmo de um único canal mono, depois marcamos cada turno com tempo para citação.

Gravador portátil · WAVREC 2 oradores · 38:42

auto-detectado en-US48 kHz mono · 1411 kbps

~90s

Transcrição · streaming94% de precisão

Você pode me descrever o que viu na manhã do dezoito?

Cheguei por volta das seis. A porta da doca de carregamento já estava aberta, o que não deveria estar.

E você havia reportado o problema da porta antes — para quem?

Para Diane Okafor em facilities, duas vezes em março. Tenho os e-mails.

94% em WAV portátilDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Option 01

Rev human transcription

Pessoas reais digitando sua entrevista. Melhor em áudio difícil, mas você espera e paga.

Tempo de retorno12–24 horas típico

Precisão em áudio limpo99% (conforme afirmado)

Identificação de oradoresManual, incluído

IdiomasEN human · 30+ AI

Custo · por minuto$1.50 human · $0.25 AI

PrivacidadeÁudio enviado para contratados

Best forEntrevistas destinadas a tribunal ou críticas para publicação em áudio ruim onde você precisa de um ouvido humano e tem um dia para esperar.

Option 02

Transcription.Solutions

Transcrição AI, separação de oradores, pronta em minutos. Mesmo engine para anotação de voz, Zoom ou gravador portátil.

Tempo de retorno~3 min por hora de áudio

Precisão em áudio limpo94–96%

Identificação de oradoresAutomática · renomear no editor

Idiomas99, auto-detectados

Custo · por minuto$0.03

PrivacidadeÁudio deletado em 24h · sem treinamento

Best forJornalistas, pesquisadores e produtores fazendo múltiplas entrevistas por semana que precisam de texto rápido e citável sem upload para contratados.

Option 03

Otter / Trint

Transcrição AI com editor orientado para pesquisa. Forte em inglês, preso a planos mensais.

Tempo de retornoTempo real a ~5 min

Precisão em áudio limpo~90–93%

Identificação de oradoresSim · EN-ajustado

IdiomasOtter EN-only · Trint 30+

Custo$17–80/usuário/mês (assinatura)

PrivacidadeArmazenado na conta por padrão

Best forEquipes que querem uma biblioteca hospedada de cada entrevista já gravada e não se importam com taxa de assento mensal por usuário.

Preços e recursos precisos em 2026. Tempo de retorno do Rev human varia com profundidade de fila e duração de áudio.

8 coisas que as pessoas perguntam sobre transcrição de entrevistas.

01Posso usar essas transcrições em um artigo publicado sem verificar contra o áudio?+

Para citações diretas — não, sempre verifique contra o áudio. Transcrições AI com 94% de precisão ainda interpretam mal uma palavra em 17 em média, e a palavra errada em uma citação é uma correção. A transcrição é para navegação e rascunho; o áudio é a fonte da verdade.

02Meu gravador salvou um WAV estéreo com um microfone por orador. O que faço?+

Envie esse arquivo diretamente — não converta para mono primeiro. Detectamos os dois canais e roteamos cada um para sua própria trilha de diarização, que é o caminho de maior precisão que temos. Espere 96%+ em uma sala silenciosa.

03E entrevistas gravadas em uma chamada telefônica?+

Áudio de telefone é 8 kHz narrowband, o que limita precisão a cerca de 88% mesmo em uma linha limpa. Ainda separamos as duas partes usando separação de canal se seu app de gravador as capturou separadamente (a maioria faz). Chamadas VoIP sobre WhatsApp ou Signal soam um pouco melhor que PSTN.

04Posso redigir seções off-the-record antes de compartilhar a transcrição?+

Sim. No editor, selecione o intervalo de tempo e marque como `[REDACTED]`. A exportação substitui o texto por um marcador de redação mas mantém as marcas de tempo para o documento ainda rastrear o áudio.

05Vocês treinam modelos em minhas gravações de entrevista?+

Não. O áudio de origem é deletado de nossa infraestrutura em 24 horas após conclusão, e não usamos gravações de clientes para treinamento de modelos em nenhum plano. O texto da transcrição permanece em sua conta até você deletá-lo.

06Três ou quatro pessoas em uma entrevista de painel — diarização ainda funciona?+

Até cerca de seis vozes distintas, sim, mas precisão em atribuição de orador cai com cada pessoa adicionada e piora quando dois oradores soam similares. Planeje uma passagem de renomeação de 2–3 minutos nos chips de orador após a transcrição chegar.

07Vocês conseguem transcrever entrevistas em idiomas além do inglês?+

99 idiomas, auto-detectados. Code-switching (fonte em inglês escorregando para espanhol no meio da frase) é manipulado em 12 pares de idiomas. Precisão varia por idioma — idiomas europeus correspondem a inglês; idiomas africanos e centro-asiáticos de baixo recurso rodam 5–10 pontos abaixo.

08Gravo em uma chamada do Zoom — devo usar sua página do Zoom em vez disso?+

Mesmo engine, mesmo resultado. A página do Zoom cobre especificidades de cloud-recording (áudio por participante, degradação de dial-in). Se você está conduzindo uma entrevista por vez sobre Zoom, ambos caminhos funcionam — envie o MP4 aqui e os rótulos de orador saem igual.

Transcrição de entrevistas.Métodos diferentes, mesmo resultado.

Drop a file, or pick one

Paste a link, we’ll fetch the audio

Record straight from your browser

Duas vozes entram. Duas vozes saem, identificadas.

This is what loads when the job finishes.

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Rev human. Otter ou Trint. Ou Transcription.Solutions.

Rev human transcription

Transcription.Solutions

Otter / Trint

Três coisas que pegam as pessoas em ferramentas de transcrição genéricas.

O que dá errado

O que alternar aqui

Configurações de job recomendadas para entrevistas

96% em um bom microfone de lapela. Ainda legível em uma gravação de café.

8 coisas que as pessoas perguntam sobre transcrição de entrevistas.

Envie sua gravação de entrevista. Veja o resultado.