Comece grátis

Transcrever
gravações de vozáudio e vídeovídeos do YouTubearquivos de áudioarquivos de vídeovídeos MP4reuniões do ZoomMicrosoft TeamsGoogle Meetentrevistaspodcastsaulasvídeos do TikTokáudios do WhatsAppmemos de vozarquivos MP3ligaçõessermões
em texto. Em segundos

Obtenha uma transcrição limpa com identificação de falantes e resumo com IA, mais rápido que o tempo real.

Solte seu áudio ou vídeo

MP3 · MP4 · WAV · M4A · MOV · até 10 horas por arquivo

Cole o link, a gente baixa o áudio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · +50 outros

Grave diretamente do seu navegador

O cadastro leva 30 segundos — a gravação abre logo após, no painel.

Grátis 30 min/moSem cartão100+ 100+ idiomasIdentificação de falantes (Pro+)Arquivos são excluídos automaticamente em 24h

Plano gratuito: 30 minutos por mês, até 30 min por arquivo. Sem cartão obrigatório.

100+
Idiomas detectados automaticamente
Detecção automática com opção manual.
95%+
Precisão em áudio limpo
Principais idiomas, um ou dois falantes.
10h
Tamanho máximo de arquivo no Business
10 h no Pro · 30 min no Free.
~30×
Mais rápido que o tempo real
Um arquivo de 60 min geralmente fica pronto em 2–3 min.
Este é o painel

Clique por aí. É a coisa real

As abas funcionam. Os itens de ação alternam. É exatamente o que carrega na sua conta após um trabalho terminar — mesma disposição, mesmos controles.

app.transcription.solutions / jobs / entrevista-ari-2026-04-26

Resumo

instantâneo automático · saved
TL;DR

Fundadores precisam de conteúdo pós-chamada, não apenas transcrições. As ferramentas os forçam a juntar 5 aplicativos.

318words2falantes · 58 / 425tópicos

Pontos principais 3

  • 01Existe uma lacuna entre gravações brutas e conteúdo publicável
  • 02Notas de show, clipes para redes sociais, rascunhos de blog — esperados até o final da chamada
  • 03Ferramentas atuais fragmentadas em mais de 5 aplicativos

Itens de ação 2

  • Investigar abordagem de pipeline único para substituir a costura de 5 aplicativos
  • Simular como seria um rascunho de nota de show a partir desta transcrição
Tópicosfluxo de trabalho do fundadorconteúdo pós-chamadafragmentação de ferramentasnotas de showpipeline único

Transcrição com diarização

4 linhas · 2 falantes · clipe de 30s
00:12Falante AEntão, o que eu continuo ouvindo dos fundadores é essa lacuna entre gravações brutas e conteúdo que você pode realmente publicar.
00:27Falante BExatamente. Ninguém quer outra transcrição — eles querem uma nota de show, um clipe, um rascunho de blog, até o final da chamada.
00:41Falante ACerto, e as ferramentas agora forçam você a juntar cinco aplicativos para chegar lá.
00:54Falante BUm pipeline, um lugar. Essa é a aposta.

Análise de falantes

Divisão de canal estéreo · diarização em mono
Falante A
58% de tempo de fala
2
Turns
14s
Tempo de fala
…essa lacuna entre gravações brutas e conteúdo que você pode realmente publicar.
Falante B
42% de tempo de fala
2
Turns
10s
Tempo de fala
Um pipeline, um lugar. Essa é a aposta.

Formatos de exportação

Todo plano, todo formato · 7 saídas · sem marcas d'água · TXT · SRT · MD · JSON · VTT · DOCX · PDF
TXT

Texto simples

Extrair texto limpo · todos os planos

SRT

Legenda SubRip

Legenda com timestamps · todos os planos

MD

Markdown

Cabeçalhos de falantes + resumo · todos os planos

JSON

JSON estruturado

Esquema público · para fluxos de API · todos os planos

VTT

Legenda WebVTT

Formato de player de vídeo HTML5 · todos os planos

DOCX

Documento Word

Cabeçalhos de falantes + timestamps · todos os planos

PDF

PDF com marca

Pronto para impressão · resumo e falantes · todos os planos

DEMO · MUDO
0:18 / 1:00
Saída de amostra · 30 segundos de um clipe de podcast

Um arquivo. Oito coisas de volta

Passe o mouse ou toque em qualquer saída para ver como ela realmente se parece. Mesmo clipe de podcast de 30 segundos no centro, oito artefatos derivados dele.

Transcrição

Pontuado · com timestamp

00:12 Falante A
Então, o que eu continuo ouvindo dos fundadores é essa lacuna…
Resumo com IA

TL;DR · pontos principais

Fundadores precisam de conteúdo pós-chamada conteúdo, não apenas transcrições. As ferramentas os forçam a juntar 5 aplicativos.
Falantes

Diarização · Pro+

Divisão de canal estéreo para chamadas de duas pessoas. Diarização mono para todo o resto.
100+ idiomas

Detecção automática

ASR de nível de pesquisa. Force um idioma específico se a detecção automática escolher o errado.
entrevista-ari-2026-04-26.mp3
Clipe de 30 segundos · 2 falantes
100+ idiomas · detecção automática · 95%+ de precisão
Transcrição · janela de 30s
00:12
AEntão, o que eu continuo ouvindo dos fundadores é essa lacuna.
00:14
AA chamada termina, o trabalho real começa.
00:18
BCerto — o pós-chamada consome o dia.
00:21
AAs ferramentas presumem que a transcrição é o entregável.
00:24
AÉ a entrada.
00:27
BEntão você junta cinco aplicativos manualmente.
Resumo com IA
TL;DR: Fundadores precisam de conteúdo pós-chamada conteúdo, não transcrições brutas. As ferramentas de hoje forçam um fluxo de 5 aplicativos.
Pontos principais
  • Transcrição é a entrada, não o entregável
  • Itens de ação vencem texto bruto
  • Um pipeline vence SaaS costurado
Diarização · 2 falantes detectados
Falante A
Falante B
0:000:150:30
Divisão de canal estéreo · 62% / 38% de participação na fala
Detecção de idioma
Inglês (en-US)99.2%
Outros candidatos
en-GB Inglês (Reino Unido)0.6%
en-AU Inglês (Austrália)0.2%
Detectado no upload · substitua a qualquer momento · 100+ idiomas
Exportações · 7 formatos · sem marcas d'água
TXT entrevista-ari-2026-04-26.txt34 KB
SRT entrevista-ari-2026-04-26.srt52 KB
VTT entrevista-ari-2026-04-26.vtt51 KB
MD entrevista-ari-2026-04-26.md38 KB
JSON entrevista-ari-2026-04-26.json71 KB
DOCX entrevista-ari-2026-04-26.docx91 KB
PDF entrevista-ari-2026-04-26.pdf146 KB
Ingestão de URL · mais de 1500 sites compatíveis
youtube.com/watch?v=Hk8L4mD2pXv
Buscar metadados0,3s
Baixar áudio4,2 MB
Extrair falaestéreo · 44 kHz
Fila para ASR
REC00:42 / 60:00
Safari no iPhone · Chrome no desktop
Para automaticamente aos 60 min — envie arquivos mais longos
Status do trabalho ao vivo
Upload0:08
Extrair áudio0:02
ASR · AssemblyAI U-247%
Diarizaçãona fila
Resumo com IAna fila
Renderizar exportaçãona fila
Status enviado passo a passo · sem necessidade de atualização
Exportações

7 formatos · sem marcas d'água

TXTSRTMDJSONVTTDOCXPDF
Ingestão de URL

YouTube · TikTok · Instagram

Cole qualquer link de vídeo. Baixamos, transcrevemos e descartamos a origem uma vez.
Gravação no navegador

Microfone no iPhone Safari · Chrome

Aperte gravar, fale, aperte parar. Sem instalação de aplicativo. Até 60 min por gravação.
Progresso em tempo real

Status do trabalho via WebSocket

Status ao vivo do upload → ASR → diarização → concluído. Sem consultas, sem esperar no escuro.
Quem está usando isso

Criado para as pessoas que realmente fazem o trabalho

Três padrões que vemos semanalmente. O pipeline não muda — o que você entrega depois, sim.

01Podcasters

Episódio notas de show entregue

Uma longa entrevista se torna um resumo de 5 linhas, quatro capítulos, uma transcrição com identificação de falantes e um SRT para clipes curtos — um trabalho, cada saída que você realmente entrega.

7 formatosTXT · SRT · MD · JSON
VTT · DOCX · PDF
02Pesquisadores

Entrevistas longas, citadas por timestamp

Gravações de três horas do Zoom com duas vozes, de ponta a ponta. Diarização de falantes no Pro. Cite por timestamp a partir da exportação DOCX. Sem mais "onde foi que ele disse aquilo…" rebobinando.

95%+Precisão ASR
em áudio limpo
03Pequenas equipes

Gravações itens de ação responsáveis

Sem auto-join, sem permissões de calendário, sem "agente na sua reunião." Solte a gravação, compartilhe a transcrição. Itens de ação extraídos, nomeados, prontos para triagem.

2,500Minutos por mês
no plano Business
Entradas que aceitamos

Solte um arquivo, cole um link
ou chame nossa API

Seis formas de entrada, funcionando hoje. Cada pílula é um caminho de ingestão real que é enviado em produção agora.

YouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooks
Preços

Planos que
realmente encaixam

Todos os planos incluem ASR com qualidade de diarização. Níveis mais altos desbloqueiam arquivos maiores, prioridade de fila e resumo com IA.

MensalAnual −50%
Free
$0para sempre
Sem cartão · sem expiração de teste

Para experimentar, usos ocasionais, clipes curtos.

  • 30 minutos por mês
  • Até 30 min por arquivo
  • Todos os 7 formatos de exportação · sem marcas d'água
  • Fila de baixa prioridade
Comece grátis →
Verificação de e-mail necessária
Mais popular
Pro
$19$19/ mês
Cancele quando quiser · $0,04 / min excedente

Para pessoas que fazem entrevistas, podcasts ou trabalho repetido de formato longo.

  • 600 minutos por mês
  • Até 60 min por arquivo
  • Identificação de falantes + resumo com IA
  • Itens de ação + tags de tópico
  • Polimento "Tornar legível" de parágrafos
  • Tradução · entrega por webhook
  • Prioridade de fila padrão
Escolha Pro →
Excedente $0,04 / min · cancele quando quiser
Business
$49$49/ mês
Cancele quando quiser · $0,02 / min excedente

Para equipes, agências e operações que trabalham com volume.

  • 2.500 minutos por mês
  • Até 4 horas por arquivo
  • Tudo do Pro · 50 traduções / mês
  • Fila de alta prioridade
  • API REST pública · nível de limite de taxa por chave
  • Suporte por e-mail prioritário
Escolha Business →
Excedente $0,02 / min · cancele quando quiser

Faturamento anual economiza 50% · Política de reembolso · Sem cartão obrigatório para Gratuito

Mesmo áudio · duas saídas

Grátis dá a você palavras.
Pro entrega resultados.

Mesmo áudio, mesmo modelo. A diferença é tudo que fazemos após a transcrição terminar.

Saída gratuita

Então, o que eu continuo ouvindo dos fundadores é essa lacuna entre gravações brutas e o conteúdo que eles podem realmente publicar. Exatamente, ninguém quer outra transcrição, eles querem uma nota de show, um clipe, um rascunho de blog, até o final da chamada. Certo, e as ferramentas agora forçam você a juntar cinco aplicativos para chegar lá. Um pipeline, um lugar. Essa é a aposta. Temos visto esse padrão por meses — o áudio entra limpo, mas o fluxo de trabalho a jusante é mantido com capturas de tela e copiar-colar entre o Notion e o Otter e o Zapier e o que mais estiver aberto em outra aba quando a chamada termina e o prazo é em vinte minutos…

Transcrição simplesSem identificação de falantesSem resumoTodos os 7 formatos

Próximo: cole em algum lugar, estruture, escreva o resumo você mesmo, extraia itens de ação manualmente.

Saída Pro
TL;DR

Fundadores não precisam de transcrições — eles precisam de pós-processamento. Um pipeline vence a costura de cinco aplicativos.

00:12 Falante AEntão, o que eu continuo ouvindo dos fundadores é essa lacuna entre gravações brutas e conteúdo que você pode realmente publicar.
00:27 Falante BExatamente. Ninguém quer outra transcrição — eles querem uma nota de show, um clipe, um rascunho de blog, até o final da chamada.
00:41 Falante ACerto, e as ferramentas agora forçam você a juntar cinco aplicativos para chegar lá.
00:54 Falante BUm pipeline, um lugar. Essa é a aposta.
Itens de ação · 2
  1. Experimente um pipeline unificado — áudio entra, notas e exportações saem, um trabalho.
  2. Substitua a pilha Otter + Notion + Zapier antes da próxima chamada.
TL;DR · 1 linhaFalantes · com diarizaçãoItens de ação · 2Polimento "Tornar legível"

Próximo: copie o TL;DR no Slack, anexe o DOCX ao e-mail, envie o clipe. Feito antes que as notas da chamada esfriem.

— Mesmo áudio · Mesmo modelo · A diferença está no pós-processamento —

Em ação

O que nossos usuários não param de falar about

Avaliações não solicitadas de usuários logados. Não realizamos campanhas de incentivo a avaliações. Passe o mouse para pausar.

MR
Maya Reyes
@mayarcuts · podcaster

Podcaster abre 5 abas para enviar um episódio. Um trabalho no — notas de show, transcrição, SRT pronto para clipe. Só isso.

18 de abril1 trabalho no
DA
Dr. Diego Alarcón
@diegoalarcon · pesquisador

14 entrevistas longas com diarização. DER 0,95 em áudio limpo é real. Exportações DOCX vão direto para o rascunho do artigo.

22 de abrilDER 0,95
SO
Sora Okafor
@sorawrites · escritor

26 notas de voz. 3 URLs do TikTok. Esboço de newsletter em 11 minutos. Tente superar isso com o Otter — vou esperar.

19 de abril11 min
MR
Maya Reyes
@mayarcuts · podcaster

Podcaster abre 5 abas para enviar um episódio. Um trabalho no — notas de show, transcrição, SRT pronto para clipe. Só isso.

18 de abril1 trabalho no
DA
Dr. Diego Alarcón
@diegoalarcon · pesquisador

14 entrevistas longas com diarização. DER 0,95 em áudio limpo é real. Exportações DOCX vão direto para o rascunho do artigo.

22 de abrilDER 0,95
SO
Sora Okafor
@sorawrites · escritor

26 notas de voz. 3 URLs do TikTok. Esboço de newsletter em 11 minutos. Tente superar isso com o Otter — vou esperar.

19 de abril11 min
JV
Jules Verstappen
@julesverops · operações

Webhook + extração de itens de ação matou nosso documento de resumo semanal. O loop inteiro é 2 minutos agora.

23 de abrilloop de 2 min
RK
Rohan Kapoor
@rohan_legal · consultor jurídico

Gravações de depoimento → transcrição diarizada → PDF citado. Antes terceirizávamos isso no exterior. Agora é um upload.

24 de abril1 upload
EM
Elena Marchetti
@elenamarch · vendas

Ligações de vendas em italiano → resumos em inglês. Minha equipe finalmente os lê. Pequeno detalhe, enorme impacto.

27 de abrilIT → EN
JV
Jules Verstappen
@julesverops · operações

Webhook + extração de itens de ação matou nosso documento de resumo semanal. O loop inteiro é 2 minutos agora.

23 de abrilloop de 2 min
RK
Rohan Kapoor
@rohan_legal · consultor jurídico

Gravações de depoimento → transcrição diarizada → PDF citado. Antes terceirizávamos isso no exterior. Agora é um upload.

24 de abril1 upload
EM
Elena Marchetti
@elenamarch · vendas

Ligações de vendas em italiano → resumos em inglês. Minha equipe finalmente os lê. Pequeno detalhe, enorme impacto.

27 de abrilIT → EN
TN
Tomi Nakamura
@tominaka · tradutor

Detecção automática de japonês simplesmente funciona. A fonte itálica serifada neste site é, no entanto, um crime de design não relacionado que respeito.

21 de abrildetecção automática
PL
Priya Lakshmi
@priyalbuilds · fundadora

API REST + limite de taxa por chave = nosso pipeline interno de notas de voz. Levou 30 minutos para conectar. $19/mês para toda a equipe.

25 de abril$19/mês
FA
Fatima Al-Rashid
@fatima_writes · jornalista

Exclusão automática em 24h é o recurso que eu não sabia que queria até verificar a página de privacidade de cada concorrente.

26 de abrilexclusão em 24h
TN
Tomi Nakamura
@tominaka · tradutor

Detecção automática de japonês simplesmente funciona. A fonte itálica serifada neste site é, no entanto, um crime de design não relacionado que respeito.

21 de abrildetecção automática
PL
Priya Lakshmi
@priyalbuilds · fundadora

API REST + limite de taxa por chave = nosso pipeline interno de notas de voz. Levou 30 minutos para conectar. $19/mês para toda a equipe.

25 de abril$19/mês
FA
Fatima Al-Rashid
@fatima_writes · jornalista

Exclusão automática em 24h é o recurso que eu não sabia que queria até verificar a página de privacidade de cada concorrente.

26 de abrilexclusão em 24h
Perguntas frequentes

Perguntas que as pessoas realmente ask

Qual é a precisão da transcrição?+

Em áudio claro com um ou dois falantes, a precisão atinge 95%+ na maioria dos idiomas principais. A qualidade cai com ruído de fundo, sotaques pesados ou fala sobreposta.

Quais idiomas?+

100+ idiomas com detecção automática. Você também pode forçar um idioma específico se a detecção automática escolher o errado. A interface é apenas em inglês — interface multilíngue está na lista de planejados.

Por quanto tempo vocês mantêm meus arquivos?+

A mídia de origem (o áudio/vídeo que você enviou) é excluída de nossa infraestrutura dentro de 24 horas após a conclusão da transcrição. A transcrição e o resumo permanecem em sua conta até que você os exclua — ou 30 dias após você excluir sua conta. Nossos provedores de transcrição de fala para texto (AssemblyAI primário, OpenAI substituto) processam áudio sob suas próprias políticas de retenção — veja /privacidade para a lista completa de subprocessadores.

Vocês treinam modelos com minhas gravações?+

Não. Nosso provedor ASR upstream tem opt-out de treinamento por padrão para endpoints pagos — nós os usamos. Não adicionamos nada além: nenhum modelo próprio treinado em suas transcrições, nenhuma análise oculta.

O que acontece se um trabalho falhar?+

Seus minutos não são descontados. A maioria das falhas (URL privada, arquivo muito longo, codec que não suportamos) vem com uma mensagem de erro clara e orientação para repetir.

Posso cancelar?+

Sim — a qualquer momento no portal do cliente Stripe. Você mantém seu plano durante o período pago e depois cai para Gratuito na próxima data de renovação.

Qual é a política de reembolso?+

Reembolso total em até 7 dias se você usou menos de 10% dos minutos do seu plano. Após isso, reembolsos proporcionais pela parte não utilizada. Envie e-mail para support@transcription.solutions.

Vocês têm API?+

Sim — API REST ativa, webhooks também. Autenticação por chave de API está na próxima lista. Limites de taxa por nível de plano. Documentos em /docs/api assim que você tiver uma conta.

Segurança e privacidade

O básico, resolvido

Nada de selo SOC 2. Se ainda não implementamos um controle, não colocamos um badge.

100%
Exclusão automática
de arquivos de origem dentro de 24 horas, sempre
0
Rastreadores · anúncios · revenda
Seu áudio nunca é usado para treinar modelos
1×
Clique para excluir
Conta + todos os dados apagados em até 30 dias

Arquivos de origem apagados em 24h

O áudio e vídeo que você envia desaparecem em 24 horas após a conclusão do trabalho. Contrato firme, não uma configuração.

Sem treinamento com seus dados

O provedor ASR upstream tem opt-out de treinamento por padrão — usamos esses endpoints. Não adicionamos nada além.

AES-256 + TLS 1.3

Criptografia em repouso e em trânsito, desde o primeiro dia. HSTS aplicado.

Alinhado ao GDPR

Direitos de acesso / exclusão / portabilidade da UE respeitados. DPA sob solicitação.

Exclusão com um clique

Configurações → Excluir conta. Todos os dados apagados em até 30 dias. Nenhum ticket de suporte necessário.

Lista de subprocessadores

Lista completa de fornecedores com finalidade em /privacidade. Sem fornecedores surpresa.

— PRONTO QUANDO VOCÊ ESTIVER

Solte um arquivo.
Obtenha uma transcrição
antes que seu café esfrie

30 minutos grátis por mês, até 30 min por arquivo. Sem cartão de crédito, sem cartão após teste, sem asteriscos. Cancele qualquer plano a qualquer momento com um clique.

Grátis / mês30 min
Idiomas100+
Formatos de exportação7
MP3MP4WAVM4AMOVMKVWEBMYOUTUBETIKTOKINSTAGRAMGRAVAÇÃO NO NAVEGADOR