Começar grátis

Transcrever
gravações de vozáudio e vídeovídeos do YouTubearquivos de áudioarquivos de vídeovídeos MP4reuniões no ZoomMicrosoft TeamsGoogle Meetentrevistaspodcastsaulasvídeos do TikTokáudios do WhatsAppmemos de vozarquivos MP3ligaçõessermões
em texto. Em segundos

Software de transcrição com IA e conversão de fala em texto para áudio e vídeo. Transforme MP3, MP4 ou voz em texto com identificação de falantes e resumo por IA, normalmente mais rápido que em tempo real.

Solte seu áudio ou vídeo

MP3 · MP4 · WAV · M4A · MOV · até 10 horas por arquivo

Cole um link, buscamos o áudio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · mais de 50

Grave direto do navegador

O cadastro leva 30 segundos — a gravação abre logo em seguida, no painel.

Free 30 min/moSem cartão100+ Mais de 100 idiomasIdentificação de falantes (Pro+)Arquivos apagados automaticamente em 24h

Plano gratuito: 30 minutos por mês, até 30 min por arquivo. Sem cartão.

100+
Idiomas detetados automaticamente
Detecção automática com substituição manual.
95%+
Precisão em áudio limpo
A maioria dos idiomas principais, um ou dois falantes.
10h
Duração máxima de ficheiro no Business
10 h no Pro · 30 min no Free.
~30×
Mais rápido que tempo real
Um arquivo de 60 min costuma voltar em 2–3 min.
Esse é o dashboard

Pode explorar. É a coisa real

As abas funcionam. O toggle de tarefas funciona. É exatamente isso que carrega na sua conta quando um trabalho termina — mesmo layout, mesmos controles.

app.transcription.solutions / jobs / interview-ari-2026-04-26

Resumo

snapshot automático · saved
TL;DR

Fundadores precisam de conteúdo pós-call, não só de transcrição. As ferramentas obrigam a juntar 5 apps.

318words2participantes · 58 / 425tópicos

Principais pontos 3

  • 01Existe uma lacuna entre gravação crua e conteúdo pronto pra publicar
  • 02Show notes, cortes pra redes, rascunho de blog — esperados até a call acabar
  • 03Tooling atual espalhado por mais de 5 apps

O que fazer 2

  • Avaliar pipeline único pra substituir a colcha de retalhos de 5 apps
  • Simula como ficaria o rascunho das show notes a partir desta transcrição
Tópicosfluxo do fundadorconteúdo pós-callfragmentação das ferramentasshow notespipeline único

Transcrição com falantes

4 linhas · 2 oradores · clipe de 30s
00:12Falante AEntão, o que eu não paro de ouvir dos fundadores é essa lacuna entre a gravação crua e o conteúdo que dá pra publicar.
00:27Participante BExatamente. Ninguém quer mais uma transcrição — querem as show notes, o clip, o rascunho do post, antes da call acabar.
00:41Falante APois é, e as ferramentas hoje te obrigam a costurar cinco apps pra chegar lá.
00:54Participante BUm pipeline, um lugar. É essa a aposta.

Análise por interlocutor

Separação por canal estéreo · diarização em mono
Falante A
58% do tempo de fala
2
Turns
14s
Tempo de fala
…essa lacuna entre a gravação bruta e algo que dá pra entregar.
Participante B
42% do tempo de fala
2
Turns
10s
Tempo de fala
Um pipeline, um lugar. É essa a aposta.

Formatos de exportação

Todos os planos, todos os formatos · 7 saídas · sem marca-d'água · TXT · SRT · MD · JSON · VTT · DOCX · PDF
TXT

Texto puro

Texto limpo · todos os planos

SRT

Legenda SubRip

Legenda com timestamps · todos os planos

MD

Markdown

Cabeçalhos por participante + resumo · todos os planos

JSON

JSON estruturado

Schema público · para fluxos via API · todos os planos

VTT

Legenda WebVTT

Formato de player de vídeo HTML5 · em todos os planos

DOCX

Documento Word

Cabeçalhos por orador + timestamps · em todos os planos

PDF

PDF com marca

Pronto para imprimir · resumo e interlocutores · todos os planos

DEMO · SEM SOM
0:18 / 1:00
Saída de exemplo · 30 segundos de um trecho de podcast

Um arquivo. Oito coisas de volta

Passa o rato ou toca em qualquer saída para ver como fica. O mesmo clipe de podcast de 30 segundos ao centro, oito artefactos derivados dele.

Transcrição

Pontuado · com timestamps

00:12 Falante A
O que eu ouço dos founders é sempre esta lacuna…
Resumo com IA

Resumo · tópicos principais

Founders precisam do pós-call conteúdo, não só transcrições. As ferramentas obrigam eles a juntar 5 apps.
Participantes

Identificação de interlocutor · Pro+

Separação por canal estéreo para chamadas a dois. Diarização em mono para o resto.
Mais de 100 idiomas

Detectar automaticamente

ASR de nível profissional. Force um idioma específico se a detecção automática errar.
interview-ari-2026-04-26.mp3
Clipe de 30s · 2 oradores
Mais de 100 idiomas · detecção automática · 95%+ de precisão
Transcrição · janela de 30s
00:12
AO que eu venho ouvindo dos fundadores é essa lacuna.
00:14
AA call acaba, e é aí que começa o trabalho a sério.
00:18
BPois é — o pós-call consome o dia.
00:21
AAs ferramentas tratam a transcrição como se já fosse o entregável.
00:24
AÉ o input.
00:27
BAí você junta cinco apps na mão.
Resumo com IA
Resumo: Founders precisam do pós-call conteúdo, não transcrições cruas. As ferramentas de hoje forçam um fluxo de 5 apps.
Principais pontos
  • Transcript is the input, not the deliverable
  • Tarefas valem mais que texto cru
  • Um pipeline vence o SaaS costurado
Diarização · 2 oradores detetados
Falante A
Participante B
0:000:150:30
Divisão por canal estéreo · 62% / 38% de tempo de fala
Detecção de idioma
Inglês (en-US)99.2%
Outros candidatos
en-GB Inglês (Reino Unido)0.6%
en-AU Inglês (AU)0.2%
Detetado no upload · podes mudar quando quiseres · mais de 100 idiomas
Exportações · 7 formatos · sem marca-d'água
TXT entrevista-ari-2026-04-26.txt34 KB
SRT entrevista-ari-2026-04-26.srt52 KB
VTT interview-ari-2026-04-26.vtt51 KB
MD interview-ari-2026-04-26.md38 KB
JSON interview-ari-2026-04-26.json71 KB
DOCX entrevista-ari-2026-04-26.docx91 KB
PDF entrevista-ari-2026-04-26.pdf146 KB
Importar por link · mais de 1500 sites suportados
youtube.com/watch?v=Hk8L4mD2pXv
Buscar metadados0,3s
Baixar áudio4,2 MB
Extrair a falaestéreo · 44 kHz
Fila para ASR
REC00:42 / 60:00
Safari no iPhone · Chrome no desktop
Para automaticamente em 60 min — para arquivos maiores, faça upload
Estado do job ao vivo
Enviar0:08
Extrair áudio0:02
ASR · AssemblyAI U-247%
Diarizaçãona fila
Resumo com IAna fila
Renderizar exportaçãona fila
Status enviado a cada etapa · sem precisar atualizar
Exportações

7 formatos · sem marca d'água

TXTSRTMDJSONVTTDOCXPDF
Importação por link

YouTube · TikTok · Instagram

Cole qualquer link de vídeo. A gente baixa, transcreve e descarta a fonte.
Gravar pelo navegador

Mic no iPhone Safari · Chrome

Aperte gravar, fale, aperte parar. Sem instalar nada. Até 60 min por gravação.
Progresso em tempo real

Estado do job via WebSocket

Status ao vivo do upload → ASR → identificação de vozes → pronto. Sem ficar dando F5.
Quem está usando

Software de transcrição feito para quem fazer o trabalho de verdade

Três padrões que vemos toda semana. O pipeline não muda — o que você entrega depois dele, sim.

01Podcasters

Episódio show notes publicado

Uma entrevista longa vira um resumo de 5 linhas, quatro capítulos, uma transcrição com falantes identificados e um SRT para clipes curtos — um trabalho, todas as saídas que você de fato publica.

7 formatosTXT · SRT · MD · JSON
VTT · DOCX · PDF
02Pesquisadores

Entrevistas longas, citado por carimbo de tempo

Gravações de Zoom de três horas com duas vozes, do início ao fim. Diarização de oradores no Pro. Cita por timestamp a partir do export em DOCX. Acabou o "onde é que ele disse aquilo…" a fazer scrubbing.

95%+Precisão da ASR
em áudio limpo
03Times pequenos

Gravações tarefas responsáveis

Sem entrar sozinho na reunião, sem acesso ao calendário, sem "agente na sua reunião". Joga a gravação, compartilha a transcrição. Tarefas extraídas, com responsável, prontas para encaminhar.

2,500Minutos por mês
no plano Business
Formas de entrada aceitas

Solte um arquivo, cole um link,
ou use nossa API

Seis caminhos de entrada, funcionando hoje. Cada pílula é uma forma real de envio rodando em produção agora.

YouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooks
Preços

Planos que
encaixam de verdade

Todos os planos incluem ASR com diarização. Planos superiores liberam arquivos maiores, prioridade na fila e resumo por IA.

MensalAnual −50%
Free
$0para sempre
Sem cartão · sem fim de trial

Pra testar, usos pontuais, clipes curtos.

  • 30 minutos por mês
  • Até 30 min por arquivo
  • Todos os 7 formatos de exportação · sem marca d'água
  • Fila de baixa prioridade
Comece grátis →
É preciso verificar o e-mail
Mais popular
Pro
$19$19/ mês
Cancele quando quiser · excedente US$ 0,04 / min

Para quem faz entrevistas, podcasts ou trabalhos longos no dia a dia.

  • 600 minutos por mês
  • Até 10 horas por ficheiro
  • Falantes identificados + resumo por IA
  • Tarefas + tags de tópico
  • Polimento de parágrafo “deixar legível”
  • Tradução · entrega de webhook
  • Prioridade padrão na fila
Escolher Pro →
Excedente US$ 0,04 / min · cancele quando quiser
Business
$49$49/ mês
Cancele quando quiser · excedente US$ 0,02 / min

Para times, agências e operações com volume.

  • 2.500 minutos por mês
  • Até 10 horas por arquivo
  • Tudo do Pro · 50 traduções / mês
  • Fila prioritária
  • API REST pública · limite de requisições por chave
  • Suporte prioritário por e-mail
Escolher Business →
Excedente US$ 0,02 / min · cancele quando quiser

Cobrança anual economiza 50% · Política de reembolso · Sem cartão no plano Free

Mesmo áudio · dois resultados

O Free te dá as palavras.
Pro entrega resultado pronto.

Mesmo áudio, mesmo modelo. A diferença está em tudo que fazemos depois que a transcrição termina.

Saída no Free

Então, o que eu não paro de ouvir dos fundadores é essa lacuna entre a gravação crua e o conteúdo que dá pra publicar. Exato, ninguém quer mais uma transcrição, quer um show note, um corte, um rascunho de blog até a call terminar. Pois é, e as ferramentas hoje obrigam você a costurar cinco apps pra chegar lá. Um pipeline, um lugar. É essa a aposta. A gente vê esse padrão há meses — o áudio chega limpo, mas o fluxo depois fica preso a screenshots e copia-e-cola entre Notion, Otter, Zapier e qualquer outra coisa aberta noutro separador quando a call acaba e o prazo é daqui a vinte minutos…

Transcrição simplesSem identificação de oradoresSem resumoTodos os 7 formatos

Depois: colar em algum lugar, estruturar, escrever o resumo na mão, tirar as tarefas uma a uma.

Saída no Pro
TL;DR

Founders não precisam de transcrições — precisam de pós-processamento. Um pipeline ganha a juntar cinco apps com fita-cola.

00:12 Falante AEntão, o que eu não paro de ouvir dos fundadores é essa lacuna entre a gravação crua e o conteúdo que dá pra publicar.
00:27 Participante BExatamente. Ninguém quer mais uma transcrição — querem as show notes, o clip, o rascunho do post, antes da call acabar.
00:41 Falante APois é, e as ferramentas hoje te obrigam a costurar cinco apps pra chegar lá.
00:54 Participante BUm pipeline, um lugar. É essa a aposta.
Tarefas · 2
  1. Experimente um pipeline unificado — áudio entra, notas e exportações saem, num job só.
  2. Substitua a pilha Otter + Notion + Zapier antes da próxima call.
TL;DR · 1 linhaOradores · diarizadosTarefas · 2Polimento “tornar legível”

Depois: cola o TL;DR no Slack, anexa o DOCX no e-mail, manda o corte. Tudo pronto antes da reunião esfriar.

— Mesmo áudio · Mesmo modelo · A diferença está no pós-processamento —

Na prática

O que os usuários não se cala about

Avaliações espontâneas de usuários logados. Não fazemos campanhas com recompensa por avaliação. Passe o mouse para pausar.

MR
Maya Reyes
@mayarcuts · podcaster

Podcaster abre 5 abas para publicar um episódio. Um trabalho entra — show notes, transcrição, SRT pronto para cortes. É isto.

18 abr1 entrada
DA
Dr. Diego Alarcón
@diegoalarcon · pesquisador

14 entrevistas longas com identificação de quem fala. DER 0,95 em áudio limpo é real. Os exports em DOCX vão direto para o rascunho do paper.

22 abrDER 0,95
SO
Sora Okafor
@sorawrites · writer

26 áudios. 3 links do TikTok. Esboço da newsletter em 11 minutos. Tenta bater isso com o Otter — espero sentado.

19 abr11 min
MR
Maya Reyes
@mayarcuts · podcaster

Podcaster abre 5 abas para publicar um episódio. Um trabalho entra — show notes, transcrição, SRT pronto para cortes. É isto.

18 abr1 entrada
DA
Dr. Diego Alarcón
@diegoalarcon · pesquisador

14 entrevistas longas com identificação de quem fala. DER 0,95 em áudio limpo é real. Os exports em DOCX vão direto para o rascunho do paper.

22 abrDER 0,95
SO
Sora Okafor
@sorawrites · writer

26 áudios. 3 links do TikTok. Esboço da newsletter em 11 minutos. Tenta bater isso com o Otter — espero sentado.

19 abr11 min
JV
Jules Verstappen
@julesverops · ops

Webhook + extração de tarefas matou aquela nossa doc de recap semanal. O loop inteiro agora 2 minutos agora.

23 abrLoop de 2 min
RK
Rohan Kapoor
@rohan_legal · jurídico

Gravações de depoimento → transcrição com falantes → PDF com citações. Antes terceirizávamos isso lá fora. Agora um upload.

24 de abr.1 upload
EM
Elena Marchetti
@elenamarch · vendas

Reuniões de vendas em italiano → resumos em inglês. Minha equipe finalmente lê tudo. Detalhe pequeno, impacto enorme.

27 abrIT → EN
JV
Jules Verstappen
@julesverops · ops

Webhook + extração de tarefas matou aquela nossa doc de recap semanal. O loop inteiro agora 2 minutos agora.

23 abrLoop de 2 min
RK
Rohan Kapoor
@rohan_legal · jurídico

Gravações de depoimento → transcrição com falantes → PDF com citações. Antes terceirizávamos isso lá fora. Agora um upload.

24 de abr.1 upload
EM
Elena Marchetti
@elenamarch · vendas

Reuniões de vendas em italiano → resumos em inglês. Minha equipe finalmente lê tudo. Detalhe pequeno, impacto enorme.

27 abrIT → EN
TN
Tomi Nakamura
@tominaka · tradutor

Detecção automática de japonês simplesmente funciona. Já o itálico serifado deste site é um crime de design à parte que até respeito.

21 abrdetecção automática
PL
Priya Lakshmi
@priyalbuilds · fundadora

API REST + rate-limit por chave = nosso pipeline interno de memos de voz. Levou 30 minutos para integrar. US$ 19/mês para o time inteiro.

25 abr19 USD/mês
FA
Fatima Al-Rashid
@fatima_writes · jornalista

A exclusão automática em 24h é a função que eu não sabia que queria até ver a página de privacidade de cada concorrente.

26 de abr.Eliminação em 24h
TN
Tomi Nakamura
@tominaka · tradutor

Detecção automática de japonês simplesmente funciona. Já o itálico serifado deste site é um crime de design à parte que até respeito.

21 abrdetecção automática
PL
Priya Lakshmi
@priyalbuilds · fundadora

API REST + rate-limit por chave = nosso pipeline interno de memos de voz. Levou 30 minutos para integrar. US$ 19/mês para o time inteiro.

25 abr19 USD/mês
FA
Fatima Al-Rashid
@fatima_writes · jornalista

A exclusão automática em 24h é a função que eu não sabia que queria até ver a página de privacidade de cada concorrente.

26 de abr.Eliminação em 24h
Perguntas frequentes

Perguntas que aparecem de verdade ask

Quão precisa é a transcrição?+

Em áudio limpo com um ou dois falantes, a precisão chega a 95%+ na maioria dos idiomas principais. A qualidade cai com ruído de fundo, sotaques carregados ou falas sobrepostas.

Quais idiomas?+

Mais de 100 idiomas com detecção automática. Você também pode forçar um idioma específico se a detecção automática errar. A interface só está em inglês — versão multi-idioma está no roadmap.

Por quanto tempo vocês guardam meus arquivos?+

A mídia original (o áudio/vídeo enviado) é excluída da nossa infraestrutura em até 24 horas após o fim da transcrição. A transcrição e o resumo ficam na sua conta até você apagá-los — ou 30 dias depois de excluir sua conta. Nossos provedores de fala-em-texto (AssemblyAI principal, OpenAI fallback) processam o áudio sob suas próprias políticas de retenção — veja /privacy para a lista completa de subprocessadores.

Vocês treinam modelos com minhas gravações?+

Não. Nosso provedor de ASR tem opt-out de treinamento por padrão nos endpoints pagos — usamos esses. Não adicionamos nada por cima: nenhum modelo próprio treinado com suas transcrições, nenhuma análise oculta.

E se um job falhar?+

Seus créditos não são descontados. A maioria das falhas (URL privado, arquivo muito longo, codec não suportado) vem com uma mensagem de erro clara e instruções para tentar de novo.

Posso cancelar?+

Sim — a qualquer momento no portal do Stripe. Você mantém o plano até o fim do período pago e depois cai para o Free na próxima data de renovação.

Qual é a política de reembolso?+

Reembolso integral em até 7 dias se você usou menos de 10% dos minutos do plano. Depois disso, reembolso proporcional ao que sobrou. Escreva para [email protected].

Vocês têm API?+

Sim — a REST API está no ar, webhooks também. Auth por chave de API está na fila. Limites de uso por plano. Documentação em /docs/api depois que você criar a conta.

Segurança e privacidade

A parte chata, resolvido

Sem selo SOC 2. Se ainda não entregamos o controle, não colocamos o crachá.

100%
Eliminação automática
dos arquivos originais em 24 horas, sempre
0
Trackers · anúncios · revenda
Seu áudio nunca é usado para treinar modelos
1×
Clica para eliminar
Conta e todos os dados removidos em até 30 dias

Arquivos originais apagados em 24h

Áudio e vídeo que você envia somem em até 24 horas após o término do processamento. Contrato firme, não uma configuração.

Não treinamos com seus dados

O provedor de ASR já tem opt-out de treinamento por padrão — usamos esses endpoints. Não acrescentamos nada por cima.

AES-256 + TLS 1.3

Criptografia em repouso e em trânsito, desde o primeiro dia. HSTS ativo.

Conforme ao GDPR

Direitos de acesso, exclusão e portabilidade da UE respeitados. DPA mediante solicitação.

Exclusão com um clique

Definições → Eliminar conta. Todos os dados apagados em 30 dias. Sem abrir ticket de suporte.

Lista de subprocessadores

Lista completa de fornecedores com a finalidade em /privacy. Sem fornecedores escondidos.

— QUANDO VOCÊ QUISER

Solte um arquivo.
Receba uma transcrição
antes do café esfriar

30 minutos grátis por mês, até 30 min por arquivo. Sem cartão de crédito, sem cobrar depois do trial, sem letrinhas miúdas. Cancele qualquer plano a qualquer momento, em um clique.

Grátis / mês30 min
Idiomas100+
Formatos de exportação7
MP3MP4WAVM4AMOVMKVWEBMYOUTUBETIKTOKINSTAGRAMGRAVAR NO NAVEGADOR