Notas de voz a texto.iPhone, Android, cualquier app.

Carga la nota de voz desde tu teléfono. Leemos M4A, AAC y MP3 directo de iPhone Voice Memos, Android Recorder o cualquier app de dictado — sin conversión, sin sincronización de escritorio.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Mira qué sale

Nota de voz dentro. Transcripción buscable afuera.

Las notas de voz suelen ser una persona pensando en voz alta con micrófono imperfectamente colocado. Optimizamos para dictado en solitario de manera predeterminada, e activamos diarización cuando escuchamos una segunda voz.

iPhone Voice Memos · M4AREC Dictado solo · 4:12
auto-detected en-US44.1 kHz mono · AAC 64 kbps
~90s
Transcripción · en transmisión95% de precisión
S1

Idea para la pieza del martes — abre con la respuesta FOIA, no con la demanda.

S1

El PDF de 217 páginas es el lede. Cita el párrafo redactado en página 84.

S1

Luego pasa al voto del consejo. Necesito devolver la llamada a Reyes antes de las 5pm.

S1

Título provisional — 'Lo que las redacciones nos dicen.' Guárdalo, vuelve mañana.

95% en dictado cerca del micrófonoDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tres opciones reales · comparación honesta

Lo integrado en Apple. Otter mobile. O nosotros.

iOS 18 agregó transcripción dentro de Voice Memos. Otter tiene grabadora móvil. Ambas funcionan — hasta que la nota de voz es larga, multilingüe, o quieres un archivo que realmente puedas exportar. Empezamos desde lo que la app de grabación guardó.

Option 01

Transcripción de Apple Voice Memos

Integrado en iOS 18+ Voice Memos. Solo en iPhones recientes, enfocado en inglés, sin exportación.

RequiereiPhone 12+ en iOS 18
Etiquetas de hablanteNo
IdiomasEN, ES, FR, DE, JA, ZH
ExportarCopiar/pegar solo
Notas antiguasReprocesar una a la vez
CostoGratis con hardware
Best forUsuarios solo de iPhone en dispositivo nuevo que solo necesitan revisar una nota a la vez.
Option 02

Transcription.Solutions

Comparte cualquier nota desde iOS o Android. Obtén DOCX, SRT, TXT — y etiquetas de hablante cuando hay dos voces.

RequiereNada — funciona en compartir
Etiquetas de hablanteSí (Pro / Business)
Idiomas99, detección automática
ExportarDOCX · SRT · TXT · JSON
Notas antiguasCarga en lote desde Archivos
Costo · por min$0.03
Best forCualquiera con muchas notas sin procesar, dispositivos mixtos, dictado en otros idiomas, o notas que necesitan llegar a Word o un CMS.
Option 03

Otter mobile / Google Recorder

Graba en su app o no funciona. No lee notas que ya capturaste en otro lugar.

RequiereGrabación dentro de su app
Etiquetas de hablanteAcústica, optimizado EN
IdiomasEN principalmente · Google agrega algunos
Archivos M4A existentesOtter gratis: sin carga
Límite mensual300 min gratis (Otter)
Costo$17/mes (Otter Pro)
Best forPersonas empezando desde cero que no les importa cambiar a una nueva app grabadora para cada nota.

Precios y características precisos a partir de mayo de 2026. La transcripción de Apple Voice Memos se lanzó con iOS 18 a finales de 2024.

Específico para notas de voz

Tres cosas que arruinan las notas grabadas en teléfono.

Nada de esto es sobre la IA. Se trata de dónde estaba el teléfono cuando presionaste grabar.

Qué sale mal

  1. 1Grabaciones en bolsa. La tela en el micrófono crea un zumbido de baja frecuencia que enmascara consonantes. El modelo escucha 'sh' donde dijiste 's'.
  2. 2Plosivas por hablar muy cerca. Sostener el teléfono como micrófono pone los pops de P y B directamente en el diafragma. Las palabras justo después del pop se pierden.
  3. 3Silencios prolongados mientras piensas. Los reconocedores genéricos alucinan relleno ('you know', 'I mean') en pausas de 3+ segundos. Se ve bien, pero no es lo que dijiste.

Qué ajustar aquí

  1. 1Detectamos automáticamente notas de ruido de tela mono y aplicamos un filtro paso-alto antes del reconocimiento. También puedes activar 'Grabación en bolsa' en el formulario de trabajo.
  2. 2Sostén el teléfono al lado de tu boca, no al frente, o usa auriculares con micrófono. Luego establece Modelo de hablante: Dictado solo — salta la diarización completamente.
  3. 3Activa Suprimir alucinaciones en silencio y el modelo no emite nada durante pausas largas en lugar de inventar discurso. Tus pausas se mantienen como pausas.

Configuración de trabajo recomendada para notas de voz

Carga un M4A o AAC y estos se activan automáticamente. Anula por trabajo desde el formulario.

Modelo de hablante
Dictado solo (cambio automático si hay 2ª voz)
Diarización
Apagada de manera predeterminada · activada para entrevistas
Idioma
Detección automática · 99 soportados
Palabras de relleno
Removidas de manera predeterminada
Manejo de silencios
Suprimir alucinaciones en pausas
Exportar
DOCX · TXT · SRT con marca de tiempo

Accuracy · real-world numbers

95%+ en dictado cerca del micrófono. Hasta 78% en la bolsa de tu chamarra.

Las notas de voz son principalmente un problema de colocación del micrófono, no de calidad de audio. Los micrófonos de teléfono son buenos — la tela, el viento y una bolsa no lo son. Los números a continuación provienen de notas reales de clientes, no de archivos de laboratorio.

95%+
Dictado en solitario cerca del micrófono

Teléfono a 6-12 pulgadas de tu cara, sala silenciosa. Micrófono principal de iPhone o Pixel. Caso más limpio — las notas de periodistas y escritores llegan aquí.

92%
Nota en solitario, ruido ambiental ligero

Zumbido de café, HVAC, una sirena pasando. Teléfono sobre el escritorio enfrente de ti. Las palabras de relleno y el ocasional 'um' pueden colarse a menos que las elimines.

87%
Entrevista capturada de dos personas

Teléfono entre ustedes en una mesa de café. La diarización acústica separa voces, aunque el cruce y tonos similares a veces se fusionan — presupuesta una limpieza de 2 minutos.

78%
Nota en bolsa o caminando al aire libre

Tela rozando el micrófono, viento, tráfico. Las palabras generalmente se recuperan para tomar notas pero los sustantivos propios y números caen primero. El peor caso en nuestros datos.

Preguntas frecuentes

8 cosas que la gente pregunta sobre transcripción de notas de voz.

01¿Necesito convertir M4A de iPhone Voice Memos primero?+
No. M4A se carga directamente — igual para AAC y MP3 de Android. Leemos el contenedor nativamente y no re-codificamos. Solo presiona Share → Transcription.Solutions desde la app Voice Memos, o arrastra el archivo desde Finder.
02iOS 18 ya transcribe Voice Memos — ¿por qué usarnos?+
La transcripción de Apple se queda dentro de la app — sin DOCX, sin SRT, sin exportación en lote. También está enfocada en inglés y solo en iPhone 12 y más nuevos. Si quieres un archivo que puedas editar, enviar a un cliente o pegar en un CMS, necesitas una herramienta externa.
03¿Puedes manejar una nota de 4 horas? Olvidé detener la grabación.+
Sí. El archivo máximo es 5 GB y la duración máxima es 10 horas por trabajo. Un M4A mono de 4 horas es aproximadamente 200 MB y se procesa en unos 12-15 minutos en el nivel estándar.
04Grabé una entrevista en mi teléfono — ¿funcionarán las etiquetas de hablante?+
Sí, en planes Pro y Business. Dos voces en un solo micrófono son más difíciles que canales separados, así que espera 85-90% de precisión de diarización si ambos estaban cerca del teléfono. Presupuesta un rápido paso de redenominación en las etiquetas del hablante.
05¿Funciona la hoja de compartir desde la app de iOS Voice Memos?+
Sí. Abre la nota, presiona Share, elige nuestra app desde la hoja de compartir. El archivo se carga y la transcripción aparece en tu panel. Sin sincronización de escritorio, sin paso de AirDrop.
06¿Vocabulario personalizado para dictado médico o legal?+
Sí. Pega nombres de medicamentos, citas de casos o nombres de clientes en el campo Vocabulario personalizado en el formulario de trabajo. Los pasamos al reconocedor como sugerencias, lo que ayuda con la ortografía pero no fuerza coincidencias con palabras que suenan similar.
07¿Qué sucede con mi nota después de la transcripción?+
El audio de origen se elimina permanentemente en 24 horas. La transcripción permanece en tu cuenta hasta que la elimines. No capacitamos con audio de clientes y no lo guardamos para 'revisión de calidad'.
08¿Puedo procesar en lote un acumulado de notas antiguas?+
Sí. Arrastra una carpeta de M4As al área de carga o comprímel. Cada archivo se convierte en un trabajo separado con su propia transcripción. Útil si tienes años de Voice Memos sin procesar en tu teléfono.

Carga tu nota de voz. Mira lo que sale.

30 minutos gratis cada mes. Sin tarjeta. Funciona con M4A de iPhone, AAC de Android y cualquier otra cosa que tu app grabadora guarde.

Empezar gratis