Reconocimiento de Voz en Tiempo Real
Tu "oído extra" digital. GoodScribe transforma el audio en texto al instante, diseñado específicamente para capturar cifras, nombres propios y terminología densa que satura la memoria de trabajo.
¿Cómo funciona bajo el capó?
Motor Deep Learning de Última Generación
Utilizamos modelos de Deep Learning avanzados (similares a la arquitectura Whisper pero optimizados para latencia real) a través de nustra integración con Deepgram. Esto nos permite procesar audio a una velocidad de >300 milisegundos.
Procesamiento de Entidades (Smart Formatting)
El sistema no solo escribe palabras; entiende formatos. Detecta fechas, monedas, números telefónicos y direcciones de correo electrónico y los formatea visualmente (ej. escribe "$1,500" en lugar de "mil quinientos dólares") para una lectura instantánea.
Diarización de Hablantes
GoodScribe identifica automáticamente los cambios de interlocutor en el flujo de audio, separando el texto en párrafos visuales para que nunca pierdas el hilo de quién está hablando.
Idiomas Soportados (Motor Nova-3 Multi)
Captura de Audio
Aprovechamos la API de AudioContext y MediaStream del navegador para capturar el audio de cualquier pestaña (Chrome Tab Audio) o micrófono.
- Sample Rate: 44.1kHz / 48kHz
- Latencia: ~300ms
Casos de Uso Ideal
- TOP Discursos densos en cifras (financieros, estadísticos).
- TOP Listas de nombres propios o lugares geográficos.
- OK Acentos fuertes o audio de baja calidad.