Prosodia vocal como señal temprana de depresión: qué dice la evidencia
La voz cambia antes que el comportamiento observable cuando se instala una depresión. Acá la evidencia científica y cómo VEXKIO la operacionaliza clínicamente.
Por Laura Restrepo
La depresión mayor afecta al 9.7% de adultos en LATAM según estudios de la OPS, pero se detecta en promedio 11 meses después de su instalación. La prosodia vocal cambia mucho antes. Acá la evidencia publicada y cómo Therapy Voice operacionaliza esa señal temprana.
Qué se sabe desde hace décadas
La literatura clínica documentó desde los 1980s que pacientes con depresión mayor presentan cambios consistentes en cinco parámetros vocales:
- Pitch medio más bajo (fundamental frequency reducido 15-22%).
- Menor variabilidad de pitch (monotonía vocal).
- Mayor duración de pausas entre palabras.
- Velocidad de habla reducida un 20-30%.
- Energía/intensidad disminuida en ataques consonánticos.
Esos cambios son observables antes de que el paciente reporte síntomas subjetivos claros. Son biomarcadores.
Por qué la detección clínica es tardía
La psiquiatría diagnostica depresión por criterios DSM que requieren síntomas presentes al menos 2 semanas con intensidad funcional. Eso significa que para cuando se diagnostica, el paciente ya lleva meses en deterioro silencioso.
La evidencia vocal sugiere que podríamos detectar la instalación 3-8 meses antes. La pregunta no es si es técnicamente posible, es si es éticamente responsable hacerlo.
La postura de VEXKIO
Emotion AI no diagnostica depresión. Lo que puede hacer —y Therapy Voice hace— es:
- Alertar al clínico sobre cambios prosódicos sostenidos en pacientes en seguimiento.
- Generar una señal que el médico puede correlacionar con su evaluación.
- Detectar recaídas en pacientes con historia previa.
- Medir respuesta a tratamiento con más granularidad que las escalas auto-reportadas.
La decisión clínica siempre es humana.
Un estudio piloto en Colombia
Colaboramos con un grupo de psiquiatría ambulatoria en Bogotá durante 2025. 180 pacientes con seguimiento mensual por 6 meses. Medimos prosodia en cada consulta virtual.
Resultados:
- En los 22 pacientes que tuvieron recaída, la prosodia mostró desviación significativa 6-9 semanas antes del reporte subjetivo.
- El psiquiatra tratante reconoció la señal prosódica como útil en el 78% de los casos.
- Ningún paciente reportó sentirse "vigilado" cuando se le explicó claramente el uso de la herramienta.
Los resultados son prometedores. No son prueba definitiva. Siguen estudios multicéntricos.
Cómo funciona técnicamente
IA-02 Voice OMEGA extrae 47 features prosódicas cada 500ms. Voice API expone esos features al sistema clínico. El modelo de "desviación prosódica del baseline personal" compara al paciente contra su propia línea base —no contra un promedio poblacional.
Eso es crítico: todos hablamos distinto. Lo que importa es el cambio respecto a uno mismo.
Consideraciones éticas
Tres principios que defendemos:
- Consentimiento específico: el paciente debe saber exactamente qué se está midiendo.
- Sin diagnóstico automatizado: la IA alerta, el médico decide.
- Derecho a desactivar: el paciente puede suspender la medición sin afectar su atención.
- Sin uso en seguros o empleo: los datos emocionales clínicos no pueden usarse para discriminar.
El último punto está en cada contrato que firmamos.
Limitaciones reales
Somos explícitos sobre qué no puede hacer:
- No distingue depresión de otros trastornos con perfil prosódico similar.
- Falla con pacientes bilingües cuando cambian de idioma.
- Requiere un baseline mínimo de 3 sesiones para calibrar.
- No reemplaza al PHQ-9 ni ninguna escala validada.
Es un instrumento complementario, no un sustituto.
Conclusión
La prosodia vocal es una ventana temprana hacia cambios emocionales que la observación clínica tradicional detecta tarde. Usada con cuidado, con consentimiento y bajo supervisión médica, puede salvar vidas. Usada sin esos controles, se convierte en vigilancia. La diferencia está en el diseño.
Explore Therapy Voice o Voice API con criterio clínico.