Las 14 IAs de VEXKIO: arquitectura de la plataforma
VEXKIO no es un modelo, son 14 IAs especializadas que se fusionan en tiempo real. Acá explicamos qué hace cada una y cómo se combinan en los 5 estados.
Por Diego Ramírez
Construir emotion AI con un solo modelo monolítico es una receta para la mediocridad. VEXKIO lo aprendió temprano: 14 IAs pequeñas, especializadas y auditables superan a un gigante generalista en precisión, latencia y costo operativo.
Por qué 14 y no una
Un modelo único que prediga emociones desde video, audio, texto y señales fisiológicas en paralelo suena elegante. En producción falla por tres razones: es difícil de entrenar de forma balanceada, imposible de auditar por dominio, y costoso de actualizar cuando una modalidad mejora.
Separamos el problema en subdominios con responsabilidad única. Cada IA hace una cosa bien, expone un contrato tipado y puede reemplazarse sin tocar el resto.
El mapa completo
Las 14 IAs se agrupan en cuatro capas:
Capa de percepción (modalidades crudas)
- IA-01 Facial OMEGA — FACS + landmarks 3D sobre WebAssembly, 78ms de latencia.
- IA-02 Voice OMEGA — prosodia, pitch, energía y cadencia vocal.
- IA-03 Signs LSC — reconocimiento de lengua de señas colombiana, 77 señas priorizadas.
- IA-04 Body — postura corporal y micro-movimientos desde webcam.
- IA-05 rPPG — frecuencia cardíaca y variabilidad desde piel facial.
- IA-06 Whisper — transcripción STT multilingüe con diarización.
Capa de comprensión (texto y conocimiento)
- IA-07 Brain LLM — orquestador central, interpreta intención y contexto.
- IA-08 RAG — recuperación aumentada sobre knowledge bases del cliente.
- IA-14 Linguistics NLP — análisis lingüístico profundo (sintaxis, negación, incertidumbre).
Capa de fusión y decisión
- IA-09 Fusion — combina modalidades en los 5 estados afectivos. Corazón de la plataforma.
Capa de ciclo de vida del modelo
- IA-10 TTS — síntesis de voz emocional para respuestas habladas.
- IA-11 AutoEvaluator — evalúa calidad de inferencias contra ground truth.
- IA-12 LoRA Trainer — fine-tuning por cliente con adaptadores ligeros.
- IA-13 Drift Guardian — detecta degradación de modelos en producción.
Cómo se fusionan en tiempo real
Fusion API es el corazón de la plataforma. Cada IA de percepción emite vectores con timestamp y confianza. IA-09 alinea temporalmente las señales con ventanas deslizantes de 2 segundos y calcula los 5 estados.
El peso de cada modalidad es dinámico. Si la cámara está ocluida, IA-01 reduce su confianza y IA-09 sube el peso de IA-02 Voice. El resultado es degradación elegante: el sistema sigue funcionando con señales parciales.
Qué gana el cliente con esta arquitectura
Tres beneficios operativos concretos:
- Actualización independiente: mejoramos IA-01 sin redeployar IA-03.
- Auditoría por dominio: un regulador puede pedir trazabilidad solo de facial.
- Costos por uso: un cliente que solo usa Copilot no paga por IA-03 Signs.
El rol de Drift Guardian
IA-13 es nuestro mecanismo de seguridad silencioso. Monitorea la distribución de inferencias contra la línea base de entrenamiento. Si un cliente empieza a enviar tráfico con condiciones de iluminación muy distintas, IA-13 alerta antes de que la precisión caiga visiblemente.
En pilotos mexicanos de 2025 detectó un cambio de cámaras corporativas que habría degradado el modelo 4 puntos en F1. Resolvimos en 48 horas.
Conclusión
La complejidad no está en una sola IA grande, sino en orquestar muchas pequeñas. VEXKIO apostó por modularidad desde el día uno y hoy es la razón por la que podemos ofrecer latencias sub-80ms con 94% de precisión en LSC.
Explore Emotions API, Fusion API o Copilot según la capa que necesite.