VEXKIO
← Volver al blog
Tecnología·7 min de lectura·3 de febrero de 2026

Las 14 IAs de VEXKIO: arquitectura de la plataforma

VEXKIO no es un modelo, son 14 IAs especializadas que se fusionan en tiempo real. Acá explicamos qué hace cada una y cómo se combinan en los 5 estados.

Por Diego Ramírez

Construir emotion AI con un solo modelo monolítico es una receta para la mediocridad. VEXKIO lo aprendió temprano: 14 IAs pequeñas, especializadas y auditables superan a un gigante generalista en precisión, latencia y costo operativo.

Por qué 14 y no una

Un modelo único que prediga emociones desde video, audio, texto y señales fisiológicas en paralelo suena elegante. En producción falla por tres razones: es difícil de entrenar de forma balanceada, imposible de auditar por dominio, y costoso de actualizar cuando una modalidad mejora.

Separamos el problema en subdominios con responsabilidad única. Cada IA hace una cosa bien, expone un contrato tipado y puede reemplazarse sin tocar el resto.

El mapa completo

Las 14 IAs se agrupan en cuatro capas:

Capa de percepción (modalidades crudas)

  1. IA-01 Facial OMEGA — FACS + landmarks 3D sobre WebAssembly, 78ms de latencia.
  2. IA-02 Voice OMEGA — prosodia, pitch, energía y cadencia vocal.
  3. IA-03 Signs LSC — reconocimiento de lengua de señas colombiana, 77 señas priorizadas.
  4. IA-04 Body — postura corporal y micro-movimientos desde webcam.
  5. IA-05 rPPG — frecuencia cardíaca y variabilidad desde piel facial.
  6. IA-06 Whisper — transcripción STT multilingüe con diarización.

Capa de comprensión (texto y conocimiento)

  1. IA-07 Brain LLM — orquestador central, interpreta intención y contexto.
  2. IA-08 RAG — recuperación aumentada sobre knowledge bases del cliente.
  3. IA-14 Linguistics NLP — análisis lingüístico profundo (sintaxis, negación, incertidumbre).

Capa de fusión y decisión

  1. IA-09 Fusion — combina modalidades en los 5 estados afectivos. Corazón de la plataforma.

Capa de ciclo de vida del modelo

  1. IA-10 TTS — síntesis de voz emocional para respuestas habladas.
  2. IA-11 AutoEvaluator — evalúa calidad de inferencias contra ground truth.
  3. IA-12 LoRA Trainer — fine-tuning por cliente con adaptadores ligeros.
  4. IA-13 Drift Guardian — detecta degradación de modelos en producción.

Cómo se fusionan en tiempo real

Fusion API es el corazón de la plataforma. Cada IA de percepción emite vectores con timestamp y confianza. IA-09 alinea temporalmente las señales con ventanas deslizantes de 2 segundos y calcula los 5 estados.

El peso de cada modalidad es dinámico. Si la cámara está ocluida, IA-01 reduce su confianza y IA-09 sube el peso de IA-02 Voice. El resultado es degradación elegante: el sistema sigue funcionando con señales parciales.

Qué gana el cliente con esta arquitectura

Tres beneficios operativos concretos:

  • Actualización independiente: mejoramos IA-01 sin redeployar IA-03.
  • Auditoría por dominio: un regulador puede pedir trazabilidad solo de facial.
  • Costos por uso: un cliente que solo usa Copilot no paga por IA-03 Signs.

El rol de Drift Guardian

IA-13 es nuestro mecanismo de seguridad silencioso. Monitorea la distribución de inferencias contra la línea base de entrenamiento. Si un cliente empieza a enviar tráfico con condiciones de iluminación muy distintas, IA-13 alerta antes de que la precisión caiga visiblemente.

En pilotos mexicanos de 2025 detectó un cambio de cámaras corporativas que habría degradado el modelo 4 puntos en F1. Resolvimos en 48 horas.

Conclusión

La complejidad no está en una sola IA grande, sino en orquestar muchas pequeñas. VEXKIO apostó por modularidad desde el día uno y hoy es la razón por la que podemos ofrecer latencias sub-80ms con 94% de precisión en LSC.

Explore Emotions API, Fusion API o Copilot según la capa que necesite.