Tabla de contenidos
¿Cuál es el problema?
En la actualidad, la IA conversacional se centra excesivamente en el diseño de conversaciones con diálogos de varios turnos. Al mismo tiempo, se descuidan elementos como la cola larga de la distribución de intenciones, junto con el diseño NLU.
A estos problemas hay que añadir el enfoque aislado de la IA conversacional, la CCAI y la CX dentro de las empresas.
Otro problema son los proveedores verticales que intentan abordar todos los requisitos de la IA conversacional empresarial.
La luz en el horizonte es la aparición de la fragmentación del mercado, que es donde las organizaciones están adoptando las mejores herramientas de su clase para abordar los requisitos de la CAI. La fragmentación se perpetúa con la introducción de casos de uso de CAI y robots de voz.
El diseño de NLU también está surgiendo como metodología para la práctica astuta de datos y para detectar eficazmente señales dentro de las conversaciones existentes con los clientes, y convertir esas señales en datos de entrenamiento de NLU. El NLU Design puede considerarse un proceso acelerado de detección y gestión inteligente de intenciones.
Al convertir las conversaciones no estructuradas con los clientes en datos de formación de NLU, se puede establecer un proceso sostenible en el que las intenciones de los clientes informen la hoja de ruta de CX.
Factores de fragmentación del mercado
La siguiente imagen muestra un desglose del panorama actual de la tecnología de IA conversacional. Ten en cuenta que este desglose ni siquiera incluye CCAI, ASR y síntesis de voz. El ASR y la síntesis de voz son, obviamente, dos requisitos vitales para los agentes digitales habilitados para voz.
Sin embargo, lo que es evidente es la fragmentación del mercado y la aparición de las mejores herramientas horizontales para el éxito empresarial.
La abstracción de la capa de mensajería del chatbot para mejorar el diseño de las respuestas contribuye a la fragmentación. Y los Large Language Models (LLM), que están popularizando el texto generativo para las respuestas de los bots. Los LLM también están desempeñando un papel clave en la automatización de la redacción de PII.
Multimodalidad y orquestación
La orquestación se convertirá en una capacidad crítica por varias razones.
Una de ellas es la capacidad de aprovechar al máximo el esfuerzo existente en chatbot para acelerar la habilitación por voz de los asistentes digitales.
En segundo lugar, la multimodalidad se verá impulsada por la idea de que los diálogos multigiro no son la solución a todas las intenciones de los clientes. Cada conversación tendrá que personalizarse en función del medio, la modalidad y los componentes conversacionales disponibles.
A este respecto, considera las siguientes intenciones de los clientes y cómo funcionará mejor un enfoque multimodal:
- Solicitar un cambio de asiento en un avión
- Obtener indicaciones
- Facturar un vuelo
- Alquilar un coche
- etc.
NLU informará la hoja de ruta de CX
El proceso de diseño NLU descubrirá señales importantes expresadas por los clientes, representantes de servicio, etc. a partir de datos conversacionales históricos y en tiempo real.
El diseño de NLU produce invariablemente mejoras en la experiencia del cliente gracias a la información procesable, cualitativa y cuantitativa. Los resultados de este proceso son la mejora de la automatización, la personalización, el éxito de la atención al cliente y los datos para las funciones impulsadas por IA.
La CCAI y los robots de voz mejorarán drásticamente
Con la atención que se presta actualmente a la CCAI y los robots de voz, la experiencia del usuario va a mejorar drásticamente. Los proveedores de tecnología se están centrando en elementos que potencien la CCAI y los robots de voz.
La innovación en el reconocimiento avanzado del habla (ASR) está resolviendo impedimentos que parecían insalvables en el pasado, como la calidad de la voz telefónica, la multiplicidad de interlocutores, el ruido de fondo, etc.
En el pasado, la adopción del ASR y la síntesis de voz se veía gravemente obstaculizada por la escasa representación de lenguas minoritarias, acentos regionales y locales. Esto se ha solucionado recientemente, sobre todo con Whisper y Microsoft.
Panorama tecnológica de los chatbot y los bots de voz
A modo de referencia, a continuación se muestran dos matrices tecnológicas que cubren las implementaciones de chatbot y voicebot.
Actualmente soy el Evangelista Jefe @ HumanFirst. Exploro y escribo sobre todas las cosas en la intersección de la IA y el lenguaje; que van desde LLMs, Chatbots, Voicebots, Marcos de Desarrollo, Data-Centric espacios latentes y más.