Tabla de contenidos
Introducción
Durante los dos últimos años se ha producido una evolución con respecto a las intenciones.
Este enfoque está justificado, teniendo en cuenta que las intenciones son una capa por la que tienen que pasar las conversaciones. Y al comienzo de cualquier conversación los intents juegan un papel crucial para categorizar la conversación según la intención del usuario.
Por una buena razón, los intents se han considerado demasiado rígidos, y es necesario resolver esta capa tan estrecha para todas y cada una de las intenciones de los usuarios. Los enfoques seguidos para se pueden dividir en dos categorías:
- Depreciación de la intención.
- Aumento de la intención.
Las actividades de desaprobación de intents son:
- Microsoft Power Virtual Agents
- IBM Watson Action Skills
- Conversaciones de Alexa
- Formación Rasa End-To-End
Esta noción ha sido limitada y no se ha implementado ampliamente, y definitivamente no es una tendencia según los líderes de Gartner. Por el contrario, los líderes de Gartner están construyendo la funcionalidad en los intents. Trasladando la complejidad y la gestión de las conversaciones de otras áreas, como la gestión del estado del diálogo, a los intents.
A continuación se ofrece una lista de ejemplos de cómo se están aumentando los intents.
Aumento de la intención
El componente de intención del NLU es esencialmente una lista de nombres de intención, cada intención se representa con un nombre y una lista de expresiones que definen la intención.
El movimiento entre los líderes de Gartner es aumentar las intenciones; por lo tanto, crear una estructura en las intenciones y difuminar la línea entre las intenciones y los otros componentes del chatbot.
Algunos rasgos que estoy viendo:
- Las intenciones se asocian a entidades concretas.
- Los intents se asocian a secciones específicas del flujo conversacional.
- Se pueden establecer pesos para los intents.
- Las intenciones pueden activarse y desactivarse.
- Las respuestas rápidas pueden asociarse a una intención. Los diálogos de un solo turno están contenidos en la intención.
- Los intents se pueden arrastrar, soltar, dividir y fusionar.
- Las intenciones son jerárquicas, anidadas, etc.
- La noción de temas, que representa una colección de uno o más intents, entidades y flujos.
- Los datos pueden cargarse para la detección de intenciones, los nuevos enunciados se asocian automáticamente a las intenciones existentes. Los clusters se forman para las nuevas intenciones.
- Se pueden establecer umbrales para las intenciones.
- Se pueden establecer solicitudes de confirmación dentro de una intención si no se cumple un umbral.
- Los intents se aprovechan para los menús de desambiguación automática.
- Existen estructuras para importar expresiones y comprobar las intenciones con lo que dicen los usuarios.
(Los sistemas examinados incluyen: Cognigy, Kore AI, IBM Watson Assistant, Oracle Digital Assistant, Nuance Mix, AWS Lex V2, Rasa, HumanFirst)
Por lo general, un asistente digital está constituido por una o más habilidades. Estas habilidades se componen a su vez de un sistema de gestión del estado del diálogo y de un NLU. La gestión del estado del diálogo se compone, a su vez, de la gestión del estado del diálogo en función de las condiciones y también de las respuestas del bot.
Oracle Digital Assistant: Intenciones con respuestas incorporadas
- Se trata de un enfoque contenido dentro de Oracle Digital Assistant, en el que las preguntas y respuestas se encapsulan dentro de la intención; las intenciones de respuesta rápida.
- La expresión del usuario se asigna a una intención, y la respuesta se incrusta dentro de la intención, actuando como una respuesta rápida.
- Esto puede verse como un ejemplo en el que las líneas entre las intenciones, el flujo de diálogo y los mensajes del bot son borrosas.
- La sobrecarga de segmentar la funcionalidad y dividirla entre intenciones, secciones de flujo de diálogo y mensajes de bots queda anulada.
- Esta implementación puede ser vista como intents de respuesta rápida.
- A continuación se muestra un ejemplo de una intent llamada HoursAsk, con el nombre definido y una descripción. Posteriormente se define una respuesta para la intent, que se devuelve al usuario.
Mezcla de matices
La activación y desactivación de los intents recuerda bastante al enfoque de Cognigy:
- Se pueden añadir pesos a ciertas intenciones, activar y desactivar, los marcadores muestran si la intención está asignada y si la anotación está pendiente.
- Las intenciones pueden asociarse con entidades, este estrecho bucle de retroalimentación entre una intención y una o más entidades son un importante contribuyente a la precisión.
- Un diálogo puede probarse en un panel de prueba, y la conversación se mapea o se muestra en tiempo real en el lienzo del diálogo. Este es también el caso de Cognigy.
- Mientras construía el prototipo, mi espacio de trabajo estaba dividido en tres pestañas, NLU, desarrollo de diálogos y configuración del proyecto. Esto hace que el espacio de trabajo se extienda cómodamente en varias pantallas.
Asistente IBM Watson
- Se puede extraer una lista de expresiones de las transcripciones del chat del centro de soporte o de otras conversaciones de clientes relacionadas y grabadas dentro de la organización.
- Deberás decidir un único tipo de fuente de recomendación.
- Los datos de la fuente de recomendación que se añaden se utilizan para derivar recomendaciones de intención y de ejemplo de intención.
- Esta es una característica importante ya que los datos se agrupan en intenciones.
- Y dentro de cada uno de estos intents definidos, el Asistente Watson elabora una lista que constituye los ejemplos de usuario.
- El nombre de los intents creados puede ser críptico. Es mejor renombrarlas a algo más inteligible para futuras referencias. Evidentemente, eres libre de utilizar estos valores generados como guía y editarlos y actualizarlos como creas conveniente.
- El mero hecho de observar la forma en que el Asistente Watson organiza los datos ya te hará pensar en muchas ideas sobre la organización de los datos.
Conclusión
¿Qué es lo próximo para la tecnología lingüística?
- Las intenciones, las entidades y las secciones de flujo se combinarán y acoplarán estrechamente para las secciones de la conversación.
- Las implementaciones conversacionales sencillas aprovecharán los QnA, las intenciones de respuesta rápida y los escenarios sin intención.
- Las bases de conocimiento serán más ágiles y adaptables.
- Los diferentes elementos conversacionales se orquestarán para crear una experiencia conversacional completa. Esta orquestación será perfecta.
- Los grandes modelos lingüísticos (LLM) se abrirán paso en la tecnología de chatbot en las áreas de generación de lenguaje natural, agrupación, clasificación y autocompletado. Absorción de partes de la arquitectura del chatbot.
- No será posible desplazar a los LLM y las empresas de tecnología lingüística encontrarán vías innovadoras para aprovechar los LLM.
- El ajuste de los LLMs mejorará considerablemente en velocidad y granularidad.
- Los marcos de desarrollo de chatbot se asentarán y las oportunidades para los nuevos participantes disminuirán debido a las altas apuestas y a las menores oportunidades de diferenciación.
- Surgirán nuevas áreas verticales de crecimiento que añadirán un valor considerable al panorama actual de la tecnología lingüística.
- Las áreas de crecimiento estarán dentro de los siguientes siete vectores verticales:
- Tecnología ASR altamente especializada.
- Empresas altamente especializadas en síntesis de voz y habla.
- Diseño y gestión del estado del diálogo. Diseño colaborativo, con diseño y autoría de flujos que se fusionarán.
- Software centrado en la personalización de los servicios. Proactivo, altamente contextual.
- Pruebas de bots, calidad y QA.
- Preparación de datos, análisis de datos conversacionales. Agrupación de datos y extracción. de información de las conversaciones de los clientes, desarrollo basado en la intención.
- Análisis de la conversación y de la interacción con el usuario.