Un informe reciente sobre la inteligencia artificial conversacional en el reclutamiento y la adquisición de talentos dio a McDonald’s la oportunidad de plantearse un caso. ¡Sí, una oportunidad para revisar el diseño de una conversación! A continuación, veremos el chatbot de McDonald’s y el trabajo realizado por Paradox.ai en su desarrollo. También compartiré algunas ideas sobre el problema de la visibilidad de los productos conversacionales. Para empezar, comparto una captura de pantalla del informe:
Tabla de contenidos
Encontrar el chatbot de Recursos Humanos de McDonald’s
En el sitio web de carreras profesionales de McDonald’s, se te solicita que elijas entre trabajos en restaurantes y trabajos corporativos. La ruta corporativa no conduce a un chatbot, pero la ruta del restaurante sí. Quizás los volúmenes son más bajos para Corporate, por lo que el valor que aporta la implementación de una IA conversacional es menor. También me pregunto si existe un componente de marca, en el que los trabajos corporativos sientan que deberían recibir un trato más personal. Dicho esto, la pista corporativa te pide que busques un trabajo y luego envíes una solicitud, sin compromiso de conversación. No tengo claro si se trata de una experiencia premium.
El seguimiento de empleos en restaurantes McDonald’s comienza con información relacionada y un cuadro de búsqueda.
Siguiendo la consulta de ejemplo, escribí «tripulación SF» para empezar. Esto devolvió una lista de trabajos coincidentes. Cuando hice clic en «APLICAR AHORA» en uno de ellos, se inició una experiencia de chat para aplicar. La página tenía una breve descripción fuera de la ventana de chat que se podía leer, el chatbot se convirtió en el foco y el resto de la página se volvió gris.
Uso del chatbot de McDonald’s
La experiencia de chat en sí comienza con cuatro mensajes que ocupan toda la longitud de la pantalla (en mi monitor externo).
Se trata de una gran cantidad de contenido para lanzar a un usuario desde el principio. Puede estar bien porque los usuarios podrían estar bastante motivados para continuar. Dicho esto, me encantaría conocer los resultados de una prueba A / B comparando esta bienvenida con alguna más corta. ¿El abandono sería menor si se redujera el contenido de bienvenida? ¿Qué pasa si se divide en varios turnos que requieren la intervención del usuario para avanzar en lugar de 4 burbujas grandes?
Entonces, ¿qué está sucediendo en la primera vista del chatbot del usuario?
Hay mucho aquí. Me imagino que las dos mensajes que llamé disclamers son el resultado de requisitos legales y no las preferencias de un diseñador de conversaciones, y me identifico con esas limitaciones. Dicho esto, exige mucho espacio desde el principio de la interacción. Se presentan como reconocimientos implícitos (no se requiere confirmación del usuario), por lo que quizás no sean demasiado perjudiciales.
Me parece interesante que las exenciones de responsabilidad (mensaje 2 y 3) se encuentren entre la bienvenida (mensaje 1) y la pregunta inicial (mensaje 4). Para mí, en mi imaginación de la experiencia del usuario, espero que el usuario encuentre el mensaje 4 importante, el mensaje 1 interesante pero algo que puede olvidar y los mensajes 2 y 3 un poco molestos. Como resultado, siento que las renuncias se encuentran en medio de dos cosas que me importan.
Dejando de lado los requisitos legales o de otro tipo, ¿cómo se sentiría la experiencia del usuario si este chatbot solo usara el mensaje 4?
A menudo siento que las experiencias de conversación mejoran a medida que recorto material de ellas. Es muy fácil sentirse abrumado por el contenido. En este caso, solicitar un trabajo es el objetivo principal y otras cosas pueden interponerse en el camino.
Cuando ingreso mi nombre, obtengo lo siguiente:
El bot parece haber procesado mi input como nombre y apellido, y convertirlo en JT en un círculo rojo. No sé qué tipos de validación se pueden hacer aquí… ¿qué pasa si solo ingreso un nombre, tres nombres o no ingreso un nombre en absoluto?
Como solo estoy probando el bot, no quise proporcionar mi teléfono o correo electrónico.
No estoy seguro de que el mensaje «¡Genial!» realmente encaja, pero en general el bot fue amable al decirme que salí del camino feliz.
¡El bot pareció manejar bien mi pregunta! Me pregunto qué tan compleja es la coincidencia de intenciones detrás de escena. Quizás esté inspirado en la palabra «aplicar» en mis preguntas, quizás sea más elaborado. Independientemente, parece que obtener mi información de contacto es una condición previa para continuar.
Probé algunas preguntas más (escala salarial, horas, responsabilidades), las dos primeras propusieron hablar con un gerente y la tercera me dio una respuesta sobre cómo usar su escala para siempre. En todos los casos, la respuesta se estructuró en dos partes, por ejemplo:
La primera burbuja de chat es una respuesta a la pregunta, y la segunda parece ser un seguimiento universal (aunque hubo variaciones menores en la segunda burbuja). Una vez que el usuario se sale del camino feliz y puede preguntar sobre lo que quiera, el bot tiene una estructura de respuesta-luego-pregunta-por-información-de-contacto.
Sin proporcionar información de contacto, no puedo probar más el sistema. Tengo curiosidad por saber cuánto se hace en el chatbot. Puedo imaginar que todo lo que hace el bot es recopilar información de contacto. También puedo imaginar que el bot hace un flujo de entrada más amplio, recopilando información de experiencia laboral, disponibilidad, preferencias y más. Y podría ser incluso más sofisticado, con integraciones más profundas, pero eso parece poco probable.
Entonces, ¿quién hizo este chatbot?
Parece que es una empresa llamada Paradox.ai. ¡Investiguemos!
Paradox.ai: una IA conversacional para el reclutamiento
Al mirar su sitio web, queda claro que el bot de McDonald’s y el bot de Paradox se basan en la misma tecnología. ¡Ambos incluso usan el nombre de Olivia!
La principal diferencia, además del texto del chat, es la imagen del bot. La mujer con sombrero parece un buen toque para enmarcar la interacción como si estuviera trabajando en un restaurante McDonald’s.
Una cosa que noté sobre el chatbot en el sitio web de Paradox AI es que es consciente del contexto. ¡En la página principal, obtienes un contenido de bienvenida diferente al de la página de carreras!
Tengo curiosidad por saber cómo se implementó esto. ¿El sitio web inicializa una conversación diferente, o es una sola conversación consciente del sitio web en el que está integrado y luego se ramifica de manera apropiada?
La metáfora de «Olivia» como personaje persistente sugeriría lo último, pero supongo que es lo primero. Puede que no importe mucho, pero si un solo usuario va a chatear con Olivia en varias partes del sitio web, ese usuario puede esperar coherencia en todos los contextos. Como muestran las capturas de pantalla una al lado de la otra, el personaje Olivia se presenta, por un lado, como «la asistente de inteligencia artificial que ayuda a los equipos de reclutamiento globales a pasar más tiempo con las personas mediante la automatización de tareas como la selección, la programación y las preguntas y respuestas de los candidatos» y, por el otro, como «su asistente personal de trabajo de Paradox». ¿Ella es ambas? ¿Sería mejor usar un personaje diferente para la página de carreras si el propósito de esa experiencia de chat es diferente?
Al igual que con el chatbot de McDonald’s, la primera pregunta me pide mi nombre y apellido. Tengo curiosidad por saber por qué este es el punto de partida. ¿Están creando un perfil de usuario? ¿Cuál es la caída en este punto? ¿Es valioso como una forma de construir una relación o crea fricciones innecesarias? Parece que la interfaz de usuario del chat cambia de un punto rojo a un punto con sus iniciales, una vez que les da su nombre. Quizás lo vean como una parte importante de la experiencia.
Después de hacerle algunas preguntas a Olivia en paradox.ai, ella continua la conversación con el siguiente mensaje:
Me pregunto si ayudaría a explicar por qué se desea / necesita el nombre.
Insertar video
La integración de multimedia y múltiples modalidades en experiencias conversacionales es un tema que me genera mucho interés. En Sensely, pensamos mucho en el papel de un avatar en la interacción de voz y chat, así como en el papel de las imágenes, el video, el marcado y más. ¡Paradox está haciendo algo interesante! Primero, el enlace del video de Youtube está incrustado en el flujo de chat:
El video utiliza todo el ancho de la interfaz de usuario del chat, lo que permite la vista previa más grande posible. Una vez que haces clic en el video, comienza una animación con los dos círculos blancos (1, en la captura de pantalla a continuación) que se expande en el video completo de Youtube superpuesto en el sitio web. Además, el espacio de la tarjeta de video cambia al nombre del video y al botón Listo (2). Al hacer clic en el botón Listo, se cierra el video de Youtube y se vuelve a la apariencia original.
Una cosa que permite analizar el bot de McDonald’s junto con el bot de Paradox.ai es una comparación del producto de demostración de una empresa de inteligencia artificial conversacional con una implementación real.
¿Cómo promueve y utiliza Paradox.ai su propio producto en comparación con la forma en que un cliente ha utilizado ese producto para sí mismo? En este caso, los dos productos se ven bastante similares. La interfaz de usuario general tiene el mismo aspecto, parte del contenido muestra paralelismos (la primacía de preguntar por el nombre y el apellido) e incluso el nombre del personaje. Un desafío para las empresas de inteligencia artificial conversacional es cómo hacer un producto que tenga una amplia aplicabilidad lista para usar, con personalización para satisfacer las diferencias individuales en las necesidades de los clientes. Paradox parece haber creado un producto que no necesitaba muchos cambios para servir al caso de uso de McDonald’s, aparte de crear el flujo y el contenido del diálogo real.
Volviendo a la captura de pantalla del estudio de caso en la parte superior de esta publicación, la mayoría de las viñetas hacen referencia a mejoras en comparación con otros procesos de contratación. Mi análisis aquí ha sido interno a los bots. Al nerd analítico que hay en mí le gustaría ver cómo obtuvieron esos resultados comparativos, pero también cómo mejorar el chatbot comparando resultados para diferentes implementaciones del chatbot.
Una reflexión: el problema de la descubribilidad
A diferencia de las interfaces visuales (GUIs), es difícil con las interfaces de voz y chat conocer el alcance de lo que es posible en la conversación. Al igual que es difícil saber qué puede hacer Alexa sin intentarlo y sin aprender, me resulta difícil saber qué puede hacer un bot como el de Paradox sin forzar mis propias investigaciones. Tengo la sensación de que podría hacer más y no lo he encontrado. ¿Hay eastereggs? ¿Funciones divertidas? Sé que solo estoy probando los bots para explorar su diseño y tecnología, ¡pero quiero ver su esquema de bot completo! ¿Cuáles son todos los caminos posibles? ¿Cómo se determinan? ¿Qué contenido es compatible? ¿Cuáles son las cosas que este bot puede y no puede hacer? Puedo descubrirlo intentándolo, construyendo de abajo hacia arriba. Pero al hacerlo, me doy cuenta de que quiero ver una vista de alto nivel.
Y este desafío se centra en cómo los diseñadores de conversaciones y las herramientas que utilizan representan las conversaciones. Sé que esto es algo que se discute en el libro «Conversations with Things: UX Design for Chat and Voice» (por ejemplo, el capítulo 6 Documentación de los caminos conversacionales), de Rebecca Evanhoe y Diana Deibel. Me pregunto cuál podría ser una forma súper clara y fácil de entender de representar la estructura de una gran conversación, las diversas rutas, el contenido, los tipos de medios, la lógica de decisión y más. Es decir, cómo se vería una representación de conversación con una función de zoom, de modo que podría acercarse para ver todos los detalles en un solo estado, pero también podría alejarse y ver todo el espacio de posibilidades para interactuar con el bot. Existen muchas herramientas de diseño (Dialogflow, Voiceflow, Botcopy, Botmock, OpenDialog son algunas que me vienen a la mente).
Quizás en el futuro me sumerja en explorar cómo algunos de ellos abordan este desafío.
Si quieres leer este post en inglés, ¡aquí te dejamos el enlace!