acf domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/planetac/desa.planetachatbot.com/wp-includes/functions.php on line 6131all-in-one-seo-pack domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/planetac/desa.planetachatbot.com/wp-includes/functions.php on line 6131wp-user-avatar domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/planetac/desa.planetachatbot.com/wp-includes/functions.php on line 6131The post Mi libro sobre la conversación natural first appeared on Planeta Chatbot.
]]>En el campo de la Inteligencia Artificial Conversacional, la conversación natural se ha convertido, durante los últimos años, en el material de trabajo básico tanto para los ingenieros de software como para los diseñadores de experiencias de usuario.
Sin embargo, aunque nuestros esfuerzos profesionales comunes se centran en el modelado de conversaciones humano-máquina que resulten satisfactorias tanto para el usuario como para el sistema, todavía hoy, la mayoría de los profesionales del sector parten, en su labor, de un entendimiento bastante incompleto sobre las características propias de la conversación humana.
El libro en el que he trabajado durante el último año y cuyo contenido resumo en este post se plantea con el objetivo de solucionar dicho problema. “Conversar en español: un enfoque desde el Análisis de la Conversación”, a la venta ya a través de Peter Lang y Amazon, responde al objetivo de ofrecer una respuesta clara a la pregunta que todo profesional de la Inteligencia Artificial Conversacional se ha planteado alguna vez: ¿qué significa exactamente conversar?
Más detalles sobre la publicación en Amazón y PeterLang.
Para cumplir con dicho objetivo, he descrito, de manera comprensible para todo aquel interesado en el tema, el concepto de conversación, los componentes estructurales que la conforman y las funciones que estos cumplen en el intercambio conversacional.
Como el título del libro indica, he empleado el enfoque del Análisis de la Conversación (AC) para llevar a cabo esta tarea, dado que ayudará al lector a dejar de considerar la conversación un fenómeno meramente espontáneo y a empezar a observarla como:
Sin duda alguna, la mayor aportación que ofrece el libro viene representada por el hecho de exponer los componentes conversacionales que estructuran la conversación natural dentro de un marco de referencia, en el que he compilado, partiendo desde el nivel local de la conversación hasta el nivel global, todos los componentes estructurales, lingüísticos y pragmáticos que la componen.
Este marco de referencia se encuentra distribuido a través de las cuatro partes en las que he dividido el libro que, a su vez, contienen varios capítulos cada una.
Capítulo 1. La conversación natural
En este primer capítulo, ofrezco una definición de la conversación cotidiana, espontánea o natural centrándonos en sus características como texto oral. Para ello, aplico la perspectiva teórica del AC, dado que concibe el fenómeno conversacional como una actividad comunicativa de naturaleza social que posee unas unidades estructurales propias e independientes.
Concretamente, expongo:

Capítulo 2. El Análisis de la Conversación
En este capítulo, describo el origen histórico y la relación epistemológica que el AC mantiene con otras disciplinas sociolingüísticas afines a ella, tales como el Interaccionismo Simbólico de Goffman, la Etnometodología de Garfinkel y la Escuela Etnográfica de Chicago.
Asimismo, expongo los principios teóricos que guían la disciplina (la importancia de los procesos de razonamiento en la creación de significado, la consideración de los enunciados como acciones y el principio de organización secuencial en la conversación) y los procedimientos de recogida de datos y análisis que, comúnmente, aplican los analistas de la conversación.
Capítulo 3. El mecanismo de intercambio de turnos
En este capítulo, centro la atención en el nivel local de la conversación, mediante:
Capítulo 4. El par adyacente
En este capítulo, defino formalmente el par adyacente y las fuerzas pragmáticas representadas por la pertinencia condicional, el principio de preferencia y el principio de prioridad por el acuerdo que rigen su funcionamiento interno.
Asimismo, presento los tipos de expansiones a través de las que el par adyacente se convierte en la unidad superior de la secuencia de turnos, es decir, las preexpansiones, las expansiones insertadas y las posexpansiones.
Capítulo 5. La secuencia de turnos
En este capítulo, me ocupo de las secuencias de turnos o secuencias temáticas entendidas como:
En relación con las secuencias de turnos, describo también las marcas que configuran las prácticas interactivas de inicio y cierre de tema secuencial.

Capítulo 6. Las secuencias marco
En este capítulo, presento:
Capítulo 7. El núcleo temático y el mecanismo de cambio de tema
En este capítulo, me ocupo del mecanismo de cambio de tema, cuya principal función es estructurar el núcleo temático de la conversación cotidiana, la macrounidad localizada entre las secuencias marco de apertura y de cierre.
Asimismo, expongo los principales rasgos semánticos del núcleo temático y los diferentes tipos de cambio de tema que hacen posible la generación de secuencias temáticas en esta parte central de la conversación.

Capítulo 8. Secuencias de conformidad
En este capítulo, profundizo en la estructura y la función de las secuencias temáticas de conformidad, también llamadas secuencias de concordancia o secuencias de acuerdo. Concretamente, los tipos de secuencias de conformidad de las que me ocupo vienen representados por los anuncios, las quejas, las invitaciones, los ofrecimientos, las peticiones, los cumplidos y las preguntas.
Capítulo 9. Secuencias narrativas
En este capítulo, trato las secuencias narrativas, que representan el tipo de secuencia temática con el mayor grado de estandarización estructural interna de todas las que conforman el núcleo de la conversación natural.
Además de conceptualizar formalmente la noción de secuencia narrativa mediante la presentación de sus características pragmáticas, semánticas y estructurales, reviso los principales hallazgos respecto a su organización interactiva realizados en el ámbito de la Sociolingüística, la disciplina que ha tratado más en profundidad la función de las historias en la comunicación oral y que más ha influenciado su estudio en el AC.
Capítulo 10. Secuencias laterales
En este capítulo, analizo las secuencias laterales, también denominadas en el AC secuencias de reparación. Dichas unidades estructurales materializan el mecanismo que empleamos los humanos para reconstruir la comprensión mutua cuando esta se ve interrumpida por un problema interactivo de escucha, habla o comprensión.
Concretamente, en los apartados que conforman el capítulo:
Los componentes conversacionales que hemos recopilado quedan ilustrados en 64 fragmentos de conversaciones reales que aparecen a lo largo del libro.
Estos fragmentos pueden consultarse también en su contexto conversacional original en el “Corpus de conversaciones en español como lengua materna”que constituye el anexo del libro y se encuentra disponible en línea siguiendo el enlace.
Espero que los hallazgos que hemos compartido en el libro contribuyan a responder la pregunta de qué significa conversar y avanzar las capacidades de todos aquellos profesionales que forman parte del ecosistema de la Inteligencia Artificial Conversacional en castellano.
Conecta con la autora en Linkedin y Conversational UX Design Meetup.
The post Mi libro sobre la conversación natural first appeared on Planeta Chatbot.
]]>The post 5 Artículos sobre Inteligencia Artificial Conversacional que he leído en septiembre first appeared on Planeta Chatbot.
]]>Los temas principales de septiembre han sido las perspectivas éticas en las conversaciones humano-máquina, la multimodalidad en la interacción a través de chat, los estilos de comunicación de los usuarios a la hora de interactuar con automatizaciones y las percepciones y las motivacionesde los usuarios para emplear chats y asistentes de voz.
El último artículo de la lista de este mes es mi propia producción para el blog de FlixMobility Tech. Es esta entrada, titulada, Conversational UX Design: Creating Persistent Conversations, reflexiono sobre la necesidad de prestar más atención en el diseño conversacional a los aspectos estructurales e interactivos de la conversación y a la creación de una intersubjetividad entre el usuario y el sistema, para que la experiencia sea beneficiosa para ambas partes.
Espero que los artículos resulten de vuestro interés y espero que octubre sea tan fructífero como septiembre en términos de lectura 

Abstract
The use of chatbots to manage online interactions with consumers poses additional ethical challenges linked to the use of artificial intelligence (AI) applications and opens up new ethical avenues for investigation. A literature analysis identifies a research gap regarding the ethical challenges related to chatbots as non-moral and non-independent agents managing non-real conversations with consumers. It raises concerns about the ethical implications related to the progressive automation of online conversational processes and their integration with AI. The conversational approach has been explored in the organisational and management literature, which has analysed the features and roles of conversations in managing interactions ethically. This study aims to discuss conceptually the ethical challenges related to chatbots within the marketplace by integrating the current chatbot-based literature with that on conversation management studies. A new conceptual model is proposed which embraces ethical considerations in the future development of chatbots.
Abstract
This paper presents the design of a multimodal chatbot for use in an interactive theater performance. This chatbot has an architecture consisting of vision and natural language processing capabilities, as well as embodiment in a non-anthropomorphic movable LED array set in a stage. Designed for interaction with up to five users at a time, the system can perform tasks including face detection and emotion classification, tracking of crowd movement through mobile phones, and real-time conversation to guide users through a nonlinear story and interactive games. The final prototype, named ODO, is a tangible embodiment of a distributed multimedia system that solves several technical challenges to provide users with a unique experience through novel interaction.
Abstract
We investigate differences in user communication with live chat agents versus a commercial Intelligent Virtual Agent (IVA). This case study compares the two types of interactions in the same domain for the same company filling the same purposes. We compared 16,794 human-to-human conversations and 27,674 conversations with the IVA. Of those IVA conversations, 8,324 escalated to human live chat agents. We then investigated how human-to-human communication strategies change when users first communicate with an IVA in the same conversation thread. We measured quantity, quality, and diversity of language, and analyzed complexity using numerous features.
We find that while the complexity of language did not significantly change between modes, the quantity and some quality metrics did vary significantly. This fair comparison provides unique insight into how humans interact with commercial IVAs and how IVA and chatbot designers might better curate training data when automating customer service tasks.
Abstract
Conversational agents (CAs) such as Siri, Alexa, and Google Assistant are increasingly penetrating everyday life. From a Human-Computer Interaction (HCI) perspective, designing CAs that appropriately support the way they are used within daily life is still challenging. While initial design guidelines for human-AI interaction exist, we still know little about how users actually perceive CAs within their daily lives and what aspects motivate their usage of such tools. Within our research, we therefore conducted an interview study with 29 participants to uncover daily positive and negative experiences with CAs. By revealing how users currently perceive CAs, we identify quality criteria that could inform their future design. By evaluating these criteria with respect to existing research discourses about user experience (UX) guidelines for CAs, we contribute to the field by extending these guidelines from an end-user’s perspective.
Resumen
¿Por qué es tan difícil permitir que los sistemas conversen con nosotros de forma adecuada, especialmente desde que el Procesamiento del Lenguaje Natural ha llevado a tantos avances en la capacidad de las computadoras para procesar, analizar y dar sentido a una gran cantidad de datos de lenguaje natural? La respuesta es que hay algo más allá del lenguaje que debe ser modelado en una conversación para mantener una interacción persistente con una máquina: 1) la naturaleza estructurada de la conversación humana, y 2) la necesidad de establecer y mantener un entendimiento mutuo con el sistema incluso antes de iniciar una conversación con él.
Recibe este contenido directamente por email suscribiéndote a mi lista de correo.
¡Feliz octubre!
The post 5 Artículos sobre Inteligencia Artificial Conversacional que he leído en septiembre first appeared on Planeta Chatbot.
]]>The post Cinco principios básicos del diseño UX conversacional first appeared on Planeta Chatbot.
]]>
Alexa, ¿conversarás algún día como un humano?
Como diseñador UX de interfaces conversacionales, debes pensar en la interacción entre el humano y la máquina como una unidad completa desde el principio hasta el fin y siempre desde el punto de vista de cómo el usuario experimenta la interacción verbal con el AV/chatbot.
La materialización de dicha perspectiva en el diseño de diálogos humano-máquina se traduce en la aplicación de prácticas conversacionales y estructuras interactivas propias de los humanos.
Al respecto, algunas de las soluciones con las que puedes mejorar tu diseño, de cara a la creación de interacciones más naturales, son:

Los turnos de apoyo de acuerdo generan un mayor grado de cohesión pragmática entre intents.

¿Cuál es el objetivo final de la conversación?
Concéntrate en el objetivo finalque debes alcanzar con el diálogo. ¿Te encuentras, por ejemplo, diseñando una experiencia multimodal para la adquisición de prendas de vestir en una tienda online? En ese caso, define la psicología de tu AV/chatbot semejante a la de un vendedor y transfiere a la conversación humano-máquina las prácticas interactivas típicas de la tienda física y la versión Web o la app del servicio.
En el contexto específico de las compras a través de experiencias multimodales basadas en voz, algunas de las estrategias de implementación del diálogo que puedes llevar a cabo son:

Todo el mundo lleva una máscara, tu VUI/chatbot también.
En el diseño UX conversacional, la creación de una persona adecuada para la máquina, que represente tanto la marca como el producto en sí, representa una decisión esencial, ya que facilita que los usuarios puedan interactuar socialmente con ella de manera más efectiva.
Cuando los humanos interactuamos con agentes de software, interpretamos su agencia como un tipo de acción social. Dicha elaboración psicológica de las capacidades sociales de la máquina se acentúa aún más en la cognición humana cuando mantenemos una conversación con un AV/chatbot.
Esto significa que la persona de la máquina debe quedar correctamente definida para, posteriormente, poder transferirla al diálogo en el lenguaje, el tono y las emociones que la máquina emplea con el usuario.
Las soluciones de diseño que puedes llevar a cabo relacionadas con este punto son las siguientes:

La creación de memoria tanto a largo como a corto plazo para el AV/chatbot constituye una de las acciones fundamentales para que el usuario disfrute de una experiencia completamente satisfactoria conversando con la máquina.
Para que la máquina sea completamente conversacional, el AV/chabot debe recordar el contenido de las interacciones previas con el usuario en el mismo contexto (es decir, en la aplicación de voz en sí), además de la información que están compartiendo en el intercambio en marcha.

Alexa, ayuda.
En el diseño conversacional UX, el términouniversal de la conversación se define como las acciones que deben estar presentes en todos los estados (menú principal, ayuda, despedida, etc.).
En las interfaces conversacionales, no es posible (ni recomendable) mantener dichos conceptos en sentido estricto, pero es importante asegurarse de que el usuario pueda acceder a ellos durante su navegación de manera natural, intuitiva y, sobre todo, conversacional.
Dicha acción resulta especialmente relevante en el caso de la ayuda cuando los clientes se encuentran por primera vez en contextos interactivos multimodales. En estos casos, resulta inteligente la aplicación de un enfoque en el diseño de la interacción en el que la máquina aconseje de manera puntual la manera más eficiente (canal o aparato dentro de una combinación posible) para comunicarse con ella en dicho contexto dado.
Como diseñador o diseñadora UX conversacional, tu principal objetivo debe ser la creación de productos en voz o multimodales centrados en las necesidades del cliente. Dicha acción equivale a comprender y saber aplicar:
Y, especialmente, el nuevo problema de la multimodalidad es el que te va situar como diseñador en contextos interactivos para los que nadie cuenta todavía con una solución óptima, en esos nuevos mundos a los que nadie ha podido llegar todavía.
¡Una gran tarea pero increíblemente apasionante!
The post Cinco principios básicos del diseño UX conversacional first appeared on Planeta Chatbot.
]]>The post Aspectos socioculturales del diseño UX conversacional first appeared on Planeta Chatbot.
]]>“Como humanos, resulta simplemente natural que deseemos transferir la conversación a nuestra comunicación diaria con las máquinas”
La conversación es inseparable de las dimensiones sociales y culturales que conlleva, ya que constituye la forma prototípica de la interacción oral que los seres humanos empleamos para relacionarnos en sociedad a través de la aplicación sistemática de las rutinas interactivas propias de la comunidad(es) lingüística(s) de las que formamos parte.
En este sentido, en el diseño UX de interfaces conversacionales muy frecuentemente los desarrolladores suelen obviar la necesidad de definir cuidadosamente los parámetros sociales y culturales en los que la interacción verbal humano-máquina va a transcurrir.
Non-verbal haptic human-machine interaction.
Una manera de tener en cuenta dichas dimensiones de la interacción es plantearse, antes de esbozar el diálogo, algunas preguntas como las siguientes:
Una manera de tener en cuenta dichas dimensiones de la interacción es plantearse, antes de esbozar el diálogo, algunas preguntas como las siguientes:
¿Estás creando el guión de un robot de género femenino o masculino?
El conjunto anterior de preguntas representa solo una mínima parte de los parámetros que los conceptualizadores de conversaciones deberían tener en cuenta antes de sentarse a escribir el guión que la interacción entre el humano y la máquina va a seguir.
Por ejemplo, el planteamiento de un parámetro tan simple como de qué manera un asistente virtual (AV) debería responder a una demanda del usuario para desarrollar una determinada acción da lugar a la siguiente lista de opciones.
Petición del usuario: Asistente, abre {elTiempoHoy}.
Si tenemos en cuenta un continuo de posibilidades en la relación social entre el usuario y la máquina -desde una relación estrictamente impersonal hasta otra muy cercana en la que el usuario y el asistente son casi “amigos” seremos capaces aplicar mejor el análisis de sentimientos(sentiment analysis), además de producir una mayor variedad de turnos de habla o que cuenten con un mayor nivel de adecuación contextual.
{elTiempo} está activado
{elTiempo} está disponible para su uso. Ya puede empezar a usar {elTiempo}.
Como puede verse, en estos intents tan simples, ya encontramos un tema lingüístico de relevancia: el uso de un aspecto a tener muy a en cuenta para los desarrolladores de voz en español de España, además de la definición específica del resto de las variedades pronominales que se emplearía en cada país de América Latina.
Ya puedes consultar la predicción del tiempo para esta tarde con {elTiempo}. Parece que no va a llover y que podrás ir a tu cita de la cinco y media en bicicleta. ¡Ya tienes disponible la predicción del tiempo para hoy! ¡Bienvenido a {elTiempo}!
En el último intent, se plantea un caso interesante en castellano: la elisión verbal de la preposición a con el artículo determinado del nombre del skill (no es natural que la máquina diga A EL Tiempo, debe decir al Tiempo). No hay nada más que sentarse a escribir el guión para que empiecen a surgir problemas lingüísticos (y de programación…).
La conversación representa, además, la forma de interacción matriz de la que se derivan el resto de las interacciones orales de carácter institucionalizado ( debate, mesa redonda, coloquios…) y transacciones (interacciones profesor-alumno, médico-paciente, compra-venta…).
“La conversación es la forma de interacción matriz de que se derivan el resto de las interacciones orales”
El objetivo social elemental de la conversación es la comunicación por la comunicación, lo que, en la interacción misma, se completa con la consecución de los actos de habla ilocutivos que guían los encuentros conversacionales (agradecer, saludar, pedir, quejarse, contar una historia, etc.). Este último concepto de la Filosofía del Lenguage es el que ha sido adaptado para definir la idea de action.
La necesidad de comunicarse por comunicarse representa la razón por la que cualquier usuario que haya hablado alguna vez con un AV se ha sentido tentado de preguntarles (o, directamente, les ha preguntado) ¿cómo estás?, ¿cuántos años tienes? o, incluso, ¿me amas?, ya que la comunicación en sí en una necesidad básica que tenemos los humanos (¿la tendrán también las máquinas en el futuro?, ¿pasaremos delante de un frigorífico inteligente y nos saludará buscando charla? :D).
Casualmente (o no), esta chica está probando, ya en el año 2015, la disponibilidad conversacional de dos asistentes de voz en el siguiente video:
Siri o Cortana, ¿cuál de los dos asistentes está más disponible para charlar contigo?
Por último, por tratarse de un modo de comunicación social, el desarrollador de interfaces conversaciones debe contar con un conocimiento sólido de la sintaxis, la morfología, el léxico y el nivel prosódico de la lengua, pero, sobre todo, con un dominio sólido de las prácticas interactivas conversacionales que le son propias.
Esto último presupone conocer tanto la forma como el funcionamiento de los mecanismos, los fenómenos y los elementos conversacionales que emplean los miembros de una determinada comunidad lingüística para estructurary dotar de significado sus intercambios, lo que, de manera conjunta, en Lingüística conocemos con el nombre de competencia conversacional (es decir, la manera en la que los interlocutores emplean una determinada estructura secuencial para saludar, pedir favores, contar un chiste, expresar una queja, etc. en una determinada lengua).
En la conversación, hasta las pausas cuentan con significado lingüístico.
Por ejemplo, en las secuencias narrativas en castellano, es bastante común que el hablante dé pie a la narración con un turno de habla ( intent) de tipo ¿A que no sabes lo que me ha pasado hoy?, lo que, en el caso de que el interlocutor contrario (es decir, el oyente) exprese interés por la historia, da lugar a una secuencia narrativa en la que la manera en la que se estructuran los intents se encuentra estandarizada culturalmente en cada lengua.
Hablante: ¿A que no sabes lo que me ha pasado hoy? Intent generador de la narración. Inicio de secuencia. Oyente: ¿El qué? Expresión de interés, aceptación de la historia Hablante: Pues mira, pasaba en bicicleta por Alexander Platz, yo iba todo despistado, sale la poli de ninguna parte, me paran y me ponen una multa de 80 euros por ir a toda pastilla por zona peatonal. Cuerpo de la historia, los intents del oyente quedan suspendidos temporalmente hasta el final de la historia. Oyente: ¿De verdad? (risas). Es la segunda en este mes, estás loco, tío, no aprendes. Evaluación de la historia Hablante: (Risas) No aprendo, no. Son ya 160 pavos tirados por la ventana. Reacción a la evaluación de la historia. Oyente: Qué idiota (risas). Intent evaluativo sin contenido semántico, inicio de cierre de secuencia Hablante: Sí, (risas). Turno de apoyo del oyente sin contenido semántico. Cierre de secuencia.
El conocimiento lingüístico y estructural de estas arquitecturas locales estandarizadas de la conversación, además de las posibles variantes que su desarrollo interactivo implica, revierte en el diseño de algoritmos convesacionales mucho más optimizados.
Muy a menudo, el rápido avance que está experimentando el aprendizaje automático ( machine learning) y su enorme importancia para la industria de las interfaces de voz dejan casi completamente en la sombra el valioso conocimiento sobre la conversación que cuentan las disciplinas lingüísticas especializadas en ella.
La transferencia del conocimiento que, principalmente, el Análisis de la Conversación, la Pragmática y la Sociolingüística cuentan sobre el funcionamiento las arquitecturas locales de la conversación y la influencia del contexto en su desarrollo contribuiría a mejorar, significativamente, la implementación de los paradigmas de interacción entre humanos y máquinas.
En un futuro cercano, la formación académica y profesional de los desarrolladores de sotfware y los diseñadores UX especializados en interfaces conversacionales dará la misma importancia tanto al conocimiento procedente de las Ciencias Computacionales como de la Lingüística.
The post Aspectos socioculturales del diseño UX conversacional first appeared on Planeta Chatbot.
]]>The post Metodologías etnográficas en el diseño UX conversacional first appeared on Planeta Chatbot.
]]>En el Análisis de la Conversación (AC), el término habla interactiva o habla-en-interacción hace referencia al estudio sistemático de la conversación cotidiana o espontánea no como mero resultado de la producción verbal de una serie de mensajes alternos por parte de un hablante y un oyente, sino como la consecución de una serie de prácticas sociales e interactivas entre miembros de una misma comunidad lingüística que colaboran con el objetivo de alcanzar una comunicación ordenada y situada.
Mientras que el calificativo “ordenado” describe el proceso que los hablantes llevan a cabo para transferir los razonamientos tácitos -que siguen un orden y garantizan el establecimiento de intersubjetividad entre los hablantes- a la producción del habla natural, el hecho de que un mensaje se encuentre “situado” significa que este es solo comprensible unido al marco contextual en el que ha sido producido.
La idea de “situación” se utiliza también en Inteligencia Artificial cuando un robot o un agente se encuentran insertados en un determinado ambiente. Dado que los asistentes virtuales existen en contextos dinámicos -que pueden manipular o cambiar a través de sus acciones y que pueden sentir o percibir- su modo de comunicación conversacional es susceptible de ser analizado también desde una perspectiva lingüístico-contextual en vistas a su implementación.
Dado que los asistentes virtuales existen en contextos dinámicos, su modo de comunicación conversacional es susceptible de ser analizado desde una perspectiva lingüístico-contextual en vistas a su implementación.
¿Por qué resulta útil aplicar un análisis pragmático a las interacciones que los humanos mantenemos con el agente conversacional personificado/interfaz de usuario inteligente que representan las interfaces conversaciones? Principalmente, porque el mayor nivel de variación lingüística que existe entre las capacidades comunicativas de los humanos y las máquinas en la actualidad se localiza en el nivel pragmático-discursivode la lengua.
Con este concepto, adaptado de la Sociolingüística, nos referimos al hecho de que, dado que el grado de personificación (embodiment) actual de los asistentes virtuales viene representado, casi exclusivamente, por sus capacidades auditivas y de habla, resulta completamente inviable que estos puedan acceder satisfactoriamente al contexto interactivo que manejamos los humanos.
Esto revierte en el hecho de que, en la práctica, en el desarrollo de una conversación humano-máquina, los mensajes se producen y procesan en dos contextos diferentes, que cuentan con un bajo nivel de solapamiento entre ellos:
Alexa es un agente con un bajo nivel de personificación, solo puede escucharte y hablarte un poco. Su acceso a tu contexto es limitado.
El espacio en el que se fusionan ambos contextos viene constituido, por tanto, por el espacio interactivo que posibilita que el humano y la máquina intercambien mensajes alternos entre ellos, cuyo nivel de cohesión textualy coherencia discursiva se encuentra tan sumamente limitado que cualquier intento interactivo que traspase las capacidades de la máquina conduce a la interrupción inmediata de la comunicación (error). Esta es la razón por la que, de manera inconsciente, cambiamos de manera adaptativa y estratégica nuestra forma de conversar cuando hablamos con un asistente virtual.
En nuestra opinión, existen dos aplicaciones básicas del análisis pragmático a la implementación de interfaces conversaciones.
Este último punto es el que deseo desarrollar en esta entrada.
¿De verdad vas a aplicar los métodos de la Etnografía de la Comunicación al análisis de las conversaciones humano-máquinas?
Para una mejor comprensión de la interacciones situadas, la Etnografía de la Comunicación ha llevado a cabo la conceptualización de las nociones de acto comunicativo, evento comunicativo, situación comunicativa, práctica comunicativa y comunidad de habla con el objetivo metodológico de estudiar las normas lingüísticas y los patrones de interacción socialcomo un todo inseparable. A continuación, presentamos la definición de cada uno de estos conceptos.
Durante el transcurso de una conversación, la expresión de un enunciado como Hace mucho calor en el coche constituye un acto comunicativo, cuyo significado completo solo es accesible para el receptor del mensaje si se encuentra acompañado del contexto en el que se produce.
En este sentido, si el emisor del enunciado anterior se encuentra en el asiento posterior del vehículo, sin acceso a los controles de regulación del aire acondicionado, el conductor entiende que la emisión anterior representa una petición indirecta para que se baje la temperatura.
Por su parte, la sucesión secuencial de los actos comunicativos en el marco de la interacción incide en la articulación de un evento comunicativo, que constituye un segmento de la vida social de los participantes caracterizado por contar con un inicio y un final claramente delimitados y por seguir una serie de patrones y dinámicas de naturaleza específica.
Las conversaciones, los debates, las mesas redondas, las transacciones médico-paciente o profesor-alumno constituyen, entre muchos otros, diferentes tipos de eventos comunicativos en los que los interlocutores tienen que poner en práctica el conocimiento que cuentan sobre las reglas interactivas que los rigen para poder ser socialmente funcionales.
A la vez, cada tipo de evento comunicativo guarda una fuerte dependencia con la situación comunicativa en la que se lleva a cabo (entendida como el contexto y la escena de la interacción), lo que también limita el tipo de evento que puede producirse en su marco contextual.
No te relajes demasiado, sigue siendo una entrevista.
Por ejemplo, durante el desarrollo de la vista oral de un juicio es bastante difícil que ninguno de los participantes se arriesgue a contar un chiste. De la misma manera, en una entrevista de trabajo, por mucho que esta se plantee de manera relajada, el intercambio entre los interlocutores no funciona siguiendo los mismos mecanismos comunicativos que los aplicados en una conversación cotidiana con un conocido o amigo, debido al desequilibrio de poder que existe entre el entrevistador y el entrevistado.
Por último, de manera global, los actos, los eventos y las situaciones comunicativas habituales en una determinada comunidad de habla conforman un conjunto de prácticas comunicativas, cuyas normas de uso e interpretación representan el conocimiento más relevante con el que cuentan sus miembros integrantes.
Dicho conocimiento se relaciona con aspectos sociopragmáticos, que sonaltamente variables incluso dentro de distintas variedades de la misma lengua. Por ejemplo, aunque en el español de España es bastante común emplear peticiones directas incluso con extraños (como en la situación comunicativa en la terraza de un bar en la que el cliente puede llamar la atención del camarero diciendo Oye, tráenos más hielo), en las variedades de América Latina este tipo de práctica comunicativa resulta descortés.
Si trasladamos los conceptos expuestos anteriormente a la conversación humano-máquina, para que esta resulte funcional, es necesario que el diseñador sea capaz de plasmar en los diálogos no solo el sistema lingüístico que conforma cada turno ( intent/utterance), sino también las prácticas interactivas que lo generan.
En cierta forma, las prácticas interactivas representan una suerte de protocolos de interacción que la máquina puede emplear para especificar y llevar a cabo diferentes tipos de tareas comunicativas de manera lo más cercana posible a lo que sucedería en una conversación cotidiana entre humanos.
Dichos protocolos solo adquieren significado completo cuando se conectan con la dimensión sociocultural y el contexto inmediato en los que han sido producidos, dos variables lingüísticas que podemos incluir también en nuestros diálogos mediante la aplicación de metodologías etnográficas de observación y análisis de situaciones comunicativas.
Comandos de voz, el mejor protocolo de interacción para interrogar a fondo a tu asistente virtual.
Para poder implementar la integración de la dimensión sociocultural y las normas lingüísticas en el diálogo, podemos hacer uso de una serie de procedimientos etnográficos que aplican las perspectivas emic y etic, según como se entienden en la Etnografía de la Comunicación, la Sociología y la Antropología Social.
La primera estrategia emic que podemos emplear con el objetivo de implementar la calidad del diálogo viene representada por la aplicación del conocimiento y la capacidad investigadora sobre los diferentes tipos de eventos comunicativos con los que contamos como miembros de nuestras propias comunidades de habla.
Esto significa que si vamos a crear un diálogo en el que la máquina guíe al usuario en la compra de un determinado producto en la tienda virtual de una marca, antes de comenzar su redacción, resulta necesario investigar detalladamente los protocolos de interacción que los usuarios emplean, de manera estandarizada, en las transacciones que se producen:
(1) En general, en el género discursivo global en el que se engloba el diálogo (compra-venta) en las interacciones orales de la vida diaria;
(2) A través de la experiencia del cliente en los puntos físicos de contactocon la marca;
(3) En la experiencia del cliente en los puntos de contacto digital (página web, tienda online, aplicación móvil, comunidad virtual en redes sociales, etc.).
El conjunto de estos protocolos de interacción forma parte de las expectativas interactivas del usuario y, por tanto, necesitan quedar reflejados adecuadamente en el diálogo.

La segunda estrategia emic de predefinición de la conversación incluye el estudio y la delimitación exhaustiva de la persona tanto de la máquina como del conjunto de los posibles subtipos de usuarios ideales que van a emplear nuestra aplicación en voz.
En lo que respecta a la persona de la máquina, es importante prestar atención al impacto sobre la calidad de comunicación que representa el hecho de que, hoy día, los asistentes virtuales se encuentren configurados (todavía) comoagentes conversaciones con un bajo nivel de personificación.
Cortana es solo dos aros que vibran en su aplicación, pero los usuarios ya desean ver cómo es de cuerpo entero. El usuario de este video habla con ella teniendo a su avatar como fondo de pantalla.
Esto significa que, dado que el canal visual que sustenta la comunicación no verbal se encuentra ausente, debemos realizar un esfuerzo adicional en la definición de las características de la personalidad de la máquina para estas queden adecuadamente reflejadas (e, incluso, en cierta medida también, en ciertos momentos, enfatizadas) en los diálogos.
La complejidad de dicha tarea es tal que, en el futuro, desearía dedicar una entrada específica a la aplicabilidad de los enfoques etnográficos a la creación de personas, por otra parte, totalmente complementarios a los que se emplean en el diseño UX.
La Etnografía de la Comunicación permite también la aplicación de una metodología etic a la hora de predefinir el contexto interactivo en el que se va a desarrollar la conversación.En este enfoque, el diseñador adquiere una posición externa a su comunidad de habla como agente observador, lo que le permite llevar a cabo el análisis del contexto comunicativo de una manera más objetiva.
En este ejercicio, una suerte de trabajo de campo antropológico, el principal instrumento de recogida de datos que podemos emplear es la plantilla creada por Hymes para analizar sistemáticamente los eventos comunicativos. En ella, los componentes del contexto quedan resumidos por el autor con el acrónimo mnemotécnico de SPEAKING:

Plantilla SPEAKING para el estudio de las situaciones comunicativas de Hymes
Aunque, como hemos señalado, la plantilla SPEAKING se emplea comúnmente en la Etnografía de la Comunicación como un instrumento de observación de interacciones en marcha (y, por lo tanto, también puede adaptarse para ser utilizada en la iteración de prototipos de interfaces conversaciones), en nuestra opinión, también puede servir como un instrumento de predefinición y “precaptación” del contexto interactivo en el que diálogo humano-máquina va a situarse.
Utilizada de esta última manera, la plantilla facilita la definición del conjunto de las variables comunicativas que inciden en la configuración del escenario, los participantes, las finalidades, los actos, la clave, los instrumentos, las normas y el género en los que se va a contextualizar la conversación humano-máquina que vamos a construir.
A continuación, presentamos un ejemplo práctico de aplicación de la plantilla SPEAKING, en el que se define el contexto interactivo para una aplicación en voz en la que el asistente virtual adquiere el rol de profesor de idiomas y el humano de aprendiz.



Como puede observarse, la plantilla puede utilizarse como un esquema conceptual para la predefinición del diálogo y el contexto, cuya extensión puede adaptarse a la complejidad interactiva requerida por la aplicación de voz en cuestión. Por último, otra de sus posibles implementaciones es que la sección de “instrumentos” constituye ya un primer espacio de conceptuación de las necesariamente por venir en el futuro implementaciones multimodales de la interfaz conversacional.
Desde un punto de vista lingüístico, el diseñador de VUI se enfrenta con la doble tarea de crear diálogos que se adapten adecuadamente a las expectativas comunicativas de los usuarios dentro de un contexto interactivo que la máquina pueda navegar sin dificultades.
En general, la integración de los aspectos contextuales en el diálogo, a través de las metodologías etnográficas que hemos presentado, posibilita:
En el futuro, la personificación (embodiment) más avanzada de los asistentes permitirá que su acceso al contexto interactivo sea mucho más completo. Mientras que llegan estos avances, como diseñadores de interfaces conversacionales, resulta fundamental aplicar nuestras capacidades creativas e investigadoras a la implementación contextos funcionales para todos los participantes en la interacción. El conocimiento aportado por las disciplinas lingüísticas resulta fundamental al respecto.
Originally published at https://www.linkedin.com on June 24, 2018.
The post Metodologías etnográficas en el diseño UX conversacional first appeared on Planeta Chatbot.
]]>The post Diseño UX conversacional: pensamiento y conversación first appeared on Planeta Chatbot.
]]>En una entrada anterior mencionábamos ya que el Análisis de la Conversación (AC) se ocupa del estudio sistemático de lo que se conoce, en general, como habla interactiva o habla-en-interacción y, más concretamente, como conversación cotidiana o espontánea.
En el estudio de la conversación, el AC parte de tres presuposiciones teóricas que se encuentran conectadas entre sí:
Estos tres conceptos ayudan al analista a comprender la verdadera naturaleza de la conversación cotidiana. En el campo de la interacción humano-máquina, pueden ser empleados como guías teóricas para las construcción de diálogos más naturales y avanzados.
Dando comienzo a una serie de tres entradas, en la que nos ocuparemos individualizadamente de cada concepto, a continuación, pasamos a describir las utilidades de emplear una metodología de escritura de diálogo basada en el reconocimiento y la aplicación de los procedimiento de pensamiento tácito en los que se fundamenta la conversación cotidiana.
Como hemos señalado, el AC considera que los interlocutores extraen significado de las conversaciones en las que participan mediante la codificación explícita de una serie de procesos de razonamiento tácitoque siguen un orden y garantizan la adecuada producción del habla natural.
El objetivo final de la disciplina es explicar la naturaleza del pensamiento racional que el interlocutor debe poner en práctica, junto a una serie de competencias sociolingüísticas, para:
El AC parte, pues, de la hipótesis de que la conversación constituye la materialización verbal del lenguaje como instrumento de pensamiento. Dado que el objetivo último del lenguaje es la comunicación, resulta lógico suponer que nuestros intercambios conversacionales se encuentran fundamentados en mecanismos cognitivos subyacentes, cuya organización facilita el establecimiento de la intersubjetividad entre los interlocutores.
De esta manera, los mecanismos estructuradores de la conversación cotidiana pueden entenderse como esquemas mentales que:
Pensamiento, lenguaje, conversación.
La creación de interfaces conversacionales revierte en un cambio de paradigma radical en el modo de interacción humano-máquina que se ha mantenido hasta el momento. Por primera vez, desde la invención de los ordenadores, son las máquinas las que tienen que aprender el lenguaje natural de los humanos.
Por primera vez, desde la invención de los ordenadores, son las máquinas las que tienen que aprender el lenguaje natural de los humanos.
Esto significa que, si el objetivo final es diseñar una interacción verbal humano-máquina efectiva, en ella deben quedar reflejados los esquemas de pensamiento y las prácticas socioculturales englobados en cada uno de los protocolos de interacción que los humanos empleamos en la conversación cotidiana.
Para ilustrar este punto, emplearemos, una vez más, el ejemplo de los comandos de voz, el protocolo de interacción usado, por antonomasia, en las interacciones humano-máquina desde la aparición de los ordenadores.
Como resultado del mantenimiento de dicho legado (que, empleando un término extraído del campo del diseño UX, podría entenderse como una suerte de), en la actualidad, lo más común es que las conversaciones con asistentes virtuales sigan planteándose como un intercambio de comandos y respuestas, al estilo del que presentamos a continuación.
Usuario: Alexa, ¿cuáles son mis citas de hoy? Alexa: Hoy tienes tres citas. A las nueve y media tienes la reunion con Carlos. A las doce y media es el almuerzo con Ana y a las cinco y media la cita con el peluquero.
Por una parte, aunque este tipo de interacción pueda resultar pragmáticamente adecuada en el contexto de la interacción humano-máquina -ya que, simplemente, nos hemos acostumbrado a ella-, por otra parte, dicho tipo de protocolo de interacción revierte en una experiencia insatisfactoria por parte del usuario.
La razón de ello es que los comandos de voz no se corresponden con las prácticas interactivas propias de la conversación cotidiana, por lo que, en ellos, tampoco tienen cabida las dimensiones sociales y emocionales propias de la interacción verbal entre humanos.
What next?
¿Cómo podemos mejorar, entonces, la experiencia del usuario a la hora de aplicar protocolos de interacción que supongan un procesamiento más natural de las peticiones?
La respuesta se encuentra en la integración de los esquemas de pensamiento y las prácticas socioculturales que comúnmente empleamos de manera estandarizada en las conversaciones cotidianas entre los humanos en los protocolos de interacción con las máquinas. Como mencionamos ya en otra entrada anterior, esto requiere por parte del diseñador de VUI un trabajo previo de investigación lingüística y etnográfica antes de dar paso a la escritura del diálogo.
Retomando el ejemplo concreto de los comandos de voz, el acto de hablacontenido en ellos es la petición. La naturaleza directiva del requerimiento, en el que un interlocutor demanda un objeto o servicio de otro, incide en la posibilidad de que el rostro social (social face) de la persona receptora de la petición pueda verse atacada.
Como consecuencia, en la conversación cotidiana, las peticiones:
“Máquina, no te entiendo”
Veamos cómo funcionan algunas de las premisas comunicativas anteriores en una petición extraída de una conversación cotidiana real. En el ejemplo, después del turno de habla, describimos la función ilocutiva que este cumple en la secuencia del habla.

Como puede observarse, para que el interlocutor pueda cumplir con el requerimiento de cortesía a la hora de plantear una petición (es decir, preguntar indirectamente), el turno adyacente básico, sustraído del contexto social, que podríamos conceptualizar como “ Dame los apuntes — Sí, toma”, se expande a una estructura conversacional compuesta por cinco turnos, en la que el Interlocutor A, mediante la aplicación de una petición indirecta en el primer turno, consigue reconducir su requerimiento hacia la emisión de un ofrecimiento por parte del Interlocutor B en el segundo turno.
Cognitivamente, esto no sería posible si el Interlocutor B no compartiera con el Interlocutor A el conocimiento sobre el esquema de pensamiento humano que define el hecho de que cuando alguien le pregunta a otra persona sobre la tenencia de un objeto es que, muy posiblemente, lo requiera. Los humanos adquirimos este tipo de conocimiento a través del proceso de socialización y se encuentra íntimamente relacionado con pautas de mantenimiento del orden social a través de la cortesía.
¿Es posible asumir que, como consecuencia del nuevo modo de socialización humano-máquina, prácticas interactivas como la anteriormente descritas se extiendan a la conversación humano-máquina?
Absolutamente sí. Nuestra opinión personal es que, de hecho, sería deseable para que los usuarios de asistentes virtuales pudieran disfrutar de una experiencia conversacional más avanzada y natural. Es la tarea del diseñador de diálogo insuflar la humanidad de la conversación en el pensamiento de la máquina.
Es la tarea del diseñador de diálogo insuflar la humanidad de la conversación en el pensamiento de la máquina.
La técnica que guía la escritura del diálogo es bastante simple: una vez que hemos aislado el esquema subyacente que guía el acto de habla en la conversación entre humanos, podemos crear intercambios más naturales como el siguiente.

Un aspecto bastante interesante de esta metodología de creación de diálogo es que, al usar esquemas interactivos de la conversación humana, resulta natural insertar en ellos elementos lingüísticos relacionados con la cortesía (peticiones mitigadas con marcadores como por favor, agradecimientos, mantenimiento de un tono cordial en la conversación, etc.).
En otras palabras, el análisis de sentimientos (sentiment analysis) y su marcación en distintos grados en la conversación resulta mucho más fácil para el diseñador de VUI si se parte de ejemplos de conversaciones reales.
Como hemos visto, en el AC, los procesos de razonamiento tácito que codificamos explícitamente a través de la conversación constituyen el instrumento del que los humanos disponemos para crear e intercambiar significado durante nuestros encuentros sociales.
La extensión de dichos procesos de pensamiento a la interacción humano-máquina resulta, además de posible, necesaria. El conocimiento de dichos aspectos lingüísticos propios de la conversación constituye, pues, una de las competencias básicas del diseñador de VUI. Dentro de equipos multidisciplinares, parte de nuestro trabajo reside en defender la validez del desarrollo de experiencias conversacionales de usuario con un mayor fundamento en las prácticas interactivas que empleamos día a día entre los humanos.
Aunque las prácticas que creemos se encuentren enmarcadas en la naturaleza híbrida propios de los nuevos modos de comunicación humano-máquina, estos seguirán siendo más accesibles para los usuarios porque, en cierta manera, siguen siendo humanos.
Originally published at https://www.linkedin.com on July 11, 2018.
The post Diseño UX conversacional: pensamiento y conversación first appeared on Planeta Chatbot.
]]>