Expertos de la BUAP hablan del impacto de esta tecnología en la vida cotidiana de las personas, así como de los proyectos que desarrollan en esta área
Por: Redacción
En el 2008, Iron Man le mostró a los espectadores cómo sería la vida con un asistente personal con inteligencia propia, una realidad que en la última década han desarrollado grandes compañías tecnológicas: asistentes de voz virtuales, interfaces basadas en Inteligencia Artificial (IA), que este año formarán parte de los autos y aparatos electrónicos como los televisores.
“La tendencia de la IA en la actualidad es utilizar comandos de voz para realizar diversas actividades -que de por sí ya se hacían- con mayor eficiencia, debido a los mejores sistemas de cómputo, lo cual tendrá un impacto muy fuerte en la vida cotidiana de las personas”, afirmó David Pinto Avendaño, profesor investigador de la Facultad de Ciencias de la Computación (FCC) de la BUAP.
Uno de los elementos más importantes es el tamaño de los dispositivos de tratamiento de información; es decir, sistemas de cómputo muy reducidos y con capacidad de procesamiento de datos muy grande, lo cual ha tenido un efecto en diferentes vertientes como la trascripción y síntesis de voz, explicó.
En su opinión, tener a la mano dispositivos a los que se les pueda hablar, entiendan lo que se les dice y pasen esta información a texto, con una eficiencia y calidad muy altas, representa un salto tecnológico muy alto en la ejecución de procesos y tareas.
Un ejemplo de esto es el dispositivo Echo Dot, desarrollado por Amazon, que tiene integrado a “Alexa”, su asistente de voz. A este tipo de sistemas es posible decirle comandos sencillos de modo que entiende, responde y realiza las acciones.
“La domótica será beneficiada totalmente de este tipo de sistemas de integración, a los cuales se les podrá ordenar cosas, como contratar un taxi, pedir una pizza, reproducir una canción, prender el automóvil, cerrar la compuerta, encender las luces de las 8:00 a las 10:00 de la noche, en caso de que una persona se encuentre fuera: incluso, avisar si hay un intruso en casa, activar la alarma y llamar a la policía, entre otras situaciones que serán posibles con la ayuda de un asistente que, además de interpretar, tiene el poder de cómputo en la nube para procesar las señales y dar una respuesta”, detalló.
El también doctor en Informática por la Universidad Politécnica de Valencia, en España, dio a conocer que otras de las tendencias en tecnología son los dispositivos que nos permiten integrar aspectos virtuales dentro de nuestra visión del mundo real, además de integrar comandos de voz, como gafas capaces de decirle a un usuario si la persona que tiene enfrente es hombre o mujer, la edad que tiene, y en caso de conocer su identidad, su nombre y a qué se dedica, entre otros datos.
“De igual forma, los manuales escritos vendrán en realidad virtual, en vez de papel, y las gafas detectarán a los objetos mediante cámaras, e indicarán cómo armarlos en el momento. Estos aspectos de integración cambiarán radicalmente la manera en la que vemos a nuestro mundo”, aseveró.
Con el objetivo de insertarse en estas tendencias y hacer contribuciones, en del Laboratorio de Ingeniería y Lenguaje del Conocimiento, cuyo responsable es el doctor Pinto Avendaño, se cuenta con este tipo de dispositivos y otros de domótica, como focos binarios con conexión inalámbrica y conectores de corriente con control por medio de voz, con los que se está trabajando.
“Tenemos dos gafas de realidad aumentada con las que estamos haciendo pruebas para desarrollar nuestras propias aplicaciones específicas, utilizando modelos computacionales y matemáticos que desarrollamos dentro del laboratorio”, mencionó.
Una de estas aplicaciones consiste en la identificación de personas para la clasificación de grupos de acuerdo con intereses o áreas de adscripción. Además, en este laboratorio se encuentran los humanoides que fueron adquiridos por la BUAP, con los cuales se hacen pruebas.
El humanoide más grande ya cuenta con un sistema de voz en español. Hoy los investigadores trabajan en modelos de representación del conocimiento para que pueda establecer una conversación basada en la interpretación, debido a que los modelos que tiene están fundamentados en un diálogo pre-escrito, de tal manera que sólo tiene ciertas opciones para responder, sin que exista una variabilidad.
“Por ello, comenzamos con un trabajo doctoral, que tendrá una duración de cuatro años, basado en procesos que permitan que los diálogos estén generados de forma espontánea, es decir que no hayan respuestas programadas, lo cual representa un reto sumamente importante”, aseveró.
Otro de los proyectos que se desarrollan tiene que ver con la generación de modelos de síntesis de voz emocional, que no existen en la actualidad, que proporcionen respuestas o comentarios enfáticos (de alegría, sorpresa, duda, etcétera), los cuales podrían integrarse a robots, asistentes personales y automóviles, entre otros dispositivos.
Este trabajo, que se realiza en colaboración con la UNAM, busca hacer más amena y natural una charla con este tipo de sistemas, al generar respuestas asociadas a sentimientos, como lo hacemos los humanos, en vez de tener un tono de voz que suene muy “robótico”, lo cual tendrá un impacto muy importante.
