Para algunos, la película de Spike Jonze. Ella era insoportable, para otros era una visión del futuro, pero imagina si la asistente personal de la película, Samantha, de repente le había dicho a Theodore: "Lo siento, ¿no entendí eso?" Habría matado al romance muerto.

Los estilos de conversación de Siri y Google Now no están cerca de los de Samantha, pero su desarrollo es parte de un movimiento que amenaza con eclipsar la palabra escrita. Nuestra escritura a mano nunca ha sido peor, escribir en un teclado está empezando a parecer arcaico e incluso el uso constante de mensajes de texto y los términos de búsqueda en la web pueden provocar calambres en los dedos y dolor en las manos.

Ahora, con los dispositivos iOS que permiten el envío de mensajes de voz y predicciones para autos que conducen por sí mismos y puertas, luces y ascensores activados por voz (es decir, Internet de las cosas), está claro que el futuro se hablará, no se escribirá.

La tecnología detrás de este cambio en la forma en que interactuamos con nuestro entorno es el procesamiento del lenguaje natural, una tecnología que permite a las computadoras comprender el significado de nuestras palabras y reconocer los hábitos de nuestro habla..

Rovi está haciendo la búsqueda de horarios de televisión hablada

¿Dónde veremos primero el procesamiento del lenguaje natural??

Además de Siri y Google Now, es posible que ya lo haya utilizado en Xbox One y Samsung UE65HU8500

pero hasta ahora el reconocimiento de voz ha girado en torno a una lista muy pequeña de frases y palabras. Una conversación adecuada esto no es. "Las palabras mágicas han hecho que estas tecnologías se basen en sistemas de menú estructurados en los que el comando de voz simplemente reemplaza las entradas tradicionales", dice Charles Dawes, Director de Cuentas Estratégicas Globales de Rovi. "Estos no proporcionan una experiencia satisfactoria, lo que obliga a los usuarios a aprender a hablar con el dispositivo y hace que el habla se vuelva estilizada y poco natural".

Los sistemas automáticos de reconocimiento de voz en los televisores han confiado hasta ahora en micrófonos incorporados que podrían estar lejos del espectador, aunque Mosts se está moviendo hacia las aplicaciones. "La prevalencia de teléfonos inteligentes y tabletas ofrece a los operadores la oportunidad de eludir este problema al permitir la búsqueda y las recomendaciones para el televisor a través de la segunda pantalla", dice Dawes. "El desarrollo de estos dispositivos se ha disparado, y la potencia de procesamiento ofrecida por la mayoría en el mercado proporciona una base amplia sobre la cual construir capacidades de conversación".

Pero hay muchos otros lugares donde ya estamos usando motores de lenguaje natural. Barclays Wealth lo usa para verificar el titular de una cuenta, la aerolínea JetBlue está usando publicidad de voz inteligente y Ford está usando un lenguaje natural para que los conductores controlen los sistemas en el automóvil, como el teléfono, la música, la temperatura, la navegación y las actualizaciones de tráfico..

¿Cómo funciona el procesamiento del lenguaje natural??

Una vez que se reconoce lo que alguien ha dicho, se trata del contexto y de la desambiguación de términos similares. "Un espectador podría decir '¿a qué hora es el juego de la Ciudad esta noche?', Y la tecnología de voz tendría que tomar una decisión sobre el contexto (el fútbol) y la preferencia del usuario en función de su historia. ¿Apoyan a Norwich City o Manchester? ¿Ciudad?" dice Dawes. "La tecnología también debe ser capaz de lidiar con cambios repentinos. Por ejemplo, debe reconocer que si el mismo espectador pregunta" ¿hay algún thrillers esta noche? " Ellos están buscando fuera del contexto de los deportes ".

Siri, Google Now y Cortana utilizan el procesamiento de lenguaje natural