Cómo Cortana de Microsoft llevará a los asistentes digitales personales al siguiente nivel

Cómo Cortana de Microsoft llevará a los asistentes digitales personales al siguiente nivel

Cómo Cortana de Microsoft llevará a los asistentes digitales personales al siguiente nivel

SAN FRANCISCO—Cuando Microsoft presentó su tecnología de «asistente digital personal» Cortana esta semana, algunos la descartaron como una respuesta demasiado tardía a Siri y Google Now de Apple. Pero aparte de una voz femenina y cierta superposición funcional, Cortana no es estrictamente una respuesta a ninguna de estas herramientas basadas en voz: es una respuesta a preguntas más amplias sobre cómo usar el poder de los servicios en la nube de una manera personal y no intrusiva. . manera.

Cortana es solo la primera gran recompensa de la inversión continua de Microsoft en la plataforma Bing, así como una gran cantidad de tecnologías de big data que podrían impactar dramáticamente la forma en que las personas interactúan con la información, las aplicaciones y el mundo que las rodea.

Microsoft claramente tiene planes para Cortana que van mucho más allá de Windows Phone. Durante Build, los ejecutivos de Microsoft mostraron cómo algunas de las funciones de personalización de Cortana pueden exponerse en Bing, y parece casi inevitable que también se conecte a las plataformas Windows, Office 365 y Azure. Siri ya usa las API de búsqueda de Bing, y dada la forma en que se creó Cortana (una aplicación de cliente relativamente liviana que aprovecha las interfaces de los dispositivos locales, respaldada por un enorme poder de computación en la nube), los componentes del sistema podrían terminar fácilmente en aplicaciones para otros dispositivos. incluidos los que ejecutan iOS y Android.

Todo lo que Microsoft realmente necesita hacer es lograr que Cortana aprenda a comportarse. Todavía está aprendiendo algunas cosas, como lo reveló mi breve experiencia práctica en Build.

nube primero

En una presentación de Build, los miembros del equipo de productos de Bing profundizaron en la arquitectura de Cortana para mostrar cómo el sistema fue el resultado del mantra «primero la nube, primero el móvil» promocionado por el nuevo director general de Microsoft, Satya Nadella. . Cortana es, en palabras del director de investigación de Microsoft, Stefan Wietz, «una capa de orquestación que desencadena [services] dependiendo de la intención del usuario. Y esta capa de orquestación vive principalmente en la nube.

Publicidad

Algunos elementos de Cortana solo viven en Windows Phone, al menos por ahora. Uno de ellos es el «Cuaderno», un almacén de datos de todas las preferencias, intereses y contactos y ubicaciones más importantes del usuario. Algunos detalles deben ingresarse explícitamente en el Notebook u otras aplicaciones que se utilizarán, mientras que otros provienen del descubrimiento de datos estructurados en mensajes de correo electrónico en la bandeja de entrada del usuario, como reuniones y reservas de vuelos.

Para hacer que Cortana sea menos «aterrador», los usuarios pueden eliminar los elementos de Notebook con los que no se sienten cómodos con el seguimiento de Cortana, o que podrían ser el resultado del reconocimiento de patrones incidentales. Y el código local también maneja «geocercas» para solicitudes como «Recuérdame que llame a mi esposa cuando llegue al trabajo». Aquí, Cortana usa ubicaciones conocidas de Notebook junto con datos de geolocalización para determinar cuándo se cumple la condición y se debe realizar la devolución de llamada.

Pero la mayor parte del código local de Cortana está ahí solo para enviar datos del contexto del usuario a la nube. El resto de Cortana depende en gran medida de los componentes de la nube de Bing.

Por ejemplo, Cortana usa el reconocimiento de voz de Bing para convertir el habla en texto y se basa en el motor de lenguaje natural de Bing para procesar ese texto en una solicitud o comando. (La capacidad de reconocimiento de voz también está disponible como un componente para los desarrolladores de Windows 8 y Windows Phone). Wietz dijo que Bing anonimiza y almacena las entradas de voz en el sistema de reconocimiento de voz durante aproximadamente 30 días para ayudar a los ingenieros a comprender por qué las cosas salen mal cuando la red engaña al analizar. una sentencia. Y Bing transmite los resultados que obtiene de este análisis en vivo como texto para el usuario, por lo que es fácil para el usuario darse cuenta cuando se le escuchó mal.

Un servicio de administración de conversaciones alojado en la infraestructura de Bing ayuda a mantener el contexto de las conversaciones de voz con el servicio, lo que le permite «dividir» una consulta en partes, como dijo Wietz, y le permite hacer preguntas de seguimiento para que Cortana pueda (generalmente ) ser capaz de inferir el contexto de las preguntas anteriores.

Publicidad

Una diapositiva de Microsoft que describe los componentes de Cortana. Agrandar / Una diapositiva de Microsoft que describe los componentes de Cortana.

aprende todo

Para responder preguntas sobre el mundo que no se responden en Notebook, Cortana utiliza la gran cantidad de conocimiento de Bing. Gran parte del poder semántico de Cortana es el resultado de la base de datos de «entidades» de Bing, que Microsoft presentó originalmente hace casi dos años.

A medida que Microsoft construyó su colección de definiciones de entidades (con la ayuda de aquellos que agregaron información de esquema a su contenido web a través de esfuerzos como Schema.org) y agregó un flujo de información estructurada de otras fuentes, la base de datos se convirtió en una expansión del conocimiento. Esto le permite a Cortana ir más allá de solo procesar una consulta en lenguaje natural en una búsqueda web, en lugar de identificar otras cosas que se pueden hacer con los resultados, como hacer una reserva en un restaurante.

Además de las capacidades de la Entidad, Microsoft ha agregado un ejército de servidores de procesamiento de flujo para monitorear la información de eventos en el contenido web y otras fuentes de datos a medida que ocurren. Según los datos del usuario, por ejemplo, Cortana podría suscribirse para transmitir datos sobre un vuelo de una aerolínea desde un itinerario en el correo electrónico del usuario, un «descubrimiento de preferencias que el usuario puede eliminar o aprobar». Según Savas Parastatidis, arquitecto de software del equipo de Bing, Microsoft ejecuta cientos de millones de «consultas persistentes», solicitudes de procesamiento de secuencias específicas que activan una alerta cuando se descubren datos coincidentes en los datos. Estas consultas pueden generar alertas para «decenas de millones de usuarios», dijo, y el sistema puede escalar a miles de millones de consultas para atender a cientos de millones de usuarios simultáneos.

Deja un comentario

Tu dirección de correo electrónico no será publicada.