¿Qué necesitan saber los desarrolladores de aplicaciones sobre Siri para interactuar con él?

La respuesta simple es escribir una API accesible en Internet para que Siri pueda acceder a sus datos para la delegación de servicios. Este será el método principal que creo que Siri usará para formar relaciones con los desarrolladores. Llamaré a esto una API de back-end para mayor claridad.

Está muy claro que Apple ni siquiera ha sugerido que tendrán una API disponible. Sin embargo, creo que se puede suponer del pasado y la necesidad de que Siri sea un acceso API más funcional estará disponible si no se fomenta. Apple ya ha creado relaciones API principales con Wolfram | Alpha, Yelp y Wikipedia.

Siri se trata de completar tareas

Es importante entender la base de Siri. Siri no es un motor de búsqueda. Siri es un motor de tareas o quizás un motor de tareas. Esto significa que el resultado final es la finalización de la tarea.

El poder de Siri proviene del acceso a las API que se solicitan una vez que se han extraído las tareas. Un desarrollador puede estar muy seguro de que no hay absolutamente ninguna necesidad de codificar el Contexto, la Interfaz conversacional, el Reconocimiento de voz, Voz a texto, Texto a voz, Flujo de diálogo. También se puede estar razonablemente seguro de que Siri producirá resultados de Discurso a texto bien presentados con un contexto completo para la API del desarrollador que puede incluir Conocimiento de ubicación, Conocimiento del tiempo, algún grado de Conocimiento de tareas con niveles apropiados de datos personales basados ​​en el tipo de servicio y Dominio (clasificación de servicio).

Para completar una tarea puede haber docenas de API accedidas. Con el tiempo podría haber cientos. Siri aprenderá con el tiempo y optimizará, sin embargo, el nuevo desarrollo de API creará un entorno constantemente dinámico.

API en todas partes

Siri utiliza las API como servicio una vez que el motor de intención ha determinado los modelos de tarea y dominio. Hay cualquier número de servicios intermedios y API a los que se puede acceder para completar una tarea de Siri.

Esto está en contraste con las API que usan Siri como una superposición a una aplicación en el dispositivo iOS es algo completamente diferente. En muchos sentidos, esto obliga a Siri a adoptar un sistema de reconocimiento de voz. Llamaré a esto una API front-end para mayor claridad. A primera vista, puede parecer que el beneficio para el desarrollador es con una API front-end porque la conexión sería directamente a la aplicación. Sin embargo, este no parece ser el modelo que utilizará Siri, aunque es posible que este tipo de API esté disponible. Creo que a corto y mediano plazo, Siri se centrará más en la API de backend.

¿Cómo puede prepararse un desarrollador?

Conozca la teoría detrás de Siri, su historia y cómo funciona realmente en el mundo real. Este es un punto de partida: ¿por qué es importante Siri?

Supongamos que creará una API de back-end para que Siri acceda a sus conjuntos de datos. Esto sería en el sprit de la API típica que encontrará en ProgrammableWeb.com, por ejemplo. Sin embargo, habría una serie de cosas que un Desarrollador puede hacer para optimizar la API de Siri entrante y saliente. Uno puede obtener mucho conocimiento sobre lo que le puede gustar a Siri en una API al estudiar la API de una de sus principales relaciones orgánicas, Wolfram | Alpha. Me dijeron que Wolfram | Alpha no cambió mucho para Siri, aparte de optimizar los resultados primarios para Speech en lugar de Display, aunque algunas tareas producirán un resultado visual con Speech.

Hay un tesoro de información que se puede encontrar en Wolfram | Alpha API. Yo comenzaría este viaje aquí:

  • http: //products.wolframalpha.com…

Es muy importante adquirir tanta experiencia con los conceptos de la Web Semántica (http://en.wikipedia.org/wiki/Sem…), Inteligencia Artificial, diálogo y comprensión del lenguaje natural, aprendizaje automático, razonamiento probatorio y probabilístico, planificación, razonamiento y delegación de servicios. Siri realizará gran parte del trabajo, pero es importante comprender estos conceptos para poder predecir cómo se desarrollarán las API de Siri.

La comprensión más importante sería estudiar Ontología (http://www-ksl.stanford.edu/kst/…) y la representación del conocimiento. Respondí una ” pregunta de Quora auto planteada ” aquí: ¿Quora es importante para Siri? sobre este tema, creo que Quora se volverá muy importante para Siri, pero Quora necesitaría desarrollar esquemas que serían optimizados para Siri.

Este artículo es el trabajo definitivo sobre ontología:

  • http://www-ksl.stanford.edu/kst/…

Organizar datos en una ontología será de gran beneficio. Sin embargo, Siri puede no exigir esto, pero creo firmemente que le daría a las API una mayor prioridad que lo haya hecho. Por supuesto, la mayoría de los datos en Internet están representados en un esquema de base de datos relacional. Las taxonomías o los esquemas de bases de datos relacionales contrastan con el funcionamiento de las ontologías para organizar la información. No importa cuál sea el dominio o el alcance, una ontología es una descripción de una visión mundial de los datos. Esta vista podría ser limitada y minúscula, o podría ser global y expansiva. Sin embargo, a diferencia de las vistas jerárquicas alternativas de conceptos como las taxonomías, las ontologías tendrán una estructura “gráfica” vinculada o en red. Múltiples cosas pueden estar relacionadas con otras cosas, todo en una serie de relaciones potencialmente múltiples.

En la forma más simple, Siri sin duda analizará una cadena de texto simple en la API y buscará una cadena de texto simple a cambio. Sin embargo, creo que los datos formateados en ontologías permitirían a Siri mucho más potencial para las preguntas que están entrantes, así como las ontologías de datos en la salida como respuesta.

Para ver una hoja de ruta de cómo Apple puede ver el futuro, hay una patente para eso:

http: //c2499022.cdn.cloudfiles.r…

“Servicios locales (incluidos servicios específicos de ubicación y hora, como restaurantes, películas, cajeros automáticos (cajeros automáticos), eventos y lugares para reunirse); Servicios de memoria personal y social (incluidos elementos de acción, notas, eventos de calendario, enlaces compartidos , y similares); Comercio electrónico (incluidas las compras en línea de artículos como libros, DVD, música y similares); Servicios de viaje (incluidos vuelos, hoteles, atracciones y similares), navegación (mapas y direcciones); búsqueda en la base de datos (como encontrar negocios o personas por nombre u otras propiedades); obtener condiciones climáticas y pronósticos, verificar el precio de los artículos del mercado o el estado de las transacciones financieras; monitorear el tráfico o el estado de los vuelos; acceder y actualizar calendarios y horarios; administrar recordatorios, alertas, tareas y proyectos; comunicarse por correo electrónico u otras plataformas de mensajería; y operar dispositivos local o remotamente (por ejemplo, marcar teléfonos, controlar la luz y la temperatura, controlar los dispositivos de seguridad del hogar, pl aying música o video, etc.) ”

Modelos de negocios

No asuma que solo porque, por ejemplo, Yelp ya es parte de la API orgánica, no sería necesario otro servicio que pueda calificar una experiencia gastronómica. No hay duda de que Siri usará una forma de creación de consenso para obtener los mejores resultados. Por lo tanto, se podría acceder a muchos, si no cientos de servicios competidores. De hecho, si una API es, por ejemplo, autorizada solo para Pizza, Siri con el tiempo se sesgaría a los resultados de esta API si resulta que produce las mejores respuestas.

Puedo ver literalmente miles de API que serán necesarias a medida que Siri crezca. Estoy prediciendo el mismo tipo de apuro de tierra que hemos visto en la tienda de aplicaciones que se desarrolla alrededor de Siri. Cómo funcionarán los modelos de compensación bajo Apple es un secreto muy bien guardado en este momento. Hay un modelo de ingresos que se creará alrededor de Siri. Pero claramente Apple no va a hacer nada para que la experiencia se “comercialice” en una especie de modelo Pay For Performance o Pay For Click. Puedo decir que el ecosistema financiero que se construye alrededor de Siri puede ser más grande de lo que uno podría imaginar. Mi consejo en este punto sería construir las mejores API y centrarse en la más alta calidad y no en la cantidad, y asumir que en alguna fecha futura dará sus frutos. Esto puede ser obvio, pero creo que no se puede exagerar.

Cuasi API de Siri

Hay un Cuasi API muy interesante y quizás útil disponible hoy, aunque limitado y un poco peculiar.

  1. Al enviar mensajes SMS, Siri lo hace muy bien y puede leer los resultados. Uno podría tener acceso a un sistema de preguntas y respuestas, establecer el estado de algunas aplicaciones web, registrarse y actualizar el estado de las redes sociales.
  2. El protocolo CalDAV (http://en.wikipedia.org/wiki/CalDAV). Siri permite la interacción en tiempo real con cualquier calendario CalDAV. Se podría usar esta función como un sistema de comunicación que analiza los datos dentro y fuera de un sistema que podría implementar este protocolo. Más información aquí: ¿Cómo funciona la integración de CalDav con Siri y qué comandos funcionarán a través de esta implementación?

Esto es muy temprano

La gente acaba de obtener los primeros modelos de iPhone 4S (13/10/2011). Les he aconsejado a mis clientes, y a casi todos los que escuchen, que estén listos para Siri en los últimos dos años. Francamente, estoy seguro de que algunos pensaron que era tonto con estas cosas. Sin embargo, he estudiado estas cosas desde la primera vez que vi a LISP ejecutándose en un PDP 11. Hoy tenemos las convergencias perfectas de la Ley de Moore y el increíble trabajo de SRI International / Stanford University para agradecer a Siri. Se estima que se invirtieron más de $ 750 millones de dólares en la tecnología Meta detrás de Siri.

Cuando se abra la API de Siri, la explosión de oportunidades será ilimitada y la utilidad de Siri se disparará.

More Interesting

¿Por qué la probabilidad condicional es más poderosa que la probabilidad conjunta en un nivel intuitivo?

¿Dónde puedo encontrar el código fuente para construir un árbol de decisión usando el algoritmo ID3 en C?

¿Cómo se implementa el aprendizaje profundo en Amazon Go (tiendas de comestibles especiales en las que recoges lo que quieras y luego te vas sin esperar a pagar)?

¿Cuál es el mejor marco de aprendizaje profundo que puedo usar para clasificar las imágenes de resonancia magnética? ¿Keras es adecuado para eso?

¿Cuáles son algunos documentos similares al trabajo realizado para el Proyecto Tango de Google?

¿Qué es la regularización de Tikhonov en términos simples?

¿ISRO utiliza una inteligencia artificial?

¿Cómo se relaciona el algoritmo RANSAC con la visión por computadora?

¿Cuál es el libro recomendado sobre 'plasticidad neuronal' para informáticos, programadores o profesionales de aprendizaje profundo?

¿De qué maneras incorpora Snapchat el aprendizaje automático?

¿Hay un grupo de investigadores trabajando en la síntesis de texto EEG (conversión de pensamiento a texto)?

¿Vale la pena dejar mi trabajo de desarrollador de software de USD $ 150K para estudiar el aprendizaje automático y el aprendizaje profundo?

¿Qué tipo de problemas han funcionado bien con Bayesian Networks?

¿Qué clases de modelos se pueden usar para predecir distribuciones de series de tiempo?

En el análisis de sentimientos, ¿cómo son útiles los datos etiquetados por humanos para extraer características y capacitar a los clasificadores en el enfoque de aprendizaje automático?