¿Cómo puede un sistema detectar preguntas sobre Quora y responderlas automáticamente?

Tuercas y tornillos :

Piense en las API … Cualquiera de los dos sistemas con API se puede emparejar con relativa facilidad. Hay un número creciente de API de respuesta a preguntas en lenguaje natural disponibles, por ejemplo Wolfram | Alpha API. Desafortunadamente, todavía no hay una API pública de Quora.

Sin embargo, las preguntas de Quora pueden detectarse automáticamente a través de la fuente RSS, y cada tema individual de Quora tiene su propia fuente RSS; sin embargo, parece que Quora sigue a Twitter, LinkedIn, Google y otros, ocultando o eliminando sus canales RSS. Yond Más allá de las fuentes RSS, también es relativamente sencillo raspar sitios web como Quora, utilizando cualquier cantidad de herramientas ampliamente disponibles, en efecto, creando su propia API.

Probablemente no sería tan difícil configurar una prueba utilizando ciertos canales RSS de Quora y las nuevas API de IBM Watson, por ejemplo; Sin embargo, creo que IBM todavía requiere aprobación para su uso. Para publicar las respuestas sin una API pública de Quora, hay una gran cantidad de programas de macro web disponibles, a menudo utilizados para la emulación del navegador y las pruebas de software.

Vea también mi respuesta reciente de Quora a:

  • ¿Por qué no se ha conectado Watson de IBM a Quora para responder algunas preguntas?

Quora A2A. Como señaló Andy, se ha hecho de manera limitada con la instancia de Jeopardy de Watson. IBM formó el Grupo Watson, que está ocupado ayudando a las empresas a construir instancias comerciales de Watson (una de las cuales estoy trabajando actualmente ;-).

No estoy familiarizado con el funcionamiento interno de Quora, pero podrían estar en un camino similar. Baso esto en las indicaciones ocasionales para responder preguntas. Si bien esto podría hacerse con herramientas mucho menos potentes que un sistema Watson NLP (procesamiento de lenguaje natural), podrían estar trabajando en esta dirección.

Para responder la pregunta más directamente, esto se hace usando un sistema de PNL que usa modelos entrenados para detectar una variedad de características en una cadena de texto (por ejemplo, una pregunta). Según las características detectadas, el sistema NLP determina la probabilidad de que otras cadenas de texto (respuestas) contenidas en una base de datos (corpus) se correlacionen con la cadena de texto de entrada.

Bueno, IBM lo hizo (no preguntas de Quora) en 2011:

¡En febrero de 2011, Watson derrotó a Brad Rutter y Ken Jennings en Jeopardy! Reto. El concurso de preguntas, conocido por sus preguntas complejas, difíciles y campeones muy inteligentes, fue la elección perfecta, hecha por el equipo de investigación de IBM, para este desafío extraordinario. Para jugar, mucho menos ganar, Watson tuvo que responder preguntas formuladas en todos los matices del lenguaje natural, incluidos juegos de palabras, sinónimos y homónimos, jerga y jerga.
También es de destacar que Watson no estaba conectado a Internet para el partido.

http://www.ibm.com/smarterplanet