¿Cómo obtiene Prismatic el contenido principal de cada artículo de noticias?

No estoy seguro de cómo funciona exactamente Prismatic (u otras aplicaciones / servicios similares como Zite, Flipboard, Readability, etc.) pero hay un par de bibliotecas de código abierto que pueden hacer este trabajo por usted:

boilerpipe se basa en el siguiente documento: http://www.l3s.de/~kohlschuetter… Está escrito en Java y hay muchas interfaces de extracción de texto, para mí ArticleSentencesExtractor funcionó muy bien. Escribí una publicación al respecto hace un tiempo: Extrayendo texto significativo de páginas web
Legibilidad era una aplicación basada en la web, ahora es una API: API Docs – Legibilidad, potencia las aplicaciones de legibilidad (iOS y Android)

Para mayor referencia:

Otro buen artículo que habla sobre la extracción de texto basada en la relación de texto a etiqueta: http://web.engr.illinois.edu/~we…
La manera fácil de extraer texto útil de HTML arbitrario
Descripción general: extracción del texto del artículo de documentos HTML

¿Son los robots el futuro del cuidado de los ancianos?

¿Cuál es el significado de una política estacionaria en el contexto del aprendizaje por refuerzo?

¿Cuánta inteligencia artificial comprende realmente Elon Musk?

¿Puede la inteligencia artificial hacerse consciente de sí misma?

¿Puedo usar más mapeadores y reductores simultáneamente en un programa MapReduce usando el concepto de subprocesamiento de Java? Si es así, ¿cómo? Si no, ¿por qué?

¿Qué opinas del debate entre Norvig y Chomsky sobre el futuro de la IA?

Vikash: la mejor respuesta que he visto proviene de esta presentación en la que Bradford Cross discute su uso de Closjure en la construcción de Prismatic. Por qué Prismatic se vuelve más rápido con Clojure

Vikash Singh

More Interesting

¿Qué aprendes de crear un chatbot?

¿Cuál es la forma más rentable de producir Inteligencia general artificial (AGI o IA general)?

¿Por qué hay diferencias en el rendimiento entre modelos idénticos de aprendizaje profundo implementados en diferentes marcos?

¿Cómo y cómo el aprendizaje automático y el aprendizaje profundo pueden ayudar a los gráficos por computadora?

¿Qué es el embolsado en el aprendizaje automático?

¿Cuáles son ejemplos de industrias poco atractivas que tienen problemas que podrían resolverse mediante el uso del aprendizaje automático y la inteligencia artificial?

¿Cuáles son las principales máquinas para hacer gari?

Si la IA se convirtiera en una parte real de nuestras vidas, ¿podría ser la respuesta a los viajes espaciales?

¿Cómo se puede utilizar el aprendizaje automático, la analítica y la IA junto con la ingeniería mecánica para crear algo que valga la pena?

¿Cuáles son algunos proyectos principiantes de Python y OpenCV?