¿Cuál es la tecnología detrás de la aplicación Summly recién adquirida por Yahoo?

Summly utiliza un método más abstracto, comenzando con un algoritmo especial que extrae texto de una página web mediante el procesamiento HTML. La aplicación analiza el texto y regurgita partes condensadas seleccionadas del artículo como viñetas.

El algoritmo Summly logra esto utilizando una serie de técnicas de aprendizaje automático y algoritmosgenéticos” , una búsqueda heurística que imita la evolución.

D’Aloisio desarrolló su algoritmo final empleando inicialmente un algoritmo de entrenamiento: su método examinó resúmenes escritos por humanos de artículos de varios tipos y de varias publicaciones. Luego utilizó estos resúmenes como modelos de lo que Summly debería escupir, y cómo debería cambiar sus propias métricas para emular mejor el trabajo de los conservadores de información de carne y hueso.

Summly también analiza los temas que cubre un sitio web, por lo que las piezas individuales de contenido se pueden clasificar como relacionadas con negocios, tecnología, deportes, etc. Esto ayuda al algoritmo a consolidar con mayor precisión el texto.

More Interesting

¿Qué sucederá si divido mis datos en 50:50 para capacitación y pruebas?

¿Es aconsejable crear una aplicación basada en el aprendizaje automático y el procesamiento de imágenes sin comprender el concepto matemático subyacente?

¿Cuáles son algunos proyectos paralelos de Machine Learning que puedo implementar en mi tiempo libre?

¿Es posible que una computadora aprenda a distinguir gatos de perros de solo un conjunto de imágenes sin que le digamos qué imágenes son gatos y cuáles son perros, o incluso si hay cosas como gatos y perros, y si es así, cómo es exactamente esto? ¿hecho?

¿Debo usar Python o Scala para construir un sistema de aprendizaje automático para mi aplicación?

¿Cuáles son las aplicaciones HOT de Machine Learning para las ciencias biológicas?

¿Qué tecnologías existen actualmente para hacer matemáticas en grandes conjuntos de datos?

¿Es cierto que las redes neuronales son más rápidas en las mujeres?

¿Qué tan bueno es el programa de maestría en visión por computadora de la Universidad Autónoma de Barcelona en términos de contenido, costo y futura carrera (directamente trabajo o doctorado)?

¿Podemos agregar la capa SVM como capa inferior en la arquitectura CNN para una mejor clasificación?

¿Son los sistemas de recomendación actuales lo mejor que podemos hacer?

¿Cuál es la relación de la función objetivo de muestreo negativo con la función objetivo original en word2vec?

¿Cómo se usa Machine Learning en las diferentes etapas de los sitios web de comercio electrónico (compras en línea)?

¿Cómo se puede utilizar el aprendizaje automático para la metabolómica?

¿Cómo puedo aprender a realizar simulaciones de dinámica molecular? ¿Cuáles son algunas buenas fuentes para aprender sobre este campo?