¿Qué necesito saber para hacer un software que pueda leer y hacer un resumen de cualquier información?

Puede que te resulte interesante esta historia de Nick D’Aloisio. En 2011, a la edad de 15 años, creó Trimit (más tarde renombrado Summly), una aplicación que utilizaba una herramienta analítica para condensar el contenido del texto en un resumen de 1000, 500 o 140 caracteres.

Como se indica en un artículo de TechCrunch:

“El algoritmo utiliza un proceso de” extracción “para crear un resumen del texto en una de las tres longitudes especificadas. Sin revelar completamente la salsa secreta, el algoritmo escanea el texto usando una búsqueda precisa de palabras clave para encontrar temas destacados dentro de su contenido “.

“Trimit también usa lo que se llama” derivación de verbos “, que permiten que verbos particulares en diferentes conjugaciones sean contados por el algoritmo, como” hablar “versus” hablar “, por ejemplo. ”

Después de recibir importantes fondos, Nick y su equipo comenzaron a trabajar con el Stanford Research Institute (SRI) para desarrollar la tecnología de aprendizaje natural más avanzada y patentada que se lanzó en Summly. SRI es el mismo equipo que creó el asistente personal Siri de Apple en todos nuestros iPhones.

La clave de la aplicación es su procesamiento del lenguaje natural (PNL) y la traducción automática. Esta fue la columna vertebral de la tecnología que Nick construyó originalmente en TrimIt.

Summly se vendió en 2013 a Yahoo por unos $ 30 millones de dólares estadounidenses.

Recursos:

Nick D’Aloisio – Wikipedia

TechCrunch: Trimit resume correos electrónicos, publicaciones de blog y más con solo sacudir tu iPhone

Procesamiento de lenguaje natural – Wikipedia

Aprendizaje automático – Wikipedia

Minería de texto – Wikipedia

AppInstruct – Cómo crear una aplicación como Summly (gran lectura)

He hecho una programación orientada a objetos no tradicional. Lamento decir que la programación orientada a objetos probablemente no sea el tipo de producto que desea.

Es posible que desee trabajar con una empresa de aplicaciones. Muchas de las cosas involucradas deberían ser familiares para quienes conocen la programación tradicional. Al mismo tiempo, probablemente sea más desafiante de lo que piensas convertirlo en software de consumo.

La mejor opción es controlar la entrada, limitar las opciones y eso reduce drásticamente la complejidad. Por ejemplo, con aplicaciones que interpretan lo que el usuario quiere. Mucho más fácil, exponencialmente más fácil y probablemente más comercializable. Otra forma de limitar la entrada es hacerlo todo sobre conocimiento, geografía, etc. Este es un método que se emplea tradicionalmente y que no funciona muy bien con el aprendizaje automático.

Como dije, no conozco la programación tradicional, pero algunos de estos métodos de filosofía y categoría pueden ser útiles si desea estandarización:

La respuesta de Nathan Coppedge a ¿De qué maneras ha resultado fructífero el “giro lingüístico” en la filosofía occidental?

Cita a Nathan Coppedge, (filósofo), de lo contrario gratis.

También puede generar contenido personalizado tal vez más fácilmente que interpretarlo, particularmente usando los primeros cuatro sistemas y es aún mejor con alguna inferencia tradicional, particularmente interpretando las cosas que a alguien le gusta leer, y sus preferencias y especializaciones principales, y cuáles son esas preferencias y las especializaciones prefieren leer, las conclusiones de eso, cómo modificarlo para nuevas especializaciones e intereses, el conocimiento central que deben conocer, etc.

Podría estar dispuesto a ofrecer más información sobre preguntas específicas si me envía un correo electrónico. Trataré de darte mi mejor respuesta.

De lo que estás hablando se conoce como resumen automático. Es un problema abierto para decirlo suavemente. Si puede descubrir cómo hacerlo, será considerado uno de los mejores informáticos del mundo.

More Interesting

Predicción de tráfico sobre hosts o nodos en la nube: ¿es un tema de tendencia o un área de investigación en la computación en la nube?

¿En qué medida la reciente gran donación de Brendan Iribe, CEO de Oculus VR, al departamento de informática de la Universidad de Maryland (UMD) ayudará al departamento? Si se usa correctamente, ¿puede UMD convertirse en uno de los 5 mejores lugares para la informática?

¿Cuáles son los proyectos más interesantes en Facebook AI Research (FAIR)?

¿Cuáles son los temas más controvertidos en informática?

¿Son productivos los investigadores y matemáticos después de los 45? ¿Es práctico hacer un doctorado después de la jubilación?

En la investigación de CS, ¿cuál es la relación de pensamiento a implementación?

¿Por qué no hay investigador libre en informática?

¿Cuáles son algunos aspectos de investigación basados ​​en aplicaciones de big data?

¿Qué pasos debo hacer para investigar en visión artificial?

¿Cuál es el tema digno de investigación en un dominio de computación en la nube, específicamente relacionado con el almacenamiento de datos?

¿Cuáles son los mejores campos de investigación en informática recientemente?

¿Cómo es el Vietnam Journal of Computer Science en términos de reputación, tasa de aceptación y calidad de los documentos aceptados?

¿Qué áreas de la informática son las más relevantes para el aprendizaje automático?

¿Cuál es la mejor manera de mostrar resultados para un trabajo de informática?

¿Cuáles son los temas candentes para un proyecto BE en CSE?