¿Cuáles son algunos documentos de investigación de inicio sobre búsqueda, aprendizaje automático y recuperación de información?

Estoy de acuerdo con Don Metzler. Si está comenzando, será más rápido aprender a través de un curso o un libro que leyendo documentos de investigación. La mayoría de los trabajos de investigación suponen que ya conoce todos los fundamentos, por lo que si es nuevo en el campo, será realmente difícil de leer y comprender.

Aquí hay un par de libros gratuitos y cursos en línea para comenzar.

Libros

  1. Introducción a la recuperación de información por Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze. Está disponible de forma gratuita en línea y es probablemente el libro más recomendado para las personas que comienzan en el campo.
  2. Motores de búsqueda: recuperación de información en la práctica por W. Bruce Croft, Donald Metzler, Trevor Strohman. La primera edición de este libro también es gratuita para leer en línea. Y sí, es el mismo Don Metzler que también tiene una respuesta a esta pregunta :).

Cursos online

  1. Stanford CS 276: Recuperación de información y búsqueda en la web: Christopher Manning, autor del primer libro anterior, es el profesor de este curso.
  2. Recuperación de texto UIUC y motores de búsqueda por Coursera

Si está interesado solo en el aprendizaje automático, y no en el aspecto de búsqueda / recuperación de información, consulte esta excelente página de Quora sobre cómo comenzar en ML: ¿Cómo aprendo el aprendizaje automático?

Si bien admiro tu ambición y entiendo la tentación de pasar directamente a los trabajos de investigación, ese enfoque probablemente no te funcione demasiado bien.

La mejor manera de aprender sobre estos temas es tomar un curso o leer primero un libro de texto. Si no tiene una comprensión firme de los fundamentos, perderá mucho tiempo tratando de comprender los trabajos de investigación que suponen que los lectores ya saben mucho sobre el tema. Incluso la mayoría de los “documentos de encuesta” (como los mencionados por otra persona que responde) a menudo esperan que usted ya comprenda los principios fundamentales.

Aprendizaje automático en la categorización de texto automatizada, http://nmis.isti.cnr.it/sebastiani/Publications/ACMCS02.pdf . Hay muchos trabajos de encuesta sobre IR

Desafortunadamente, creo que realmente necesitas comenzar con un libro para este. La búsqueda es bastante compleja, y sin los fundamentos adecuados es como pedir documentos de matemáticas sin la comprensión necesaria del cálculo.

Para comenzar, mis libros favoritos personales son “Recuperación de información en la práctica”, “gestión de gigabytes” si le gustan más las estructuras de datos / ingeniería y también puedo recomendar “fundamentos de nlp estadística” para obtener una comprensión más profunda de lo que es pasando

Sugiero leer artículos de enciclopedia para obtener una visión general del tema. Quizás comience con la Enciclopedia de Biblioteconomía o Gale Virtual Library. Pídale a su bibliotecario local que obtenga acceso a esas u otras fuentes de referencia similares.

¡Le sugiero que comience mejor con este libro, Recuperación de información en la práctica si no puede tomar un curso en este momento!

¿Qué son?

More Interesting

¿Cuáles son las aplicaciones no computacionales de las lecciones del aprendizaje automático?

¿Cuáles son algunos de los obstáculos que evitan que las empresas aprovechen el poder del aprendizaje automático?

¿Cómo afectará el aprendizaje automático a la economía, tanto a corto plazo (2–5 años) como a largo plazo?

¿Hay un grupo de investigadores trabajando en la síntesis de texto EEG (conversión de pensamiento a texto)?

¿Podemos tener un error cuadrado medio de datos de entrenamiento para una red neuronal?

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

¿Cuál es el mejor algoritmo para descubrir todos los nodos de la red y mantener esa red en tiempo real?

¿Cuál es la diferencia entre la anotación automática de imágenes y la recuperación de imágenes?

¿Es más probable que una máquina que no ha otorgado un premio mayor otorgue uno que una máquina que acaba de otorgar un premio mayor?

¿Cómo debo usar máquinas restringidas de Boltzmann para el filtrado colaborativo?

¿Por qué se requieren conocimientos de aprendizaje automático para un periodista de datos? ¿Por qué la exploración y visualización de datos por sí sola no es suficiente para el periodismo de datos?

¿Cuáles son algunos casos de uso para el aprendizaje automático en realidad virtual?

¿Quiénes son algunos de los principales profesores que enseñan Machine Learning en Europa?

¿Cuáles son algunos algoritmos que un científico de datos debe saber y comprender?

Cómo convertirse en un cerebro cuant (un quant que usa IA)