Del libro de texto: la recuperación de información (IR) es encontrar material (generalmente documentos) de naturaleza no estructurada (generalmente texto) que satisface una necesidad de información dentro de grandes colecciones (generalmente almacenadas en computadoras).
Lo que aprendí del curso: los datos a los que nos referimos tienen mucho proceso (estandarización) que se debe realizar antes de que se consulte
- Tallo – Corte del final de las palabras ejemplo exitoso, exitoso, el éxito puede ser cortado al éxito
- Lematización : modificación de palabras a su forma básica en el diccionario
- Hay pocos conceptos básicos involucrados en el análisis de texto: frecuencia de término (número de veces que aparece el término en el documento), frecuencia de documento (número de documentos que aparece el término), IDF (Frecuencia de documento inversa), frecuencia aumentada y frecuencia de registro
- Básicamente, usted estudiaría otros ingenuos métodos de clasificación de documentos, capacitación y modelos de construcción para clasificar los documentos
- Esto es solo una punta de iceberg en términos de curso de recuperación de información, un documento estructurado (por ejemplo, una tabla de base de datos se puede consultar con filtros, como filtros condicionales, es una forma directa)
- Los cadáveres de documentos son enormes, el procesamiento y la clasificación en un formulario que se puede utilizar aún más en una gran infraestructura de tipos de datos o ejecutar modelos de aprendizaje automático se encuentra en una etapa de procesamiento
- Documentos -> Oraciones -> Fichas -> Provisiones -> la frecuencia de término de construcción o el índice invertido de palabras son la base para el procesamiento
Este libro es una gran lectura: http://nlp.stanford.edu/IR-book/…
- ¿Puede un autoencoder sobreajustar cuando tiene una cantidad mucho menor de neuronas de capa oculta que la capa de entrada y también se usa la deserción?
- ¿Cómo determina el algoritmo de aprendizaje automático de Quora la clasificación de la calidad de la pregunta?
- Música: ¿Cómo se puede usar el aprendizaje automático para analizar música?
- Cómo poner un programa de IA en un dispositivo
- ¿Cuáles son las principales diferencias entre econometría y aprendizaje automático?