¿El procesamiento del lenguaje natural reemplaza la búsqueda elástica?

Bueno, estoy de acuerdo con Meir Maor.

Elasticsearch es un motor de búsqueda. Una muy buena. Puede encontrar documentos siempre que los haya incluido en su índice y que sean lo suficientemente similares a una consulta. También puede responder búsquedas exactas, por ejemplo, “encontrar todas las partes existentes cuyo part_id = 407”. Es la base de la pila ELK, ahora llamada pila Elastic, que permite la recopilación, el almacenamiento y la consulta / visualización inteligente de archivos de registro. Y eso es todo: esta es la funcionalidad básica de Elasticsearch. También puede ser parte de una aplicación más grande. Se asienta bien dentro del campo de recuperación de información.

El procesamiento del lenguaje natural (en adelante PNL), OTOH, es un campo separado, aunque similar, con una gran cantidad de técnicas utilizadas para manejar varios niveles de representación de información lingüística, desde caracteres, hasta palabras, frases, oraciones, párrafos, documentos y corpus. Se refiere a campos como morfología, sintaxis, semántica y pragmática.

¿Puede la PNL reemplazar a Elasticsearch? No. No están enfocados en resolver el mismo problema.

¿Elasticsearch utiliza PNL? Claro, para la tokenización, a veces se derivan y se detienen las palabras. Puede usar algo más, por ejemplo, al indexar sinónimos o frases. ¿Es esta la PNL más profunda? No.

¿Se puede agregar una interfaz de PNL sobre Elasticsearch? Puede, con diversos grados de éxito, y ver: Todo lo que necesita saber sobre la búsqueda en lenguaje natural (Sí, esto no es Elasticsearch, pero el principio es similar).

En resumen, me gusta comenzar con el problema que estoy tratando de resolver. Luego, trato de encontrar la herramienta más simple para resolverlo. Puede ser Elasticsearch. Puede ser un módulo de una biblioteca NLP. Puede ser otra cosa.

Esta pregunta me suena como: ¿cocinar alimentos reemplaza los hornos?

ElasticSearch es una herramienta. Se usa para la búsqueda. Es particularmente útil para buscar un texto o textos similares o algo con un elemento de coincidencia textual difuso / parcial, posiblemente junto con otros elementos que no son de texto.

La PNL es una disciplina completa de manejo del lenguaje humano y contiene muchos problemas, enfoques, algoritmos y herramientas.

Algunos problemas, como la búsqueda de documentos, se pueden resolver mediante la búsqueda elástica o herramientas similares. La búsqueda elástica puede incorporar internamente algunas herramientas muy básicas del dominio de PNL, como la tokenización y la derivación. Muchas soluciones aumentarán la búsqueda básica con algunas capacidades de PNL más avanzadas, por ejemplo, para comprender mejor la intención o la relación en un texto. En los problemas tradicionalmente resueltos con un motor de búsqueda, todavía tengo que ver el motor de búsqueda completamente reemplazado por herramientas nlp solo aumentadas por ellas.

Muchos otros problemas usan varias herramientas nlp sin ningún elemento de búsqueda.

No te comunicas con tus amigos usando el comando “buscar”, “fusionar” o “comprensión”.

Del mismo modo, cuando el procesamiento del lenguaje natural tenga éxito, todo el mundo virtual será su amigo con su comunicación lingüística, incluso si tiene un ancho de banda muy limitado para comunicarse.

Entonces, cuando llegue el procesamiento del lenguaje natural, el comando de tipo de computadora como buscar, fusionar, comprensión, etc. será reemplazado por recordar, tratar de entender eso, decirme en resumen, etc.

Por lo tanto, todas las herramientas de búsqueda existentes utilizarán el procesamiento del lenguaje natural para obtener dichos servicios.

AFAIK, la búsqueda elástica no entiende el idioma en ningún nivel. Simplemente busca las palabras en la consulta. Mientras que los métodos de PNL intentan entender el lenguaje de alguna manera haciendo análisis sintáctico y semántico de los documentos. Por lo tanto, requiere más recursos (tiempo, espacio). Entonces, cuando la aplicación no requiere estos análisis, es mejor usar la búsqueda elástica que PNL, incluso si está disponible.

More Interesting

¿De qué manera la empresa promedio utilizará tecnologías de visión por computadora dentro de 20 años?

¿Cuáles son los problemas médicos que el aprendizaje automático puede resolver?

¿Se puede solicitar un doctorado en aprendizaje automático sin conocimientos y habilidades de CompSci? ¿Se puede aprender en el trabajo?

¿Cuál es una buena referencia para aprender cómo implementar y usar la búsqueda de línea para la optimización?

¿Cómo representa doc2vec el vector de características de un documento? ¿Alguien puede explicar matemáticamente cómo se realiza el proceso?

¿Los científicos de datos y el ingeniero de aprendizaje automático necesitan saber implementar algoritmos ML / DL desde cero o simplemente usar las bibliotecas existentes en producción?

¿Qué papel jugará la ciencia de datos en las elecciones presidenciales de 2012?

¿Se pueden usar los árboles de decisión para encontrar atributos de variables latentes de una muestra?

En un juego de billar, ¿puede el mejor robot (diseñado específicamente para esta tarea) derrotar al campeón mundial humano?

Ahora mismo estoy aprendiendo desarrollo web, pero no creo que me sea muy útil. ¿Debo aprender el aprendizaje automático o el desarrollo de software?

¿Debería centrarme en conseguir un trabajo o aprender ciencia de datos?

¿Cuál es el propósito de usar un parámetro de penalización [matemática] C [/ matemática] en SVM?

¿Cuál es la mejor hoja de ruta para aprender el aprendizaje automático usando Python?

¿Qué es el cambio de covariable?

¿Por qué muchos estudios de investigación afirman que el aprendizaje profundo es una caja negra?