Extracción de información: se trata más del problema de PNL (procesamiento del lenguaje natural) y aprendizaje automático. Donde entrena la máquina para extraer información oculta del texto sin formato. Considere un programa que pueda identificar todos los nombres de personas o ubicaciones del texto sin formato. Necesitamos construir un modelo y entrenar sobre la base de reglas y estadísticas lingüísticas. En resumen, es bastante difícil extraer información del texto. Al final de IE, obtendrá cierta información y luego acumulará conocimiento para responder algunas preguntas clave. por ejemplo, quiénes son las personas involucradas en la explosión de una bomba en Mumbai. Por lo tanto, debe extraer personas, ubicaciones, eventos y su relación para responder a esa pregunta. Entonces Google hace este tipo de extracción de información para responder preguntas que son información basada en hechos. Por ejemplo, ¿cuál es la moneda de la India? y en algún lugar está escrito INR es la moneda de la India.
Nos estamos moviendo lentamente hacia este tipo de motores de búsqueda donde obtendremos resultados con respuestas claras, en lugar de arrojar millones de resultados en nuestra cara.
Recuperación de información: en palabras simples, google. Un motor de búsqueda que tiene todos los datos almacenados y recuperará los resultados de su almacén de documentos y los clasificará según la consulta del usuario. Toda la inteligencia requerida aquí es un sistema para rastrear (recopilar) datos. Una forma eficiente de almacenar datos (por ejemplo, índices invertidos) y un sistema de clasificación inteligente para clasificar los resultados (por ejemplo, tfidf). Y además de eso, una gran granja de servidores para servir a millones de usuarios y recopilar sistemas en tiempo real de millones de sitios web / fuentes. Algunos sistemas IR Solr, Lucene, Elastic Search.
- Cómo tener una buena inicialización de la probabilidad previa, la probabilidad de emisión en los modelos ocultos de Markov ya que los HMM son óptimos locales
- ¿Se reemplazará la programación de la computadora por aprendizaje automático?
- ¿Cómo se usa el modelo predictivo en la regresión logística?
- ¿Cuál es la relación entre el modelo Log Linear, el modelo MaxEnt y la regresión logística?
- ¿Cuáles son las diferencias entre Apache Spark y el Tensor Flow de Google?
La caja cuadrada necesita extraer conocimiento y construir un gráfico de conocimiento y luego recuperarlo.