Cómo explicar la “extracción de información” en términos simples

Haz un ejercicio. Vaya a http://www.quora.com/careers y elija cualquier posición disponible. Elegí “Data Scientist” y el siguiente ejercicio funcionó, pero creo que debería funcionar para todos.
Ahora suba su currículum y verá que Quora ahora está analizando su currículum.

Una vez que haya terminado de analizarlo, los siguientes campos se completarán automáticamente.

Esta es la extracción de información.

Formalmente, la extracción de información es la tarea de extraer automáticamente información estructurada de documentos no estructurados y / o semiestructurados legibles por máquina.

PD: Es el trabajo de mis sueños. Científico de datos en Quora.

Tengo que apoyar el ejemplo del currículum de Ishan Jain en su respuesta. La mayoría de la gente verá que los currículums tienen casi la misma información pero en un número casi ilimitado de formatos.

Es un buen ejemplo porque las personas entienden cómo se ven los currículums, el tipo de información que contienen, por qué querría esa información y por qué la necesitaría en formatos específicos para computadoras, etc.

Encuentre otros ejemplos similares, y evitaría entrar en cualquier aspecto de tipo ML, explique el problema, no los tipos de matemática utilizados para las soluciones.

Hay muchas formas de extracción de información. Podría ser un analista de datos, por ejemplo, o torturar a posibles terroristas para extraer información. La forma de extracción de información que hago en el trabajo está transformando los datos en bruto en información. Los datos a menudo se denominan información, pero en realidad no lo son si no se ven en un contexto más amplio debido a su dependencia de otros datos. Recuperar los datos, hacer las conexiones y visualizarlas es lo que llamo extracción de información. Los datos conducen a la información, eso lleva al conocimiento, eso lleva a la comprensión.

Para obtener información de posibles terroristas, le sugiero que vea Zero Dark Thirty. Puede extraer mucha información sobre la extracción de información al ver esa película.