¿Cómo se usa el aprendizaje automático en la extracción de información?

La extracción de información (IE) es una tarea que tradicionalmente ha estado en la intersección de la recuperación de información y el procesamiento del lenguaje natural. Comprende la familia de tareas que requiere la selección de partes (desde palabras específicas hasta tramos de textos que abarcan oraciones) del texto de un documento. Por ejemplo, extraer entidades con nombre (NER) es una tarea bien conocida en la que un sistema tiene que extraer e identificar las palabras como nombres de persona, organización, producto, empresa, etc. Extraer cualquier entidad importante y vincularlas por una relación es un Problema extremadamente útil y sin resolver. Identificar entidades y relaciones es clave para poblar una base de conocimiento.

Tradicionalmente, muchas tareas de IE se modelaron como problemas de etiquetado de secuencias. El empleo de campos aleatorios condicionales [1] para la extracción de información es fundamental tanto en IE como en aprendizaje automático. Recientemente, las redes neuronales profundas han impulsado el estado del arte en casi todas las tareas de IE. Las combinaciones de capas de redes neuronales recurrentes (principalmente redes de memoria a corto plazo o LSTMS y redes recurrentes bloqueadas o GRU) y redes neuronales convolucionales han contribuido al rendimiento. Sin embargo, los CRF debido a su capacidad para decodificar globalmente la salida funcionan realmente bien con las capas DNN especificadas anteriormente para impulsar aún más el rendimiento. CRF-BiLSTM [2] se ha convertido en un sistema estándar para la mayoría de las tareas de IE.

El esquema de esquema universal [3] y las redes de memoria para tareas de IE son contribuciones clave recientes principalmente para construir bases de conocimiento.

Una mejor tecnología IE ha mejorado otras tareas posteriores y relacionadas, como la respuesta a preguntas donde las redes de puntero se utilizan para seleccionar tramos de texto (puntos de inicio y finalización del texto) como respuestas a las preguntas. El control de calidad como una inferencia sobre la base de conocimiento es otra dirección interesante reciente.

[1] Lafferty, John, Andrew McCallum y Fernando CN Pereira. “Campos aleatorios condicionales: modelos probabilísticos para segmentar y etiquetar datos de secuencia”. (2001)

[2] Huang, Zhiheng, Wei Xu y Kai Yu. “Modelos bidireccionales LSTM-CRF para etiquetado secuencial”. preimpresión arXiv arXiv: 1508.01991 (2015).

[3] Yao, Limin, “Esquema universal para la representación del conocimiento a partir de texto y datos estructurados” (2015). Tesis Doctorales Mayo 2014 – actual. 338.

Revise este ppt de los principales investigadores de Stanford, que ofrece un paso a paso.

https://web.stanford.edu/class/c

More Interesting

¿Hay AI haciendo preguntas y escribiendo respuestas en Quora?

¿Cuáles son los pros y los contras del uso de redes adversas generativas (un tipo de red neuronal)? ¿Se podrían aplicar a cosas como la forma de onda de audio a través de RNN? ¿Por qué o por qué no?

¿Qué tipo de garantías de equidad se podrían hacer para un juego tipo Tetris?

Inteligencia artificial: ¿Qué tan útil es la computación distribuida para construir IA?

¿Hay algún ejemplo de robots que maten humanos sin razón lógica?

¿Cuáles son las posibles aplicaciones de la IA (Inteligencia artificial) en Arquitectura y Construcción?

¿La inteligencia artificial se convertirá en una amenaza para algunos (o todos) los humanos? Dado que una computadora no tiene sentimientos, metas o deseos, ¿cómo?

Si una startup usa los servicios de inteligencia artificial de Amazon o Google, ¿puede lanzarse como una startup de inteligencia artificial?

¿Se desplegarán eventualmente robots militares humanoides en el conflicto israelo-palestino para reprimir la actividad militar de ambos lados?

¿Sería posible desarrollar un sistema avanzado de PNL (procesamiento del lenguaje natural) sin lograr una IA fuerte primero?

¿Qué es una red neuronal de desplazamiento espacial (SDNN)?

Reconocimiento de voz: ¿algunos idiomas hablados son más fáciles de reconocer por una máquina?

Como humanos, aprendemos de las experiencias. ¿Es posible construir una máquina que aprenda de tus experiencias y luego te reemplace después de tu muerte?

¿Qué es la inteligencia artificial en química?

Tengo 37 años (MSc.SoftwareEng y experiencia -gestión de proyectos de software) con un gran interés en la academia y la IA. ¿Es prudente obtener un doctorado? en IA / robótica?