¿Qué es la ingeniería de características y cuál es su importancia en diversas aplicaciones de aprendizaje automático?

Tenga paciencia conmigo mientras trato de explicar esto en términos sencillos y no matemáticos.

En un nivel muy básico, la ingeniería de características es la creación de funciones de características relevantes para un algoritmo y dominio de aprendizaje automático específico.

Las funciones de características pueden considerarse como compuestos de variables que pueden ayudar a cuantificar las relaciones entre entradas, variables o valores específicos de un dominio determinado.

Usemos el ejemplo del uso de un algoritmo de campo aleatorio condicional de cadena lineal para clasificar partes del discurso en una oración.

La fórmula para un CRF de cadena lineal toma el producto agregado de una colección de funciones de características ponderadas, que usaríamos para determinar la parte correcta del habla en este caso.

Podríamos diseñar funciones de función que incluyan varias entradas relacionadas con la oración y devuelvan 1 o 0. Por ejemplo, podríamos crear una función de función que intente determinar si la palabra es un ‘artículo’. La función de función toma una palabra dada y y si y es ‘la’, devolveremos 1.

Reuniremos una gran cantidad de funciones y las aplicaremos para varias partes del discurso a cada palabra en una oración dada. Luego aplicaremos pesos a estas funciones y las conectaremos a nuestro algoritmo Linear Chain CRF y recuperaremos nuestras probabilidades.

Retrocediendo un poco, la importancia de las funciones es enorme. Nos permiten normalizar y cuantificar datos inherentemente cualitativos. En este ejemplo, crear nuestra función de función fue relativamente simple, pero en dominios más complejos, se hace cada vez más difícil construir funciones de función efectivas.

Aquí se puede encontrar una buena introducción, aunque muy técnica, a la selección de variables y funciones, y una introducción más técnica a los campos aleatorios condicionales aquí.

More Interesting

¿Cuáles son las diversas primitivas de bloqueo disponibles en el kernel de Linux?

Tengo un plan de 400 días para aprender sobre el aprendizaje automático. Espero construir mi propio bot de juegos que pueda jugar al menos 2 juegos. ¿Qué tan plausible es esto?

¿Cómo es la práctica en FiscalNote?

¿Cuál es el algoritmo más rápido para obtener la matriz inversa?

¿Qué es una tienda distribuida de valor-clave? ¿Cuál fue la motivación para diseñarlo en primer lugar?

¿Cómo hace IDM que la descarga sea 5-8 veces más rápida?

¿Quora incorporó algún modelo de aprendizaje automático en la función 'preguntas para usted'?

Dejé caer mi iPhone 4s y muestra el modo de recuperación, cuando estoy conectado a iTunes. ¿Todavía puedo recuperar los datos?

¿Qué es mejor, BITS Goa CS o Hyderabad CS?

Con respecto al problema de factorización, ¿podría P = NP si lo piensa un poco diferente?

¿Cuáles son las diferencias y similitudes entre varios términos como archivo de objeto, ejecutable, enlace dinámico, carga dinámica, tiempo de ejecución, tiempo de carga y tiempo de compilación?

¿Es posible una computadora biológica cuántica Lisp?

¿Qué es más cierto, que la informática te ayuda a comprender mejor la filosofía, o que la filosofía te ayuda a comprender mejor la informática?

¿Crees que la ciencia (por ejemplo, la física teórica) será asumida por la inteligencia de la computadora, dado el creciente poder de cálculo y búsqueda de patrones?

¿Por qué las computadoras no pueden usar números irracionales?