Cómo aprender los pesos de las características de un modelo mediante el aprendizaje automático

La pregunta es demasiado amplia, me temo. Hay demasiados modelos en el campo de Aprendizaje automático para poder generalizarlos todos con un enfoque único sobre cómo aprender los pesos. El método depende del modelo específico que esté utilizando.

Dicho esto, lo que suele suceder es esto (tenga en cuenta que estoy discutiendo sobre modelos supervisados. El aprendizaje no supervisado es un escenario completamente diferente):

  1. Usted asigna ponderaciones a varias características del conjunto de datos, ya que todas son cero o con valores aleatorios o con su intuición de lo que podría funcionar (la intuición generalmente funciona cuando la tarea en cuestión es muy pequeña).
  2. En función de los valores asignados a los pesos, el modelo utilizado calculará la salida. Llamemos a esta salida O.
  3. La salida real se etiquetará con cada ejemplo en el conjunto de datos. Considéralo como T.
  4. Obviamente, dado que los pesos asignados durante la inicialización no conducirán a la salida objetivo exacta, habrá algún error (E).
  5. E = O – T. (Esto se hace en forma de vector usando Numpy o MATLAB / Octave).
  6. Este error se traducirá en la alteración de los pesos.
  7. Dependiendo del número de iteraciones y el umbral de error deseado, O comenzará a emular T (aunque no completamente. Si O es exactamente lo que T es, es probable que tenga un sobreajuste) o el modelo se agotará al tratar de aprender pesos.
  8. Al final, obtienes el vector de peso que genera una O aceptable o te quedas sin el número de iteraciones preespecificadas.

Nuevamente, este es solo un enfoque de grano muy grueso para aprender los pesos de un modelo ML. La respuesta entrará en detalles cuando el modelo sea más específico.

Espero que haya ayudado.

More Interesting

¿Cuál es la razón por la cual las compañías gigantes (por ejemplo, Google o Microsoft) hacen preguntas típicas como el árbol de búsqueda binario o el algoritmo tradicional o preguntas como la complejidad del algoritmo? ¿Cuál es el propósito? La mayoría de ellos no se usan en la vida real.

En el 8 rompecabezas, ¿por qué solo es posible alcanzar la mitad de todas las combinaciones posibles desde cualquier estado dado?

¿Los mismos algoritmos dan resultados diferentes en diferentes paquetes / idiomas?

¿Es posible implementar dos pilas usando una matriz?

¿Qué causa que la implementación viable de Quicksort sea muy lenta?

Si tengo que crear un sitio de redes sociales como Facebook, ¿qué cosas tengo que estudiar comenzando desde el front-end hasta el back-end hasta el servidor y los servidores web? ¿Cuáles son todas las cosas que uno debe saber en profundidad?

¿Cuáles son los 10 algoritmos que uno debe conocer para resolver la mayoría de los problemas de algoritmos?

Cómo eliminar duplicados en un vector C ++ y también si solo quiero elementos duplicados

Cómo ordenar matrices en C

¿Cómo uso vectores para una matriz 2D en C ++?

¿Cómo funcionan los algoritmos bayesianos para la identificación de spam?

Cómo resolver un problema de puente colgante utilizando circuitos y dónde una persona puede cruzar el puente a la vez

La mayoría de las definiciones / teoremas / ejemplos de privacidad diferencial que he encontrado son para consultas que devuelven un solo número por columna, como un promedio. ¿Existen mecanismos diferencialmente privados para otros tipos de consultas, como los que subconjustan filas en función de algún criterio?

¿Cuáles son algunos algoritmos interesantes que no tienen implementación conocida hasta la fecha?

Cómo implementar un algoritmo de programación de disco C-SCAN para encontrar su tiempo de búsqueda