¿Cuál es la solución del ejercicio 1.3 del libro Machine Learning de Tom M. Mitchell? La tecnología cambia la vida futura

¿Cuál es la solución del ejercicio 1.3 del libro Machine Learning de Tom M. Mitchell?

Así es como hice la prueba. (Acabo de terminar el capítulo yo mismo, así que siéntete libre de señalar cualquier error).

Te dan lo siguiente:
[matemáticas] V_ {tren} (b) = \ hat {V} (sucesor (b)) [/ matemáticas]

[matemáticas] \ hat {V} (b) = w_0 + \ sum_ {i = 1} ^ 6 w_ix_i [/ matemáticas]

¿Qué es mejor para la clasificación binaria, softmax bidireccional o regresión logística?
¿Cuál es el mejor lenguaje de programación para el aprendizaje automático? ¿Qué idioma es mejor para programar microcontroladores y otras partes de hardware?
¿Es Kafka la mejor solución para crear una aplicación de visión por computadora?
¿Cuál es la diferencia entre la agrupación de texto y la clasificación de texto?
¿Cómo se realiza el aprendizaje automático supervisado cuando sus datos no caben en una sola máquina? ¿Los clasificadores de libros de texto como los clasificadores SVM o Naive Bayes siguen siendo tan importantes o incluso factibles a medida que aumenta el tamaño de sus datos o los algoritmos diferentes se vuelven más populares?

[matemáticas] E = (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemáticas]

Debe probar que todos los pesos se actualizan en la misma proporción.

La clave es darse cuenta de que [math] \ hat {V} [/ math] y [math] V_ {train} [/ math] tienen un conjunto diferente de valores de [math] x [/ math] cada uno, porque son calculado usando diferentes estados del tablero.

El valor de [math] (V_ {train} (b) – \ hat {V} (b)) [/ math] puede expresarse como

[matemáticas] \ sum w_n (x’_n-x_n) [/ matemáticas] porque
[matemáticas] V_ {tren} = w_0 + \ sum w_ix’_i [/ matemáticas]

Ahora, [math] – \ frac {\ partial {E}} {\ partial {w_i}} [/ math] dará la expresión [math] (V_ {train} (b) – \ hat {V} (b) ) [/ math] junto con algunos valores constantes (use la regla de la cadena), que variará según el peso en cuestión. Por lo tanto, todos los valores cambian proporcionalmente a [math] – \ frac {\ partial {E}} {\ partial {w_i}} [/ math], que es lo que tenía que probar.

(No estaba seguro de a qué error al cuadrado se refería en el problema. He tomado [matemáticas] E = (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemáticas] en lugar de [matemática] E = \ sum (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemática]. Si esto es un error, indíquelo en los comentarios. )

Aprendizaje automáticoPregunta de tarea