¿Cuál es la solución del ejercicio 1.3 del libro Machine Learning de Tom M. Mitchell?

Así es como hice la prueba. (Acabo de terminar el capítulo yo mismo, así que siéntete libre de señalar cualquier error).

Te dan lo siguiente:
[matemáticas] V_ {tren} (b) = \ hat {V} (sucesor (b)) [/ matemáticas]

[matemáticas] \ hat {V} (b) = w_0 + \ sum_ {i = 1} ^ 6 w_ix_i [/ ​​matemáticas]

[matemáticas] E = (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemáticas]

Debe probar que todos los pesos se actualizan en la misma proporción.

La clave es darse cuenta de que [math] \ hat {V} [/ math] y [math] V_ {train} [/ math] tienen un conjunto diferente de valores de [math] x [/ math] cada uno, porque son calculado usando diferentes estados del tablero.

El valor de [math] (V_ {train} (b) – \ hat {V} (b)) [/ math] puede expresarse como

[matemáticas] \ sum w_n (x’_n-x_n) [/ matemáticas] porque
[matemáticas] V_ {tren} = w_0 + \ sum w_ix’_i [/ ​​matemáticas]

Ahora, [math] – \ frac {\ partial {E}} {\ partial {w_i}} [/ math] dará la expresión [math] (V_ {train} (b) – \ hat {V} (b) ) [/ math] junto con algunos valores constantes (use la regla de la cadena), que variará según el peso en cuestión. Por lo tanto, todos los valores cambian proporcionalmente a [math] – \ frac {\ partial {E}} {\ partial {w_i}} [/ math], que es lo que tenía que probar.

(No estaba seguro de a qué error al cuadrado se refería en el problema. He tomado [matemáticas] E = (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemáticas] en lugar de [matemática] E = \ sum (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemática]. Si esto es un error, indíquelo en los comentarios. )