Así es como hice la prueba. (Acabo de terminar el capítulo yo mismo, así que siéntete libre de señalar cualquier error).
Te dan lo siguiente:
[matemáticas] V_ {tren} (b) = \ hat {V} (sucesor (b)) [/ matemáticas]
[matemáticas] \ hat {V} (b) = w_0 + \ sum_ {i = 1} ^ 6 w_ix_i [/ matemáticas]
- ¿Qué es mejor para la clasificación binaria, softmax bidireccional o regresión logística?
- ¿Cuál es el mejor lenguaje de programación para el aprendizaje automático? ¿Qué idioma es mejor para programar microcontroladores y otras partes de hardware?
- ¿Es Kafka la mejor solución para crear una aplicación de visión por computadora?
- ¿Cuál es la diferencia entre la agrupación de texto y la clasificación de texto?
- ¿Cómo se realiza el aprendizaje automático supervisado cuando sus datos no caben en una sola máquina? ¿Los clasificadores de libros de texto como los clasificadores SVM o Naive Bayes siguen siendo tan importantes o incluso factibles a medida que aumenta el tamaño de sus datos o los algoritmos diferentes se vuelven más populares?
[matemáticas] E = (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemáticas]
Debe probar que todos los pesos se actualizan en la misma proporción.
La clave es darse cuenta de que [math] \ hat {V} [/ math] y [math] V_ {train} [/ math] tienen un conjunto diferente de valores de [math] x [/ math] cada uno, porque son calculado usando diferentes estados del tablero.
El valor de [math] (V_ {train} (b) – \ hat {V} (b)) [/ math] puede expresarse como
[matemáticas] \ sum w_n (x’_n-x_n) [/ matemáticas] porque
[matemáticas] V_ {tren} = w_0 + \ sum w_ix’_i [/ matemáticas]
Ahora, [math] – \ frac {\ partial {E}} {\ partial {w_i}} [/ math] dará la expresión [math] (V_ {train} (b) – \ hat {V} (b) ) [/ math] junto con algunos valores constantes (use la regla de la cadena), que variará según el peso en cuestión. Por lo tanto, todos los valores cambian proporcionalmente a [math] – \ frac {\ partial {E}} {\ partial {w_i}} [/ math], que es lo que tenía que probar.
(No estaba seguro de a qué error al cuadrado se refería en el problema. He tomado [matemáticas] E = (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemáticas] en lugar de [matemática] E = \ sum (V_ {tren} (b) – \ hat {V} (b)) ^ {2} [/ matemática]. Si esto es un error, indíquelo en los comentarios. )