Me puse en contacto con el autor y aquí está la respuesta:
[matemáticas] p (x_i, y_i \ vert \ theta) [/ matemáticas]
= [matemáticas] p (y_i \ vert \ pi) \ prod_j p (x_ {ij} \ vert \ theta_j) [/ matemáticas]
- ¿Cuáles son los tipos de problemas que se pueden resolver con las redes neuronales?
- ¿Se puede usar la detección de características / descripción de características para la clasificación de imágenes con redes neuronales artificiales?
- Tengo muchos datos de clientes. ¿Qué algoritmos de aprendizaje automático serían mejores para predecir qué productos desea comprar cada cliente?
- ¿Debo elegir PHP para el aprendizaje automático?
- ¿Qué tan buena será una carrera en IA / aprendizaje automático en el futuro?
= [matemáticas] \ prod_c \ pi_c ^ {I (y_i = c)} \ prod_j \ prod_c p (x_ {ij} \ vert \ theta_ {jc}) ^ {I (y_i = c)} [/ math]
donde [matemática] I (y_i = c) [/ matemática] es 1 cuando [matemática] y_i [/ matemática] es c, de lo contrario 0¿Cómo se dedujo [math] p (y_i \ vert \ pi) [/ math] a [math] \ prod_c \ pi_c ^ {I (y_i = c)} [/ math]. Parece que un [math] y_i [/ math] puede pertenecer a muchas clases (o tener muchas etiquetas).
No, y_i solo puede tener 1 valor.
Si este caso es cierto, ¿por qué no fusionar estas mismas clases antes de entrenar? Así simplifica la ecuación a:
[matemáticas] p (y_i \ vert \ pi) [/ matemáticas] = [matemáticas] \ pi_c [/ matemáticas]Sí, también puedes escribirlo de esa manera.
Ahora, creo que [math] \ prod_c \ pi_c ^ {I (y_i = c)} [/ math] es una forma más compacta de mostrar [math] p (y_i \ vert \ pi) [/ math] = [math] \ pi_c [/ math], ya que solo existe una y.
Sin embargo, la respuesta de Nigel es desde otra perspectiva y sigue siendo útil, gracias de nuevo.