Esta es una pregunta más compleja que podría parecer. Primero, déjame darte una respuesta muy simplista. Tomemos el ejemplo más simple: hay una variable de interés y simplemente está tratando de describir la media de una distribución. Por ejemplo, podría preguntar cuál es la estatura media de las mujeres estadounidenses mayores de 18 años. En teoría, podrías salir y medir la altura de cada mujer estadounidense. Podría sumar los números, dividir por el número de observaciones y realmente tendría la respuesta. Pero es demasiado costoso y difícil de manejar para hacer esto. En cambio, solo medirías una muestra; dicen 100 mujeres. Ahora encuentra la media de esa muestra y podría preguntar cuánto “ruido” hay en la estimación. Básicamente, calcula el error estándar de la media. Error estándar
Sin embargo, hay otra interpretación de su pregunta. ¿Cuánto “ruido” hay en la muestra misma? Esta es una cuestión de punto de vista sobre lo que constituye el “ruido”. Digamos que Pepsi le está pagando para demostrar que Pepsi aumenta la altura de las personas. Bueno, para hacerlo de manera muy simple, puede correlacionar la altura con la cantidad de Pepsi que han bebido durante toda su vida. Digamos que hay una correlación moderada de .5. Esto significa que, desde SU perspectiva, la variable de interés, Pepsi, representa el 25% de la variación global. Para USTED, el resto de la variabilidad es “ruido”. Por otro lado, imaginemos que usted es parte de un equipo de genetistas que tiene una teoría de “altura de diez genes” (la altura está determinada por una combinación de diez genes) . Su modelo, digamos, predice el 70% de la variabilidad en la muestra. Para ellos, el otro 10% es “ruido”. Tenga en cuenta que, como defensor de Pepsi, usted ignoró (probablemente ni siquiera sabía acerca de los diez genes o los probó), y toda esa variabilidad, para usted, fue simplemente “ruido”. Pero para los genetistas (que no sabían sobre la conexión de Pepsi), el 25% es ruido.
- ¿Cuáles son los conjuntos de datos de visión por computadora más populares en este momento?
- ¿Qué máquina es mejor para clasificar imágenes, SVM u otra? ¿Por qué?
- ¿Cómo identificar el contexto basado en la oración?
- ¿Cuál es la divergencia KL entre un Gaussiano y un Student-t?
- ¿Por qué la deserción puede mejorar el problema de sobreajuste en redes neuronales profundas?