Los algoritmos utilizados con probabilidad hacen varias suposiciones.
- Que las probabilidades que tienes son correctas
- Que las probabilidades seguirán siendo ciertas la próxima vez que hagas algo similar
- Que los supuestos de independencia utilizados para modelar el problema son correctos.
Cuando estas suposiciones son correctas, si su objetivo es maximizar el resultado esperado , entonces lo mejor que puede hacer es utilizar la teoría de la probabilidad. Eso no significa que siempre estarás en lo correcto. Simplemente significa que estará en lo correcto más a menudo que si usa cualquier otro método en el promedio.
Pero muy a menudo no tenemos suficientes datos para estimar las verdaderas probabilidades de los eventos. Por ejemplo, digamos que dos equipos han jugado uno contra el otro 3 veces y el primer equipo ha ganado todos los juegos. Si estimara que la probabilidad del segundo equipo es 0/3 o cero, podría estar muy equivocado. No era una muestra lo suficientemente grande como para estar seguro. Entonces, hay otras estimaciones que uno puede hacer para ser más seguro, por ejemplo, para agregar uno al numerador y al denominador (para obtener 1/4), pero esto no es más correcto. Es solo una estimación más segura. O las probabilidades han cambiado desde que se estimaron. Tal vez al segundo equipo le faltaban jugadores de 2 estrellas debido a una enfermedad durante esos 3 juegos, pero ahora están de regreso. O tal vez jugarán más duro porque están cansados de perder. Hay cientos de variables ocultas que son difíciles de conocer o tener en cuenta en el mundo real. O si tiene el récord de victorias / derrotas de dos equipos, pero nunca han jugado uno contra el otro, no necesariamente puede suponer que el equipo con el mejor récord ganará.
- ¿Qué 2 cursos entre estructuras de datos y algoritmos, diseño de software, introducción a IA, aprendizaje automático y sistemas operativos, debo elegir?
- ¿Dónde puedo encontrar corpus de texto médico en inglés para entrenar mis datos?
- ¿Cómo calculamos el error cuadrático medio en la regla de aprendizaje de LMS?
- ¿Cuáles son los populares paquetes ML de adopción (Machine wise)?
- ¿El objetivo de un autoencoder variacional y una red de confrontación generativa es el mismo?
Entonces, hay otros métodos que las personas usan para hacer estimaciones diferentes o usar métodos diferentes. A veces, el objetivo no es maximizar la probabilidad de ser correcto, sino minimizar la probabilidad de una pérdida catastrófica. Por eso compramos un seguro. Claramente, el seguro es una mala apuesta, de lo contrario, las compañías de seguros no lo venderían. Saben que (dadas las muy buenas estimaciones que tienen de muchos datos), aunque ocasionalmente tengan que pagar grandes reclamos, ganarán más dinero del que pierden con el tiempo. Pero para usted, aunque probablemente nunca tenga una catástrofe importante, simplemente no está dispuesto a arriesgarse, por lo que obtiene un seguro que lo protege contra pérdidas muy grandes. Hay diferentes métodos y cálculos para usar, dependiendo de qué tan malo sería tener una gran pérdida.
Luego está la intuición. La intuición puede ser algo bueno a veces. Las personas a veces tienen un sentimiento sobre algo. Puede ser que en realidad tengan otra información que están utilizando, pero no saben cómo modelarla probabilísticamente. Simplemente no les gusta la “apariencia” de algo. Si tienen buenas intuiciones, significa que están captando señales importantes que otros podrían pasar por alto. Entonces pueden “vencer las probabilidades”, no porque la probabilidad no funcione, sino porque están usando características que otros no están usando.
Entonces, para resumir, la probabilidad es buena cuando tiene todos los hechos y estadísticas relevantes. Pero si hay otros factores útiles que no sabe cómo usar de manera probabilística, es mejor que sesgue su juicio de alguna manera.