¿Cuál es la diferencia entre el aprendizaje probabilístico y el aprendizaje no probabilístico para diferentes situaciones? ¿Cuándo es uno más apropiado que el otro?

Los algoritmos utilizados con probabilidad hacen varias suposiciones.

  1. Que las probabilidades que tienes son correctas
  2. Que las probabilidades seguirán siendo ciertas la próxima vez que hagas algo similar
  3. Que los supuestos de independencia utilizados para modelar el problema son correctos.

Cuando estas suposiciones son correctas, si su objetivo es maximizar el resultado esperado , entonces lo mejor que puede hacer es utilizar la teoría de la probabilidad. Eso no significa que siempre estarás en lo correcto. Simplemente significa que estará en lo correcto más a menudo que si usa cualquier otro método en el promedio.

Pero muy a menudo no tenemos suficientes datos para estimar las verdaderas probabilidades de los eventos. Por ejemplo, digamos que dos equipos han jugado uno contra el otro 3 veces y el primer equipo ha ganado todos los juegos. Si estimara que la probabilidad del segundo equipo es 0/3 o cero, podría estar muy equivocado. No era una muestra lo suficientemente grande como para estar seguro. Entonces, hay otras estimaciones que uno puede hacer para ser más seguro, por ejemplo, para agregar uno al numerador y al denominador (para obtener 1/4), pero esto no es más correcto. Es solo una estimación más segura. O las probabilidades han cambiado desde que se estimaron. Tal vez al segundo equipo le faltaban jugadores de 2 estrellas debido a una enfermedad durante esos 3 juegos, pero ahora están de regreso. O tal vez jugarán más duro porque están cansados ​​de perder. Hay cientos de variables ocultas que son difíciles de conocer o tener en cuenta en el mundo real. O si tiene el récord de victorias / derrotas de dos equipos, pero nunca han jugado uno contra el otro, no necesariamente puede suponer que el equipo con el mejor récord ganará.

Entonces, hay otros métodos que las personas usan para hacer estimaciones diferentes o usar métodos diferentes. A veces, el objetivo no es maximizar la probabilidad de ser correcto, sino minimizar la probabilidad de una pérdida catastrófica. Por eso compramos un seguro. Claramente, el seguro es una mala apuesta, de lo contrario, las compañías de seguros no lo venderían. Saben que (dadas las muy buenas estimaciones que tienen de muchos datos), aunque ocasionalmente tengan que pagar grandes reclamos, ganarán más dinero del que pierden con el tiempo. Pero para usted, aunque probablemente nunca tenga una catástrofe importante, simplemente no está dispuesto a arriesgarse, por lo que obtiene un seguro que lo protege contra pérdidas muy grandes. Hay diferentes métodos y cálculos para usar, dependiendo de qué tan malo sería tener una gran pérdida.

Luego está la intuición. La intuición puede ser algo bueno a veces. Las personas a veces tienen un sentimiento sobre algo. Puede ser que en realidad tengan otra información que están utilizando, pero no saben cómo modelarla probabilísticamente. Simplemente no les gusta la “apariencia” de algo. Si tienen buenas intuiciones, significa que están captando señales importantes que otros podrían pasar por alto. Entonces pueden “vencer las probabilidades”, no porque la probabilidad no funcione, sino porque están usando características que otros no están usando.

Entonces, para resumir, la probabilidad es buena cuando tiene todos los hechos y estadísticas relevantes. Pero si hay otros factores útiles que no sabe cómo usar de manera probabilística, es mejor que sesgue su juicio de alguna manera.

More Interesting

¿Cuál es la mejor arquitectura de red neuronal para procesar video?

¿Cuáles son las aplicaciones del error cuadrático medio?

El entrenamiento de redes neuronales profundas utilizando la propagación inversa tiene el problema de un gradiente de error que desaparece y que establece un límite sobre cuántas capas se pueden entrenar efectivamente, entonces, ¿por qué no usar un algoritmo genético para entrenar redes profundas, eliminando la propagación de errores?

¿Recomendaría un MBA de una escuela superior o un doctorado en Aprendizaje automático de una escuela superior?

Quiero pasar el tiempo dado para el proyecto del último año para aprender ML. ¿Cómo empiezo?

RNN para modelado de idiomas en Tensorflow. ¿Cómo puedo rellenar las secuencias si mi entrada está constituida por la incorporación de palabras?

¿Cuáles son algunos buenos proyectos en los que un principiante de aprendizaje automático puede trabajar?

Cómo calcular la precisión y recordar para la clasificación, donde ambas clases son igualmente importantes

¿Cómo se almacenan la mayoría de los conjuntos de datos para el aprendizaje automático a gran escala?

¿Es posible detectar una estructura de acordes en una canción usando el aprendizaje profundo? Si es así, ¿cómo?

¿Qué quieres decir con optimización?

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?

¿Qué empresas / startups en India están contratando para trabajos de ciencia de datos, análisis de datos o aprendizaje automático?

Cómo extraer términos importantes de datos de texto no estructurados

¿Cuál es la diferencia entre una curva ROC y una curva de recuperación de precisión? ¿Cuándo debo usar cada uno?