¿Qué dice el profesor Yaser Abu-Mostafa en su conferencia sobre la viabilidad del aprendizaje?

* A2A *

Los experimentos aleatorios están definidos por la aplicación de aprendizaje automático disponible. Por ejemplo, supongamos que estamos creando un clasificador de correo no deseado.

Simplifiquemos un poco el escenario. Digamos que tenemos un solo usuario U escribiendo correos electrónicos y nuestro objetivo es clasificar los correos electrónicos escritos por el usuario U como spam o no spam. No sabemos a priori qué va a escribir el usuario U, por lo que, en lo que a nosotros respecta, las cadenas que observamos como correo electrónico son aleatorias.

¿Cuál es el espacio muestral? Bueno, el conjunto de todas las cadenas es un espacio de muestra potencial. ¿Qué es la variable aleatoria? La variable aleatoria asigna los eventos a 1 o 0, donde 1 indica que el usuario U considera que la cadena es un correo electrónico y 0 indica que el usuario U no considera la cadena como un correo electrónico.

Ahora, podemos pensar en un usuario independiente V que juzgue estos correos electrónicos como spam o no spam. Ahora, no sabemos a priori lo que el usuario V considera spam o no spam, en lo que a nosotros respecta, los juicios producidos por V son aleatorios.

¿Cuál es el espacio muestral? Un espacio de muestra simple aquí es el conjunto de todas las cadenas posibles. ¿Qué es la variable aleatoria? La variable aleatoria asigna los eventos a 1 o 0 donde 1 indica que el usuario V considera la cadena como spam y 0 viceversa.

Ahora, podemos construir un clasificador probabilístico que pueda clasificar una cadena que el usuario U considera correo electrónico como correo no deseado o no correo no deseado como lo juzgaría el usuario V.


Generar puntos de una distribución simplemente significa puntos de muestreo de la distribución. En el ejemplo anterior, si tenemos acceso a un montón de correos electrónicos escritos por el usuario U, entonces estos son ejemplos generados a partir de la distribución en todas las cadenas que el usuario U considera como correos electrónicos.

More Interesting

¿Cómo le enseñas a un robot que ha cometido un error?

¿Cuál es la diferencia entre una cadena de Markov recurrente y una cadena de Markov absorbente?

¿Qué es Distill y cuál es su importancia para la investigación de Machine Learning?

¿Hay alguna diferencia entre el algoritmo de retropropagación utilizado en la etapa de ajuste fino del autoencoder y el algoritmo típico de retropropagación?

¿Cómo revolucionaría el mundo la PNL perfecta por computadoras?

¿Cuáles son los pros y los contras de aprender ExpressJS?

¿Por qué es óptimo establecer el tamaño del paso para la regresión logística con el descenso del gradiente al recíproco de la consistencia de lipschitz?

¿Cómo pudo Mark Zuckerberg implementar algoritmos de aprendizaje automático a la edad de 14 años?

En la regresión logística multinomial, ¿por qué el valor p en la prueba de razón de probabilidad es significativo pero en las estimaciones de parámetros no es significativo para cada dimensión?

¿Cuál debería ser el plan adecuado para aprender el aprendizaje automático desde cero para un estudiante del tercer semestre?

¿Qué significa realmente 'Deep' en Deep Learning?

¿Cuál es la diferencia entre gradiente de política determinista y gradiente de política estocástica?

¿Los bosques aleatorios son solo un tipo de Monte Carlo?

¿Cuáles son algunas aplicaciones interesantes de aprendizaje profundo en FinTech?

En TensorFlow, ¿qué es una capa 'densa' y una 'abandonada'?