¿Qué dice el profesor Yaser Abu-Mostafa en su conferencia sobre la viabilidad del aprendizaje?

* A2A *

Los experimentos aleatorios están definidos por la aplicación de aprendizaje automático disponible. Por ejemplo, supongamos que estamos creando un clasificador de correo no deseado.

Simplifiquemos un poco el escenario. Digamos que tenemos un solo usuario U escribiendo correos electrónicos y nuestro objetivo es clasificar los correos electrónicos escritos por el usuario U como spam o no spam. No sabemos a priori qué va a escribir el usuario U, por lo que, en lo que a nosotros respecta, las cadenas que observamos como correo electrónico son aleatorias.

¿Cuál es el espacio muestral? Bueno, el conjunto de todas las cadenas es un espacio de muestra potencial. ¿Qué es la variable aleatoria? La variable aleatoria asigna los eventos a 1 o 0, donde 1 indica que el usuario U considera que la cadena es un correo electrónico y 0 indica que el usuario U no considera la cadena como un correo electrónico.

Ahora, podemos pensar en un usuario independiente V que juzgue estos correos electrónicos como spam o no spam. Ahora, no sabemos a priori lo que el usuario V considera spam o no spam, en lo que a nosotros respecta, los juicios producidos por V son aleatorios.

¿Cuál es el espacio muestral? Un espacio de muestra simple aquí es el conjunto de todas las cadenas posibles. ¿Qué es la variable aleatoria? La variable aleatoria asigna los eventos a 1 o 0 donde 1 indica que el usuario V considera la cadena como spam y 0 viceversa.

Ahora, podemos construir un clasificador probabilístico que pueda clasificar una cadena que el usuario U considera correo electrónico como correo no deseado o no correo no deseado como lo juzgaría el usuario V.

Generar puntos de una distribución simplemente significa puntos de muestreo de la distribución. En el ejemplo anterior, si tenemos acceso a un montón de correos electrónicos escritos por el usuario U, entonces estos son ejemplos generados a partir de la distribución en todas las cadenas que el usuario U considera como correos electrónicos.

AprendizajeAprendizaje automáticoestadísticas