¿Qué modelo / algoritmo de ML utilizo?

Seguramente usará un algoritmo de clasificación (aprendizaje automático supervisado). El algoritmo que use dependerá de sus datos de entrenamiento y del límite de decisión. Como ejemplo, podría usar un árbol de decisión, donde toma una serie de decisiones para llegar a una decisión final. Por ejemplo, si su entrada es la hora del día: x y tiene como objetivo determinar si tiene correo electrónico no leído, y, (una variable binaria). Por lo tanto, el árbol de decisiones, basado en sus datos de entrenamiento, tomará decisiones como si el tiempo> 00:00:00 y el tiempo <06:00:00, luego y = 0 (no hay correo electrónico no leído). Sin embargo, debe darse cuenta de que esto (o cualquier algoritmo de aprendizaje automático) solo funcionará si su entrada está bien correlacionada con la salida. ¡Puede resultar que su producción no dependa en absoluto de la hora del día! Además, puede ser que la variable de salida cambie de forma 0 a 1 periódicamente (por ejemplo, si su software de correo electrónico recibe correo cada 30 minutos y usted recibe correo cada vez y lo lee). Por lo tanto, es posible que necesite separar su tiempo de entrada, en 4 entradas separadas, la hora del día, la hora, el minuto, el segundo. Nuevamente, si los límites de decisión son demasiado complejos, puede entrenar una red neuronal o un bosque aleatorio. Si me puede decir cuál es la variable de salida, podría dar una explicación más intuitiva.

Supongo que puede entrenar una red neuronal, supongo que los datos son simples con la marca de tiempo en un eje y el valor en otro. Si hay algunos datos escasos, supongo que obstaculizarán los pesos, pero supongo que serían valores atípicos. No tiene que escribir su propio clasificador, puede usar (Weka) Data Mining con el software de código abierto de Machine Learning en Java.

Como sabe cuáles serán los valores en varias ocasiones, tiene todo lo necesario para aplicar el refuerzo o el aprendizaje supervisado.

Su aplicación predeciría según los criterios y luego miraría un conjunto de datos conocido para ver si se pronosticaba correctamente. Luego modificaría los criterios en función de si era correcto y qué tan cerca estaba.