¿Puede Machine Learning predecir quién ganará las finales de la NBA? (Estoy más interesado en el cómo).

Los modelos de Machine Learning requieren mucho más que las estadísticas de los jugadores individuales para determinar el resultado de un juego. La conformidad de estos jugadores mientras juegan juntos como un equipo es un mapeo muy complejo que se modelará con nuestra comprensión actual.

También hay muchos hiperparámetros: considere un juego en el que un equipo lidera por 10 en el medio tiempo y pierde por 10 en el timbre final. Si la duración del juego no se ingresa al juego, el error es fatal.

Te daré una intuición final sobre esto. Las estadísticas son aburridas y la gente no verá las finales de la NBA si fue aburrido y no hubo sorpresa en el resultado (entropía cero). El hecho de que haya combacks, 20-0 carreras, zumbidos, golpes de embrague y jugadas apresuradas hace que los deportes sean lo suficientemente interesantes como para mirar y desafiar las estadísticas.

Sin embargo, te diré esto. Un amigo mío ha realizado un proyecto de ML para su curso de ML de pregrado que utilizó datos de equipo para predecir los resultados de los partidos de fútbol y definió su métrica de rendimiento como ganancia de apuestas en lugar de precisión y logró un + 42% de ganancia en el conjunto de datos de prueba. Este valor de ganancia es probablemente un agregado de muchos juegos de baja impar conocidos por la máquina, mientras que un bajo número de juegos se perdieron con altas probabilidades que borraron esas bajas acumulaciones impares. Es, en el mejor de los casos, un juego de azar semi educado.

Su modelo involucra árboles de decisión que usan el algoritmo C4.5 y post poda para evitar el sobreajuste. Luego, obtuvo resultados aún mejores con bosques aleatorios.

Editar: quería agregar una idea al proyecto de predicción del juego de fútbol. Los datos de fútbol son escasos en el sentido de que podría no haber puntaje en absoluto o, como máximo, 5-10 por juego y, en ausencia de datos, los modelos de máquina ponen más énfasis en los datos anteriores, es decir, se leen directamente de las estadísticas.

Creo que predecir los juegos de baloncesto es más fácil que predecir los juegos de fútbol debido a la abundancia de datos y al hecho de que a los estadounidenses les encantan sus estadísticas (¿Sabía que Stephen Curry es el tercer jugador que supera el número de asistencias de su padre en su séptimo año? cosas)