¿De qué sirve el aprendizaje automático en la predicción de resultados de cricket?

Machine Learning (ML) se puede usar para predecir el resultado de un partido de cricket. Sin embargo, al igual que otros problemas de ML, encontrar las características / atributos correctos es el mayor desafío. ¿Cuáles podrían ser esas características? ¿El desempeño histórico de jugadores individuales, bateadores, jugadores de bolos, fildeadores? La ubicación del partido, las condiciones climáticas, la edad promedio del equipo, la altura de los jugadores, los resultados pasados ​​del equipo juntos y con otros equipos y muchos más atributos similares. Un buen modelo también debe considerar el cambio de rendimiento de un equipo en particular durante un período de tiempo. Es muy difícil elaborar una lista exhaustiva de características discriminatorias y no sabemos si muchas de ellas son relevantes o no. Sin embargo, construir un modelo con las mejores características posibles puede no dar una predicción definitiva debido a la complejidad de las formas y la explicación histórica. También sabemos que los desvalidos pueden y han derrotado a los gigantes del juego varias veces. ¿Podemos aprovechar tales situaciones o anomalías y usarlas para mejorar nuestro modelo predictivo? El problema difícil es definir qué constituye un buen modelo y cuánta precisión se considera buena. ¿Se puede considerar que una precisión del 80% es buena?
Los siguientes enlaces pueden ser útiles para explorar más este tema

  • ¡Análisis de Cricket con cricketr!
  • https://people.ucsc.edu/~praman1…
  • ¿Cuáles son algunos de los modelos predictivos disponibles para el juego de cricket? ¿Cuáles son los que se pueden hacer?
  • Microsoft presenta una plataforma de aprendizaje automático para predecir puntajes en partidos de cricket – MSPoweruser
  • laxpatil / cricPred

Llegué a esta pregunta hace unos meses para encontrar una respuesta y volví a responderla desde hoy.

El aprendizaje automático se puede utilizar de muchas maneras para las predicciones de cricket. He estado pensando en esas formas y en solo dos semanas, he pensado en 3 formas y también las implementé.

El aprendizaje automático se puede utilizar en:

  • Predecir el resultado de un partido antes y durante un partido. Puede haber muchas características para este problema, como el país donde se juega el partido, el suelo, los promedios de bateo de cada bateador, los promedios de bolos de cada jugador, la proporción de victorias de ambos equipos entre sí en general y en el terreno y país específicos . La lista continua.
  • Predecir el puntaje de un jugador en un partido. Las características de este problema pueden ser el promedio de un jugador en los últimos 5 partidos en el mismo terreno, contra el mismo equipo.
  • Este fue interesante y ha recibido mucha apreciación desde que lo publiqué en mi blog. Predecir el próximo wicket en un partido T20. Las características de este problema fueron los puntajes, wickets, over de las últimas 18 bolas y las etiquetas predijeron un wicket en las siguientes 6 bolas. Pude obtener buenos resultados que publiqué en mi blog.

Por lo tanto, estas son algunas formas en que se puede aplicar el aprendizaje automático. También puede haber muchas otras formas. Es solo una cuestión de pensar y explorar.

En caso de que quieras el enlace del blog:

Enlace del blog: donde el cricket se une al análisis

Será muy difícil predecir el resultado final de un partido con buena precisión utilizando el aprendizaje automático. Pero puede predecir el puntaje final de un equipo que bate primero o la probabilidad de que un equipo persiga se basará en los puntajes actuales.

WASP es una de las herramientas que se utiliza en los partidos celebrados en Nueva Zelanda para predecir los puntajes. También podemos usar algunos otros algoritmos de aprendizaje automático, como la regresión lineal, para predecir primero el puntaje final del bateo del equipo.

¿Qué características usar para el entrenamiento?

  1. Total de carreras anotadas
  2. Wicketes totales
  3. Total total
  4. Tasa de correr
  5. Carreras anotadas en los últimos 5 overs
  6. Velocidad de ejecución en los últimos 5 overs
  7. Puntajes del bateador que está bateando
  8. Puntaje promedio de las primeras entradas en el campo

Puede comenzar con [total de carreras anotadas, total de wickets, total de sobres] como las variables de entrada y [puntaje final] como la variable de salida y esto debería darle una buena predicción.

He intentado lo mismo usando las características anteriores y me dio un valor R-cuadrado de 54. Supongo que es bastante bueno simplemente usando un solo modelo para la regresión.

Puedes echar un vistazo a mi implementación.
Predecir el puntaje final (primeras entradas) en un partido ODI

Hay un trabajo de investigación que se titula ” Uso del aprendizaje automático para predecir el resultado de veinte partidos de cricket en el condado de Inglés “. Gran parte de la ingeniería de características se ha llevado a cabo junto con las estadísticas del jugador en el documento mencionado.

Lea el libro “señal y ruido” de Nate Silver donde habla sobre la predicción del resultado del béisbol. Tengo el presentimiento de que una analogía también se puede probar con éxito en el cricket.

More Interesting

Además de las redes neuronales profundas, ¿existen antecedentes para cálculos largos con una inferencia máxima a posteriori eficiente?

¿Puedo comenzar a aprender el aprendizaje automático y el aprendizaje profundo sin repasar primero mis conocimientos de matemáticas?

¿Cómo puede llevar a cabo experimentos y compararlos con otros algoritmos en la investigación de la visión por computadora (detección de objetos, reconocimiento, seguimiento, etc.)?

¿Existen motores / algoritmos que puedan equiparar el significado de dos oraciones?

Cómo aplicar PCA para la reducción de dimensionalidad y SVM para agrupar y clasificar los patrones usando C ++ OpenCV

¿Las GPU seguirán dominando la inteligencia artificial y el aprendizaje automático, aumentando el valor de compañías como Nvidia y AMD, o los chips especializados como los de Graphcore se harán cargo?

¿Cuál es la diferencia entre el aprendizaje probabilístico y el aprendizaje no probabilístico para diferentes situaciones? ¿Cuándo es uno más apropiado que el otro?

¿Cómo determinaría si el error de cuando ejecuta su algoritmo de aprendizaje automático es de alto sesgo o alta varianza (también conocido como corte o sobreajuste)?

Soy candidato a doctorado en una universidad en Irán, tengo experiencias en PNL persa, Spark, Hadoop y aprendizaje profundo. ¿Tengo alguna posibilidad de ingresar a Google?

¿Cuál es el beneficio de utilizar la agrupación promedio en lugar de la agrupación máxima?

He asignado mis pesos (w) a un múltiple multinomial (o k-simplex), dividiendo cada componente de w por la suma de todos los componentes. ¿Cómo realizo la regularización (equivalente a l1 o l2) en el nuevo espacio multinomial múltiple (k-simplex)?

¿Qué significa una probabilidad gaussiana en el clasificador bayesiano ingenuo gaussiano?

¿Cuál es la ventaja de Bayesian Naive Bayes sobre Naive Bayes simple?

¿Cuáles son las principales diferencias entre TensorFlow y SciKit Learn?

¿Cuál es el mejor enfoque para abordar la compensación de exploración / explotación en los sistemas de recomendación?