(Esta pregunta está un poco torpemente redactada, así que supongo que se trata de predecir el resultado de un juego futuro, dados los resultados de puntajes anteriores).
No puedo justificar que este sea el “mejor” enfoque, pero recomendaría echar un vistazo a este artículo de George Dahl:
http://blog.smellthedata.com/201…
El artículo trata sobre el baloncesto, pero la mayoría de los puntos importantes son igualmente aplicables al fútbol:
- ¿Cuáles son algunos ejemplos de abstracción en biología?
- Cómo crear una inteligencia general artificial
- ¿Por qué algunos procesadores más baratos tienen una frecuencia de reloj más alta (número de GHz) a veces?
- ¿Cómo construiría un universo de realidad virtual de 5 dimensiones?
- ¿Cuáles son los límites teóricos del poder computacional dictados por las leyes conocidas de la física?
- En primer lugar, un juego trata sobre la interacción de dos equipos, por lo que cualquier modelo debe tenerlo en cuenta.
- Aunque este efecto es probablemente más fuerte en el baloncesto, es probable que los puntajes en un juego estén fuertemente correlacionados: si un equipo tiene más posibilidades de anotar, el otro equipo también. Por lo tanto, probablemente no desee entrenar un modelo para predecir puntajes absolutos. Mejor sería modelar el resultado como, por ejemplo, un gaussiano bivariado.
- El “tiempo de basura” es un problema. Los juegos pueden parecer más cercanos de lo que realmente fueron, porque el juego ya se decidió antes, y los equipos ingresaron en el cuarto trimestre.
- Los equipos juegan de manera diferente en casa y fuera, y los equipos cambian en el transcurso de la temporada.
Entonces, dados todos estos desiderata, George recomienda un enfoque de factorización de matriz bayesiana que incorpore información secundaria (como el tiempo y la ubicación del juego) a través de un proceso gaussiano sobre vectores de características latentes. (Pido disculpas si esa oración fue un bocado). Su trabajo con Ryan Adams e Iain Murray sobre el tema brinda los detalles:
http://www.cs.toronto.edu/~gdahl…
Y hay un código disponible aquí:
http://hips.seas.harvard.edu/con…