Me centraré únicamente en el aprendizaje automático supervisado aquí.
Una forma de hacerlo sería obtener primero datos geolocalizados [1].
Por ejemplo, supongamos que desea construir un modelo predictivo de precios de apartamentos en una ciudad determinada.
- ¿Cuáles son los mejores métodos para probar aplicaciones de big data?
- ¿Cuáles son las diferencias entre las carreras universitarias de ingeniería industrial, investigación de operaciones, ciencias de gestión y ciencias de datos?
- Como empresa de tecnología, ¿Amazon usa más Python que R para proyectos de Data Science?
- ¿Cuáles son algunas de las buenas certificaciones de Big Data para principiantes que desean desarrollar una carrera en Big Data?
- Cómo documentar un proyecto de ciencia de datos
Elija la ciudad y luego elija algunas ubicaciones donde desea realizar su experimento. Estos deben almacenarse como una lista de puntos de longitud y latitud o una lista de hashes WKB [2] (que es un formato conveniente de SIG).
Luego, reúna características en esta cuadrícula de puntos que podrían explicar los precios de los apartamentos: número de cafés cercanos, número de paradas de autobús, precio promedio en un radio de 1 km, exposición a las luces solares, ruido promedio en DB, etc. Sé tan creativo como puedas.
Una vez que haya hecho esto, aplique cualquier algoritmo de aprendizaje automático que considere apropiado. Tenga cuidado de no alimentar las posiciones de la cuadrícula a su modelo como características.
Eso es.
Tenga en cuenta que, como en muchos otros problemas de LD, algunas de las partes más difíciles son la recopilación de datos y la ingeniería de características.
Espero que esto ayude.
Notas al pie
[1] Geolocalización – Wikipedia
[2] Texto conocido – Wikipedia