Podemos agrupar los tipos de problemas en dos categorías. Problemas que no pueden resolverse mediante técnicas en ciencia de datos y problemas que esperamos poder resolver pero que actualmente no podemos resolver.
Problemas sin solución
Los problemas donde no se puede extraer ningún patrón porque los datos carecen de la información necesaria no se pueden resolver. En otras palabras, la información que está tratando de extraer ni siquiera está allí.
- ¿En qué cosas tienen que pasar el tiempo los científicos de datos que preferirían no hacerlo?
- ¿Cuál es el alcance de la actualización de Big Data en India?
- ¿Qué papel debería elegir / jugar, si quiero trabajar en Big Data Analytics / Machine Learning?
- Estoy en mi último año como estudiante de informática. ¿Qué pasos debo tomar para conseguir un trabajo en Data Science?
- ¿Qué significa cuando una curva ROC no es suave?
Problemas solucionables con soluciones mediocres
Este es un truco para definir, ya que hay una gran cantidad de problemas que hoy no podemos resolver con el aprendizaje automático. Un campo donde había mucho margen de mejora es el aprendizaje no supervisado. Aprendizaje supervisado donde hemos etiquetado los datos, es decir, cada punto de datos es el mercado con una “respuesta correcta” que tratamos de generalizar, mientras que los datos no supervisados no tienen este lujo. Desde el comienzo de la revolución del aprendizaje profundo, los modelos supervisados han mejorado significativamente en muchos dominios, ¡los métodos no supervisados no tanto!