Gracias por el A2A.
Es una parte importante de la ciencia de datos.
Típicamente, la inferencia existe como una forma de dar sentido a algo de una población que usa estadísticas. La mayoría del modelado de datos en estadísticas típicas es inferencia. La razón detrás de esto es la disponibilidad de datos, por ejemplo, es muy difícil hacer una pregunta a cada persona en un país.
- ¿Qué clases debo tomar en Duke si quiero ser un científico de datos?
- ¿Cuáles son los buenos métodos para muestrear big data?
- ¿Cuáles son los paquetes R más utilizados para la minería de datos o la ciencia de datos?
- ¿Cuáles son las principales tendencias en big data?
- ¿Por qué agregar más como primera columna de datos en el aprendizaje automático?
Luego, dos cosas cambian: la primera es la disponibilidad de datos. De hecho, puede recopilar datos de toda una población de interés. La segunda es que, a menudo, está menos interesado en inferir de los datos, pero más interesado en usarlo para predecir algo o prescribir una acción automáticamente.
Ahí es donde interviene el aprendizaje automático. Los algoritmos de aprendizaje automático, aquellos que tienden a distanciarse de las “estadísticas típicas” a menudo son menos interpretables pero más potentes en productos predictivos puros.
Esto significa que, dependiendo de los objetivos de un equipo de ciencia de datos, siempre hay espacio para el aprendizaje automático. Algunos equipos trabajan casi exclusivamente con el aprendizaje automático, integrando nuevos productos y características basadas únicamente en la capacidad de estos sistemas. Lo usamos para productos de datos específicos, pero a menudo utilizamos estadísticas comunes y modelos de datos que personalmente no llamo aprendizaje automático.
Si piensa en todas las disciplinas y habilidades que potencialmente pueden formar un equipo de ciencia de datos, el aprendizaje automático es seguro en el grupo central.
Espero que esto ayude.