El análisis de datos topológicos es útil cuando otros métodos fallan (tamaños de muestra pequeños, relaciones complejas de predictores, gran cantidad de predictores …). Lo he usado para validar nuevas pruebas psicométricas con pequeñas muestras piloto (artículo aquí: https://www.slideshare.net/Colle…). También lo he usado para explorar conjuntos de datos y crear modelos de regresión particionados (ver aquí: https://www.slideshare.net/Colle…). Un proyecto en el que estoy trabajando ahora para el trabajo lo utiliza en un conjunto de datos en el que no pudimos encontrar ninguna relación o agrupación con algoritmos tradicionales de estadística / aprendizaje automático; pudimos obtener información sobre la población que no había sido posible con otros métodos ; Nos ha llevado a nuevas hipótesis y varios estudios piloto propuestos.
Tengo otro artículo que explora las aplicaciones de estos conceptos a otros modelos de aprendizaje automático: Farrelly, CM (2017). Conjuntos KNN para la regresión Tweedie: el poder de los barrios multiescala. preimpresión arXiv arXiv: 1708.02122.
- ¿Existe una biblioteca GUI nativa estable para Go?
- Como uno de los primeros practicantes de inteligencia artificial y reconocimiento de voz, ¿qué piensa James Baker del rumor en torno al aprendizaje automático y la ciencia de datos en la década de 2010?
- Cómo comenzar con un proyecto relacionado con big data
- ¿Cómo se utilizan los grandes datos en la industria del petróleo y el gas? La industria del petróleo y el gas ya contaba con sistemas de adquisición de datos e informes implementados para la producción y el mantenimiento. ¿Qué nivel adicional de gestión de datos proporciona Big Data?
- Uso mucho Python y R, y me gustaría comenzar una empresa que ofrezca servicios de análisis de datos. ¿Cómo puedo monetizar big data? ¿Donde debería empezar?