Los datos pequeños son uno, particularmente con muchas observaciones. Los datos de encuestas complejas son otro caso en el que los métodos estadísticos y muchos métodos de aprendizaje automático no definirán ni validarán subescalas para datos pequeños o encuestas no estructuradas (ver aquí: https://www.slideshare.net/Colle…). Pronto saldrá un artículo que detalla esto en la investigación de la educación para superdotados. La topología es particularmente útil para extender los métodos y pruebas estadísticas existentes.
Otra es cuando se necesita una visualización amplia de los resultados. A veces, una gráfica de clústeres Morse-Smale del paquete msr en R es mejor que una gráfica MDS o una gráfica de importancia forestal aleatoria general. Esto es particularmente importante dentro del modelado de riesgos, cuando una exploración visual puede ayudar a un actuario a comprender los diferentes contribuyentes al riesgo (consulte mi perfil de Google Scholar para obtener un documento sobre ejemplos actuariales). Con esta función, probablemente sea útil en la mayoría de los problemas de exploración de datos.
- Cómo mejorar sus habilidades de análisis de datos a diario
- ¿En qué trabaja la oficina de Palantir en París? ¿Trabajan en el aprendizaje automático o en la minería de datos?
- Cómo comenzar a analizar datos usando R
- ¿Cuál es el mejor programa de ciencia de datos?
- ¿Es más fácil trabajar en SVM o LR para una persona con antecedentes menores de estadísticas y minería de datos?