¿Cómo manejan los científicos de datos las situaciones en las que es difícil obtener resultados verídicos?

La ciencia no se trata de la verdad fundamental, se trata de evidencia e incertidumbre. El problema al que se refiere es en un nivel básico “solo” la falta de datos. Creo que lo que hace que la mayoría de la gente se detenga y los buenos profesionales de datos brillen cuando faltan datos es que saben que obtener los datos correctos es donde todo comienza.

Dejando a un lado la filosofía y llegando a la parte técnica, lo que falta en su ejemplo son las etiquetas. Entonces tienes que crearlos. A veces es fácil, puede ser una simple heurística o binning. Otras veces es más complejo y el aprendizaje sin supervisión puede ayudar. El análisis de conglomerados puede traer buenos resultados para crear las etiquetas.

Su último recurso es hacerlo manualmente. ¡Puede que no sea práctico! Incluso pequeños conjuntos de datos hoy en día tienen miles de filas. Otro problema es el error humano.

Nunca hice un análisis de malware, así que no conozco los entresijos del proceso, pero si tiene variables que definen el malware, entonces podría ser un buen caso para la agrupación.

Related Content

¿Cuáles son las áreas de investigación activas en Análisis de datos / Minería de datos?

¿Cuáles son algunas buenas hojas de trucos de ciencia de datos?

¿Cómo es IIT Ropar para el aprendizaje automático o la ciencia de datos?

¿Cuál es la mayor barrera para la adopción de soluciones de big data en la asistencia sanitaria?

A los 28 años, y aprendiendo a programar. ¿Me he perdido la oportunidad de conseguir un trabajo en ciencia de datos y aprendizaje automático en el Reino Unido?

¿Crees que el aprendizaje automático / ciencia de datos puede contribuir a resolver los problemas sociales, de salud y económicos del mundo?

¿De qué manera la IA puede ser más inteligente si la inteligencia es biológica?

More Interesting

¿Por qué hay tantos científicos de datos reales e ingenieros de aprendizaje automático?

¿Alguien puede ayudarme en qué consiste el análisis de datos y cuál es la diferencia entre este y el científico de datos?

¿Qué uso como formato de base de datos \ archivo para la canalización de datos de ciencia de datos?

¿Cómo puedo comercializar mi punto de acceso si compré un plan de Big Data?

¿Existe un sitio web / lista de correo donde publican postdocs para la ciencia de datos, más aún en Europa? Definitivamente hay una lista de correo para el aprendizaje automático.

¿Qué tecnologías admiten el análisis de Hadoop y Big Data?

¿Cuál será el alcance de los trabajos de científico de datos en los próximos años?

¿Es la Universidad de Columbia un lugar respetable para estudiar ciencia de datos?

Como licenciado en Ciencias de la Computación, ¿debería seguir un aprendizaje teórico de aprendizaje automático o un aprendizaje de aprendizaje automático aplicado?

¿En cuántas dimensiones (Vs) se define comúnmente Big Data?

¿Qué es el soporte y la confianza en la minería de datos?

¿Cómo es un día para un científico de bioinformática?

¿Cuáles son las clases de ciencias de datos más útiles para abogados?

¿Cuántos desarrolladores tiene la empresa Tableau?

¿Puedo trabajar como contratista / consultor independiente en el campo de la ciencia de datos?

Web Analytics