Cómo seleccionar los atributos sensibles en un conjunto de datos

Realizar análisis de sensibilidad de entrada. Comience con un conjunto vacío, comience a agregar una de las características de su conjunto de características. Cuando desarrolle iterativamente su conjunto de características, evalúe su influencia en la variable objetivo. Dicho esto, ¿qué quiero decir con la palabra “influencia”?

Por influencia, quiero decir si ese conjunto de características puede predecir la variable objetivo.

Ejemplo: tenemos (f1, f2, f3 …… .fn, T), donde fi son las características y T es la variable objetivo. lo que hacemos en el análisis de sensibilidad de entrada es desarrollar iterativamente el conjunto de características.

f1 influencia en T

(f1, f2) influencia en T

(f1, f2, f3) influencia en T y así sucesivamente

si al agregar una característica el valor de influencia no cambia, nos detenemos.

Espero eso ayude !!

Primero: defina la palabra sensible como lo quiere decir.

¿Te refieres a sensible como en “¿No debería incluirse en ningún modelo público?” O incluso “¿No debería incluirse en un modelo?” Debido a problemas de privacidad?

Si eso es lo que quiere decir … entonces depende de la estructura de su conjunto de datos, de las herramientas de software que tenga disponibles, etc. Una gran cantidad de mezcla de datos, especialmente este tipo de mezcla de datos, debe hacerse con cuidado y a mano. De lo contrario, tendrá demandas en sus manos.

Si tiene otro significado de la palabra en mente, hágamelo saber a través de un comentario qué es, o, preferiblemente, agregue el significado a la descripción de su respuesta, y luego deje un comentario para informarme que lo ha hecho.

More Interesting

¿Cómo funciona Data Scramblr?

¿Cuál es la diferencia entre especialización y generalización en DBMS?

¿Qué es la ciencia de datos y el análisis de big data?

¿Puedo convertirme en un científico de datos sin aprender Python, pero solo con conocimientos de programación Java y aprendiendo el lenguaje R?

¿Cuáles son algunos mitos comunes que existen hoy sobre el aprendizaje automático?

¿Cuál de los siguientes cursos debería elegir, big data y Hadoop o data science? ¿Cuál de los cursos anteriores tiene más alcance en el futuro? Tengo 1,5 años de experiencia como desarrollador de Java.

¿Cuál es la mejor manera de elegir el número de componentes en PCA durante la reducción de dimensionalidad?

¿Cuáles son buenas maneras de evaluar los temas generados al ejecutar LDA en un corpus?

¿Realmente hace una diferencia entre los programas de EM de uno y dos años en los Estados Unidos, con respecto al campo de la ciencia de datos en términos de conseguir un trabajo también?

¿Qué tan relevante es el análisis de Big Data para la economía global actual?

¿Cuáles son las mejores consultoras de ciencia de datos?

A medida que las empresas manejan cada vez más datos, ¿las soluciones de Big Data serán obsoletas?

¿Dónde puedo obtener un conjunto de datos de muestra de la competencia de Deloitte, Kaggle, para predecir la pérdida de clientes en los dominios de seguros de vida?

¿Cuál es la relación entre los científicos de datos de la industria y la academia?

¿Cuáles son algunos buenos institutos de capacitación para aprender big data y análisis de datos en Bangalore?