Si todos los datos en esa columna son inciertos y aún tienen alguna relación con la variable realidad / objetivo, entonces, como Oliver Eberle ha mencionado, puede usarlo como si fuera otra variable independiente.
Recientemente hemos encontrado un problema en el que algunos de los ingresos no eran precisos. En algunos casos, los ingresos se almacenaron como ingresos mensuales (en lugar de ingresos anuales como todos los demás casos). Lo que hicimos fue corregir la variable de ingresos utilizando un estimador de máxima verosimilitud. Dadas otras variables como la edad, la ubicación, etc., creamos un modelo de ingresos y estimamos la probabilidad de que el ingreso dado sea mensual. Luego, en los casos en que esta probabilidad era alta, multiplicamos el número por 12 para anualizar el ingreso.
En su caso, para cada instancia, tiene tres valores de edad posibles: edad dada, edad dada + 1 y edad -1 dada. Si age tiene una relación con cualquier otra variable, puede construir un modelo pequeño para corregir la edad antes de usarla. Por otro lado, si el error es completamente ruidoso, no es necesario corregirlo.
- ¿Existe algún teorema en estadística o aprendizaje automático que muestre que "cuanto mayor es el conjunto de datos, mayor es la precisión"?
- ¿Cómo es tener posiciones académicas e industriales conjuntas en imágenes médicas, visión por computadora, gráficos por computadora o aprendizaje automático?
- ¿Cuál es la relación entre proxy inverso, balanceador de carga y CDN?
- ¿Cuál es la tecnología actual disponible para leer las señales cerebrales y transferirlas a una computadora para realizar análisis?
- ¿Cuál es la contribución del tercero de entre tres autores en el artículo científico de la informática?