¿Cuáles son algunos algoritmos de aprendizaje automático que no pueden tolerar la falta de datos?

Eliminemos la primera posibilidad, que tiene expectativas irrazonables del algoritmo que está tratando de usar. Ejemplos incluyen:

Estás utilizando datos etiquetados, donde falta una clase completa de etiquetas de los datos de entrenamiento
Está utilizando cualquier tipo de datos donde los datos faltantes son muy diferentes de los datos de entrenamiento.
Está utilizando cualquier tipo de datos donde los datos faltantes son mucho más abundantes que los datos de entrenamiento e incluye datos como los ejemplos anteriores

La respuesta en estos casos es “cualquier algoritmo de aprendizaje automático”, por razones que deberían ser bastante obvias. No se puede realizar previsiblemente en datos desconocidos que son muy diferentes de lo que se aprende.

Salvo expectativas irrazonables, cualquier algoritmo de ML debe funcionar razonablemente bien en los datos faltantes. ¿Por qué? El objetivo de utilizar un algoritmo ML es que pueda generalizarse a nuevos datos. Desea poder hacer inferencias sobre nuevos datos.

Dicho esto, cada algoritmo de máquina tiene puntos ciegos (véase el teorema de “no hay almuerzo gratis”). El uso de un algoritmo que no es adecuado para su tarea cae bajo el paraguas de “expectativas irracionales”.

AlgoritmosAprendizaje automáticoCiencia de datosClasificacióndatosinformáticaInteligencia ArtificialMinería de

Related Content

¿Cómo trato con los datos faltantes cuando ejecuto una regresión logística?

¿Cuáles son las categorías de big data?

¿Cuáles son los proyectos relacionados con big data y análisis de datos que un individuo puede hacer en su graduación?

¿Qué debo hacer para crear una base de datos efectiva?

¿Qué tan grandes son los componentes necesarios para acceder a los datos desde Wi-Fi?

¿Cuánto tiempo te llevó convertirte en analista / desarrollador junior de BI productivo?

¿Puedo confiar en el gobierno indio sobre la seguridad y el secreto de mis ideas de patentes?

More Interesting

¿Dónde puedo obtener un conjunto de datos para hacer predicciones de incendios forestales?

¿Cuáles son las clases que debo tomar como estudiante universitario de B.Tech para una carrera en Data Science y qué buscan exactamente las empresas durante las prácticas?

¿Puede Google Chrome mostrar mi uso de datos?

¿Es Scala una mejor opción que Python para Apache Spark en términos de rendimiento, curva de aprendizaje y facilidad de uso?

¿Por qué crees que la ciencia de datos será tan importante?

¿Cuál es la utilidad de Big Data?

¿Cómo puedo usar el aprendizaje automático en Python?

Estoy trabajando en Business Intelligence de los últimos 5 años. ¿Es este el momento adecuado para actualizarme a la ciencia de datos y / o las tecnologías de big data?

¿Cuánto tiempo durará la exageración de la ciencia de datos antes de que se sature? ¿Y cuál podría ser la próxima tendencia?

¿Esperamos que se creen más trabajos en las pruebas de Big Data dados los enormes requisitos para los roles de desarrollador de Big Data?

¿El título de Data Science ayudaría a un emprendedor en los negocios?

¿Qué algoritmos se utilizan para resolver problemas de aprendizaje automático basados en gráficos?

¿Cuál es el mejor lenguaje de programación para la ciencia de datos?

Como programador competitivo, ¿qué es más probable, un trabajo de ingeniería de software o un trabajo de científico de datos?

¿De dónde puedo obtener una lista de compañías que usan Big Data?

Web Analytics