¿Cuáles son algunos algoritmos de aprendizaje automático que no pueden tolerar la falta de datos?

Eliminemos la primera posibilidad, que tiene expectativas irrazonables del algoritmo que está tratando de usar. Ejemplos incluyen:

  • Estás utilizando datos etiquetados, donde falta una clase completa de etiquetas de los datos de entrenamiento
  • Está utilizando cualquier tipo de datos donde los datos faltantes son muy diferentes de los datos de entrenamiento.
  • Está utilizando cualquier tipo de datos donde los datos faltantes son mucho más abundantes que los datos de entrenamiento e incluye datos como los ejemplos anteriores

La respuesta en estos casos es “cualquier algoritmo de aprendizaje automático”, por razones que deberían ser bastante obvias. No se puede realizar previsiblemente en datos desconocidos que son muy diferentes de lo que se aprende.

Salvo expectativas irrazonables, cualquier algoritmo de ML debe funcionar razonablemente bien en los datos faltantes. ¿Por qué? El objetivo de utilizar un algoritmo ML es que pueda generalizarse a nuevos datos. Desea poder hacer inferencias sobre nuevos datos.

Dicho esto, cada algoritmo de máquina tiene puntos ciegos (véase el teorema de “no hay almuerzo gratis”). El uso de un algoritmo que no es adecuado para su tarea cae bajo el paraguas de “expectativas irracionales”.

More Interesting

¿Dónde puedo obtener un conjunto de datos para hacer predicciones de incendios forestales?

¿Cuáles son las clases que debo tomar como estudiante universitario de B.Tech para una carrera en Data Science y qué buscan exactamente las empresas durante las prácticas?

¿Puede Google Chrome mostrar mi uso de datos?

¿Es Scala una mejor opción que Python para Apache Spark en términos de rendimiento, curva de aprendizaje y facilidad de uso?

¿Por qué crees que la ciencia de datos será tan importante?

¿Cuál es la utilidad de Big Data?

¿Cómo puedo usar el aprendizaje automático en Python?

Estoy trabajando en Business Intelligence de los últimos 5 años. ¿Es este el momento adecuado para actualizarme a la ciencia de datos y / o las tecnologías de big data?

¿Cuánto tiempo durará la exageración de la ciencia de datos antes de que se sature? ¿Y cuál podría ser la próxima tendencia?

¿Esperamos que se creen más trabajos en las pruebas de Big Data dados los enormes requisitos para los roles de desarrollador de Big Data?

¿El título de Data Science ayudaría a un emprendedor en los negocios?

¿Qué algoritmos se utilizan para resolver problemas de aprendizaje automático basados ​​en gráficos?

¿Cuál es el mejor lenguaje de programación para la ciencia de datos?

Como programador competitivo, ¿qué es más probable, un trabajo de ingeniería de software o un trabajo de científico de datos?

¿De dónde puedo obtener una lista de compañías que usan Big Data?