¿Cuáles son algunas trampas comunes al estudiar la clasificación en el aprendizaje automático?

Un error común es no realizar la división de entrenamiento / prueba correctamente . Debe asegurarse de tener datos que no se tocaron durante el entrenamiento y evaluar su modelo con esos datos. Y si sigue evaluando en el mismo conjunto de prueba pequeño mientras está probando diferentes modelos en el conjunto de entrenamiento, el conocimiento del conjunto de prueba comienza a introducirse en su modelo. Cuando los datos son realmente muy grandes, esto no importa demasiado: tendrá que esperar días para terminar el entrenamiento.

Debe controlar la precisión del conjunto de entrenamiento mientras ejecuta el algoritmo, pero informar los resultados en un conjunto de prueba extendido. Y no siga evaluando en el mismo conjunto de datos día y noche.

Si extrae fotogramas de un montón de videos para crear un conjunto de datos de imágenes estáticas, no podrá tomar un subconjunto aleatorio para entrenamiento / prueba. Debido a que los marcos están correlacionados, es posible que primero deba dividirse según los videos. Surgen muchos errores cuando los datos de prueba de las personas se parecen demasiado a los datos de entrenamiento. Esto a menudo se hace por accidente, así que ten cuidado.

Machine Learning

Related Content

¿Qué preguntas se pueden hacer en una entrevista sobre el proyecto de Análisis de sentimientos de Twitter?

¿Cuál es la forma más fácil de entender el análisis de componentes principales?

¿Por qué las tasas de aceptación de las conferencias de minería de datos son tan bajas y qué tipo de documentos se rechazan?

¿Pueden las máquinas entender el significado de las palabras?

¿Hay alguna conexión entre el aprendizaje de kernel múltiple (MLK) y el aprendizaje profundo?

¿Es la nube privada la decisión correcta para mi empresa?

Cómo elegir el número de árboles en el aprendizaje automático

Hay muchas trampas cuando intentas construir y usar aplicaciones de aprendizaje automático.

Probablemente, una buena parte de esos problemas se debe a un primer problema con el que lidiar, que es: ¿cuál es el mejor algoritmo o método para usar para su problema?

Un buen artículo para leer sobre este y muchos otros escollos en el aprendizaje automático es: “Algunas cosas útiles que debe saber sobre el aprendizaje automático” .

Aquí está la copia editada por ACM: Algunas cosas útiles que debe saber sobre el aprendizaje automático, pero también hay una versión gratuita de este documento en línea.

Tomasz Malisiewicz

More Interesting

¿Cuáles son las desventajas de [math] abs (x) [/ math] como función de activación en redes neuronales?

¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?

¿Qué tan importante es entender el cerebro para el aprendizaje profundo y viceversa?

¿Dónde puedo encontrar guías de aprendizaje automático desde la perspectiva de los hackers?

¿Cómo asociaría un producto con una categoría y subcategoría basada en la descripción de texto del producto?

¿Cuáles son los requisitos previos para aprender Oracle Apps Technical?

¿Wesleyan tiene un buen departamento de química / bioquímica?

¿Cuáles son algunas estructuras de datos esenciales y conocimiento de algoritmos necesarios para estudiar ciencia de datos?

¿Cómo debo entrenar mi modelo de tren con un modelo de regresión?

Cómo especificar si quiero ejecutar una función de paquete Caret para clasificación o regresión

¿Qué sería más beneficioso para un estudiante de tercer año de ECE, hacer aprendizaje automático u otros cursos?

¿Qué es la enseñanza profunda?

¿Cuáles son los grandes problemas en la inferencia variacional?

En una máquina de vectores de soporte, el número de vectores de soporte puede ser mucho menor que el conjunto de entrenamiento. ¿Cómo puede ser útil esta característica?

Cómo determinar la distribución que sigue un conjunto de datos

Web Analytics