¿Dónde puedo encontrar un código de Python para preprocesar el conjunto de datos?

Lo siento. Para que cualquiera pueda responder a esto, debe decir más sobre el conjunto de datos en cuestión y lo que desea hacer en el preprocesamiento. ¿Es el contexto de su pregunta “aprendizaje automático”? Si es así, quizás Cómo preparar sus datos para el aprendizaje automático en Python con Scikit-Learn – Machine Learning Mastery lo ayudará. Encontré ese artículo con una simple búsqueda en Google de:

preprocesamiento de datos para aprendizaje automático

En realidad, solo escribí la parte de “datos de preprocesamiento” de la búsqueda y fue Google quien sugirió la parte “para aprendizaje automático” de los términos de búsqueda.

Tenga cuidado de conservar al menos una copia de su conjunto de datos original. Algunas de las transformaciones disponibles perderán, en cierto sentido, la información que estaba allí originalmente. Es decir, no se pueden deshacer reprocesando el archivo de datos preprocesado. Ese artículo dice que debe esperar jugar un poco con su conjunto de datos antes de descubrir qué preprocesamiento, si lo hay, es más efectivo para condicionar sus datos para que sean sabrosos para los algoritmos de aprendizaje automático.

A medida que aumenta el número de variaciones en su conjunto de datos original, asegúrese de haber mantenido buenas notas sobre qué archivo refleja exactamente qué transformación de preprocesamiento se aplicó. La asignación cuidadosa de nombres de archivos puede ayudar, pero al final, necesitará notas para evitar perderse en el bosque.

Sugeriría explorar sus conjuntos de datos antes de pensar en el preprocesamiento. Los pasos de preprocesamiento pueden variar según el conjunto de datos que esté utilizando.

More Interesting

¿Cómo es el nano grado de aprendizaje automático de Udacity en comparación con la especialización de aprendizaje automático de Coursera, cuál es mejor?

Cómo verificar si el objeto de una imagen existe en otra imagen

¿Cuáles son los modelos de redes neuronales más básicos que un principiante debe aprender?

¿Qué es la regresión de cresta?

Procesamiento del lenguaje natural: ¿Cuáles son algunas ideas de problemas / proyectos sobre la clasificación jerárquica de textos?

¿Los programas de software de aprendizaje automático toman riesgos?

¿Cuáles son los desafíos tecnológicos involucrados en alimentar el código fuente de una máquina Linux y hacer que aprenda a codificar un núcleo Linux similar?

¿Por qué las computadoras no pueden superar de manera confiable a los humanos en reconocimiento facial?

¿Cuáles son algunas formas de preprocesar imágenes antes de aplicar redes neuronales convolucionales para la tarea de clasificación de imágenes?

¿Cuál es el flujo de trabajo típico para usar el aprendizaje profundo para resolver un problema?

¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?

¿Cómo entrenamos un clasificador para el cual solo tenemos datos de entrenamiento positivos (no hay datos negativos o sin etiquetar disponibles)?

¿Existe algún proyecto de datos abiertos que utilice el aprendizaje automático y la ciencia de datos para proporcionar información sobre los datos de incidentes de aplicación de la ley disponibles públicamente?

¿Cómo se aplica el aprendizaje automático en genética o biología molecular?

¿Es posible tener experiencia en desarrollo web, desarrollo de Android, resolución de problemas, IA y ML para tener un buen trabajo, o solo necesito concentrarme en un campo y no fusionar campos?