Tendrás que elaborar tu pregunta más allá del título.
Importar
Estoy seguro de que hay sitios que pueden manejar entradas de csv para lo que sea que hagan después. 😉
Conectar
¿Conectar a qué? ¿Gorjeo? ¿Un diccionario? ¿…? Cualquier servicio que pueda conectar su csv a cualquier cosa, también impondrá requisitos específicos a su csv.
- ¿Usas R estándar o Microsoft R Open? ¿Por qué?
- ¿Cuál es la importancia de utilizar la tendencia central en el análisis de datos?
- ¿Cuál es la mejor práctica para el preprocesamiento de datos antes de un modelo de aprendizaje automático?
- Cómo determinar la complejidad de una oración en inglés
- Cómo hacer aplicaciones basadas en un modelo basado en datos que toma datos de entrada y muestra predicciones de algo en particular
Limpiar
De ninguna manera. Claro, no habrá duda de que alguien se vinculará a algún servicio que pueda hacer una suposición educada sobre el tipo de cada variable y tal vez proporcionar algunas estadísticas que ayuden a detectar valores atípicos más o menos. Pero el verdadero desafío de la limpieza está en todas las cosas que se relacionan con el contexto de los datos y el propósito de los datos. Para dar un ejemplo que encontré regularmente en el pasado cuando hacía análisis para el comercio minorista: algunos artículos se empaquetarán individualmente, otros vendrán en paquetes. ¿Deberías dividir los paquetes o no? Eso también es limpiar, pero no hay una respuesta universal que sea correcta en cada situación.
¿Quizás en contextos muy específicos y bien definidos es posible hasta cierto punto?
Analizar
Si desea que un modelo se ejecute sobre sus datos y definió una columna como la que se va a predecir (en caso de un problema observado), lo más probable es que encuentre algo. Sin embargo:
- Ejecutar algunos modelos es fácil, cualquiera puede hacerlo en 5-10 minutos si tiene R instalado, puede leer un tutorial rápido y tener un csv.
- La limpieza es el verdadero desafío.
- Además, dar sentido a los modelos después ya es un poco más complicado y probablemente requerirá algunos antecedentes estadísticos para no solo funcionar con los números elegantes.
- Pero también, un análisis apropiado requiere primero que haya una pregunta definida de antemano. Dependiendo de eso, querrás diferentes modelos. Y en realidad, dependiendo de eso, probablemente harás tu ETL (es decir, limpieza) de manera diferente.
Esto no significa que no puede haber herramientas que lo ayuden con esto, lo que lo hace más fácil. Pero una solución de extremo a extremo preparada para usted que realmente funciona, no.