Cómo usar una PC virtual para el análisis de datos

Uso AWS para jugar y probar cosas que no puedo probar en el trabajo. Los siguientes son algunos puntos basados ​​en mi experiencia:

1) Regístrese para obtener una cuenta de AWS. Se le pedirá la información de su tarjeta de crédito. Sin embargo, si utiliza los servicios de nivel gratuito, no se le cobrará durante los primeros 12 meses después de registrarse. Servicios en la nube gratuitos: nivel gratuito de AWS

2) Necesitará tres cosas para analizar sus datos: espacio de almacenamiento, un servidor y una herramienta / software.

3) Para el almacenamiento, en el nivel gratuito, obtendrá 30 GB de Elastic Block Storage (EBS). No estoy seguro si su conjunto de datos es más grande que esto.

4) Para un servidor, bajo el nivel gratuito, se le permite un servidor t2.micro EC2 Windows / Unix, que tiene 1 GB de memoria. El nivel gratuito le permite la flexibilidad de usar, por ejemplo, 1 instancia de t2.micro continuamente durante un mes calendario o, por ejemplo, 30 instancias de t2.micro juntas como un clúster durante un día. En el último caso, obtienes un clúster de 30 GB a tu disposición durante un día entero.

5) Para la herramienta / software, puede instalar R en la instancia EC2. Instrucciones para instalar y usar R en Amazon EC2

Puede terminar pasando algún tiempo aprendiendo cómo hacer lo anterior. En mi experiencia, es tiempo bien empleado. Una vez que aprenda a usar AWS y aprenda a hacer un uso completo del nivel gratuito, puede probar cosas como configurar un clúster Hadoop de 4 nodos de forma gratuita (Spinning Up a Free Hadoop Cluster: Step by Step) o configurar su propio SPARK cluster por menos de $ 1 (Giro de un Spark Cluster en instancias puntuales: paso a paso).

Espero que esto ayude.

Intente usar RapidMiner Studio, viene con la capacidad de usar AWS para sus trabajos de análisis de datos para que pueda cambiar según sea necesario. Simplemente agregue una cuenta RapidMiner Cloud y obtenga créditos mensuales gratis y luego compre más según sea necesario.

RapidMiner Cloud

Hay una serie de otros servicios que le permiten escalar sus análisis a AWS, etc. Editaré esta respuesta con más de ellos cuando tenga tiempo.