Cómo participar en una competencia de Kaggle con una computadora portátil

Algunas ideas
-si está utilizando un lenguaje de alto nivel como python, trate de evitar los bucles tanto como sea posible y realice llamadas a paquetes que usan C y / o usan listas de comprensión
-Hay algunas optimizaciones de velocidad para Python Page en python.org. Debería encontrar algo similar para cualquier idioma que esté usando (matlab, R, etc.)
-Dividir la informática en pedazos y usar cron para que se ejecute automáticamente por la noche
-No sé cuántos núcleos tienes, pero a menudo aprender un poco de programación paralela es extremadamente útil
-si estás en una escuela, mira si puedes usar una computadora más poderosa / usar un clúster propiedad de la escuela
-si no tiene y tiene un salario de desarrollador / científico de datos, considere comprar una computadora más poderosa o alquilar a través de Amazon
-Evite volver a calcular la misma cosa repetidamente memorizando funciones en el disco (enchufe descarado a mi biblioteca que usa decoradores para memorizar en el disco onenoc / memo)

Te recomendaría comenzar con scikit-learn, tiene excelentes tutoriales y documentación para principiantes. Para grandes conjuntos de datos que no caben en la memoria, Scikit también ofrece algunos algoritmos que admiten la capacitación en línea. Una vez que haya aprendido los conceptos básicos con Scikit y quiera trabajar con conjuntos de datos más grandes, puede probar Vowpal Wabbit o MLLib de Apache Spark.