Fundamentos :
- Visualización: Pandas (para vista de tabla), Matplotlib y Bokeh (si desea interacción con las parcelas), etc.
- Manipulación de datos (limpieza, muestreo, etc.): pandas
- Cargando datos desde SQL: los pandas también pueden leer desde SQL
- Carga de datos desde csv grande (IE extrayéndolo del disco): Pandas
- redes neuronales / mapas autoorganizados / máquinas boltzmann restringidas: PyLearn2 (biblioteca Python pura) y Caffe (principalmente código C ++ pero hay un contenedor Python) son dos paquetes que puede usar para sus necesidades de DNN. Ambos están en desarrollo activo.
- Métodos SVM / kernel: Scikit-Learn admite los métodos SVM / kernel. Utiliza LibSVM (código C ++) debajo del capó, por lo que el rendimiento es bueno.
- Una búsqueda *: Idunno
- Procesos de decisión de Markov: Idunno
- Bosque aleatorio: Scikit-Learn
- otras bibliotecas de ML útiles: hay muchas otras, pero no quiero nombrarlas porque no conozco tus problemas.
Como mínimo, debe tener estos en su arsenal: Pandas, Numpy, Scipy, Scikit-Learn, Matplotlib. Todos están incluidos si instala Anaconda.
- ¿Cuál es el principio de localidad en informática?
- ¿Cuál es la estructura de datos utilizada por el cerebro para almacenar datos?
- ¿Qué metodología / modelo de prueba crees que es más eficiente: gestión de prueba basada en sesión, modelos de contexto de texto o modelos de estrategia de prueba heurística?
- Mi amigo fingió los resultados de su investigación. ¿Qué debe hacer?
- ¿Cómo chicos como Peter Thiel y Reid Hoffman, sin experiencia en informática, formaron empresas tecnológicas exitosas?