Soy un experto en aprendizaje automático, pero he implementado suficientes algoritmos en computación científica para decir: Sí, probablemente debería aprender a implementar al menos algunos algoritmos usted mismo.
Leer las matemáticas / estadísticas de fondo e implementar un algoritmo es la mejor manera de comprender realmente lo que es y los supuestos involucrados. Como resultado, la implementación de algoritmos más complejos será más fácil.
Fuera de un algoritmo o aplicación especializada, los algoritmos preempaquetados probablemente serán mejores de lo que implementa. Tome el paquete de carets de R por ejemplo. Esta biblioteca tomó años de trabajo de varias personas extremadamente capaces y presenta sus resultados de una manera fácil de entender. Si solo quieres entrenar un algoritmo con algún tipo de re-muestreo, te gustaría usar esto como mínimo para comenzar. Entonces, si tuviera un método más específico en mente, implementaría ese método especializado. Si desea ver algunos ejemplos de algoritmos preempaquetados que se usan (y abusan), le recomiendo echar un vistazo a Kaggle.
- Si quiero desarrollar herramientas analíticas en tiempo real para mi sitio web y agregar recomendaciones basadas en objetivos en tiempo real, ¿cuál entre PredictionIO y EasyRec sería una mejor opción? ¿Hay otras opciones mejores (de código abierto) disponibles aparte de estas dos?
- ¿Cuáles son los mejores campos de arranque de ciencia de datos en términos de inserción laboral?
- ¿De dónde puedo obtener una lista de compañías que usan Big Data?
- ¿Qué tan grande será el mercado para el modelado de datos de crowdsourcing? ¿Qué sectores se beneficiarán más? ¿Qué tipos de expertos se ganarán la vida compitiendo en estos sitios en el futuro?
- ¿Qué consejo le darías a un aspirante a científico de datos que haga en estas vacaciones?