Si está aprendiendo Data Science, ¿qué tan importante es saber cómo implementar modelos de Machine Learning en lenguajes de nivel inferior (por ejemplo, C ++ o Java)?

Primero, debe saber que Data Science es un término general muy amplio que cubre muchas áreas. En términos generales, en ciencia de datos, intentas comprender y explicar tus datos. Para el caso, necesita saber:

  1. Cómo visualizar sus datos para tener una idea de cómo se ve. Es posible que no sea trivial si tiene un conjunto de datos de alta dimensión.
  2. Algunas estadísticas para poder sacar conclusiones científicamente sólidas.
  3. Algunos métodos de Machine Learning para saber dónde necesita aplicar qué método para clasificar sus muestras, etc.
  4. Cómo escribir historias coherentes.
  5. ( la lista puede continuar)

Es importante que conozca los métodos de ML que utiliza. En ciencia de datos, los métodos de LD podrían considerarse como herramientas para el trabajo. Mientras mas sabes es mejor. Si conoce los detalles de cada método, puede interpretar mejor el resultado. Cuanto más profundo sepa, más fácil le resultará elaborar su historia.

Sin embargo, no es necesario saber cómo implementarlos desde cero. Ni siquiera se recomienda. Si hay un paquete disponible para el método ML que está buscando, simplemente utilícelo. Esos paquetes son desarrollados, probados y validados. Incluso si los implementa, necesita toneladas de pruebas para asegurarse de que su código sea absolutamente correcto. No reinventar la rueda .

Impleméntelos solo si

  1. No hay paquete / biblioteca para ellos. O
  2. Está tratando de optimizar el método ajustando algunas partes en la ruta de datos.

Algunos de mis amigos son científicos de datos y los únicos lenguajes / herramientas de programación que solo conocen son SAS y SPSS.

PD: Podría ser un caso diferente para los informáticos. Por lo general, cuando un informático es asignado a un trabajo de ciencia de datos, se espera que sepa cómo implementar cualquier algoritmo; Métodos de ML incluidos.

No es crítico en absoluto. Muchos idiomas se pueden portar a varias plataformas, por lo que su código R se puede portar a Java, si es necesario.

Java no es un lenguaje de bajo nivel.

More Interesting

¿Qué cursos PG de tiempo completo o parcial en Big Data recomendarías?

¿Existen aplicaciones para el aprendizaje automático / ciencia de datos en el campo de los vuelos espaciales?

¿Cuáles son algunas de las buenas certificaciones de Big Data para principiantes que desean desarrollar una carrera en Big Data?

Análisis de Big Data: como programador en C, ¿dónde comienza uno a readaptarse a tiempo parcial?

¿Cuál es la mejor manera posible de comenzar a aprender rápidamente y obtener un control firme de las ciencias de datos?

¿La 'arquitectura lambda' sigue siendo la mejor manera de construir canalizaciones de datos a gran escala (en 2017) o ha sido reemplazada por otras arquitecturas?

¿Cuáles son algunas técnicas populares de aprendizaje automático para operar en Forex?

¿Cuál es la mejor computadora portátil Big Data?

¿Cuáles son algunas de las arquitecturas de big data más complejas con análisis que conoces?

¿Cuál debería elegir, Data Science en UC Berkeley (programa MIDS) por $ 65,000, o Data Science en la Universidad de Illinois (MCS-DS) por $ 20,000?

¿Cómo será una carrera en análisis de big data en los próximos años?

¿Qué MOOC es mejor para aprender a extraer datos? ¿Los datos masivos de minería establecen uno de Stanford o el de la Universidad de Illinois?

¿Cuáles son las cosas "imprescindibles" sobre ciencia de datos y análisis?

¿Dónde puedo obtener una descripción de esquema de los datos de Microsoft Academic Graph?

¿Qué papel puede desempeñar la ciencia de datos en el análisis de existencias fundamental?