¿Qué nivel de experiencia en aprendizaje automático se espera de un científico de datos?

Realmente depende de si este es un puesto de científico de datos que es un puesto de analista de datos disfrazado o si es un puesto de ciencia de datos real. Asumiré lo último y diré que requiere una comprensión bastante buena del aprendizaje automático.

Su pregunta fue “¿Deberían poseer suficiente conocimiento para diseñar nuevos algoritmos”? No, probablemente no. La mayoría de los puestos de ciencia de datos se trata de encontrar patrones en los datos y usar esos patrones para resolver un problema de negocios. Estás pensando más en la línea de un ingeniero de aprendizaje automático. E incluso entonces, normalmente se centran en implementar algoritmos preexistentes en la producción en lugar de crear nuevos algoritmos.

Esto puede llevar a la pregunta “¿cuánto ML necesito saber”? Bueno, probablemente debería saber lo suficiente para comprender los algoritmos que está utilizando y comprender cuándo funcionan y cuándo no. La razón es porque los mejores científicos de datos pueden resolver la mayor cantidad de problemas en el menor tiempo posible, creando una gran cantidad de valor para el negocio. No es una tarea fácil; pero comprender los algoritmos que está utilizando puede ser de gran ayuda con este esfuerzo.

Esto depende mucho de cuáles sean sus deberes como Científico de Datos. Existen diferentes tipos de roles que son una combinación de, entre otros, negocios, análisis, investigación y desarrollo.
Por ejemplo, si usted es un Científico de Datos en una analítica / datos que no son un inicio de servicio, es muy probable que utilice ML pero no tenga que diseñar o investigar algoritmos.
Si usted es un científico de datos porque está investigando en instituciones académicas, entonces obviamente tendría que diseñar algoritmos de ML si fuera necesario.
De cualquier manera, debe tener una muy buena comprensión de ML para aprovecharla al máximo como Data Scientist. Por ejemplo, y en mi opinión, si no conoce las suposiciones hechas por diferentes algoritmos de ML, entonces no se lo llamaría Data Scientist.

Depende del ambiente de trabajo. En mi lugar de trabajo tenemos científicos de datos e ingenieros de aprendizaje automático. Los científicos de datos se concentran en encontrar patrones a través de la exploración científica y los ingenieros de aprendizaje automático se concentran en desarrollar algoritmos que podamos usar para aprovechar los patrones. Si bien las habilidades técnicas se superponen, hay una diferencia de mentalidad entre las personas que quieren descubrir algo y las personas que quieren construir algo.

Depende de si se trata o no de una posición de ciencia de datos real o de hacer algunos gráficos / escribir código de producción para conjuntos de datos gigantes. La ciencia de datos real requiere bastante experiencia matemática. Se me pidió que diseñara nuevos algoritmos cuando fallamos, tuve que escribir pruebas matemáticas y necesito aplicar el algoritmo estadístico y de aprendizaje automático correcto dado un conjunto de datos específico en la mayoría de las áreas de análisis de forma regular (supervisado, sin supervisión) , longitudinal, reducción de dimensionalidad, series de tiempo, supervivencia, análisis gráfico / de red …).

La industria permite una investigación mucho más rápida que la academia y tiene un enfoque mucho más amplio. No es necesariamente cierto que los mejores investigadores terminarán en la academia. Por un lado, odio esperar 3 años para publicar algo y luego quedar encerrado en el área por el resto de mi vida porque era mi trabajo de posgrado. En la industria, puedo desarrollarme a mi propio ritmo y publicar / conferencias o patentes. A veces, solo pongo documentos en ArXiv y paso a algo más interesante y relevante.

More Interesting

¿Cuáles son algunos de los documentos fundamentales en el aprendizaje automático / algoritmos analíticos?

Como principiante en el procesamiento del lenguaje natural, ¿desde dónde debo comenzar?

¿Es posible crear un filtro adaptativo usando una red neuronal para que después del entrenamiento pueda filtrar la señal ruidosa y dar la salida deseada?

Tengo una entrevista telefónica técnica para una pasantía la próxima semana con el aprendizaje automático y el equipo de fraude de Uber. ¿Debo esperar DS y algoritmos generales o algo más?

¿Cómo se usa la pérdida de peso para la regularización en las redes neuronales?

¿Cómo podemos usar la cadena de Monte Carlo Markov y bayesiano no paramétrico para la reducción de dimensionalidad?

¿Cómo deciden las personas en aprendizaje profundo qué artículos no leer?

¿Cuál es una explicación intuitiva de un ingenuo clasificador de Bayes?

¿Cómo utilizaría el aprendizaje automático para resolver este tipo de preguntas: 1 + 4 = 5, 2 + 5 = 12, 3 + 6 = 21, 8 + 11 =?

Organización de la computadora: ¿Cuál es la aceleración de una versión de 5 etapas de la máquina en tubería sobre la versión sin tubería?

Cómo comenzar a implementar un sistema de recomendación para juegos

Cómo ejecutar la regresión logística en SAS en los datos de una encuesta donde las variables dependientes e independientes son niveles de satisfacción (escala - 0 a 5)

¿Qué es la validación cruzada?

¿Cuál es el mejor tutorial de Python para el aprendizaje automático?

¿Cuánto aprendizaje profundo puedes aprender en 20 días si trabajas todo el día?