¿Es necesario implementar algoritmos principales de aprendizaje automático desde cero al menos una vez para obtener una pasantía en ciencia de datos en una empresa prestigiosa?

La implementación de algoritmos de aprendizaje automático no le enseña mucho sobre el aprendizaje automático. La aplicación de esos algoritmos a varios conjuntos de datos: visualización de resultados intermedios, ajuste de hiperparámetros, selección y diseño de características, limpieza de datos, etc.

Para evidencia anecdótica: entrevisté a un grupo de candidatos internos (estudiantes de doctorado) para un proyecto de aprendizaje profundo aplicado justo antes del verano, y nunca solicité tal experiencia. A pesar de nunca haber implementado CNN profundos desde cero, el interno que trabajó conmigo produjo algunos resultados sorprendentes que planeamos presentar pronto a un lugar líder. Del mismo modo, conozco muchos doctorados de ML muy buscados que nunca han implementado bosques aleatorios o SVM o NN o propagación de creencias por su cuenta.

Por otro lado, es importante conocer las herramientas relevantes que se solicitan para la pasantía, por ejemplo, si va a trabajar con grandes datos, probablemente necesite conocer bases de datos a gran escala y cosas como Hadoop junto con el scikit relevante de la biblioteca ML -aprender o TensorFlow. Si le falta mucho en ese frente, tendrá dificultades para convencer al entrevistador de que lo considere.

Related Content

¿Cómo manejaría e investigaría típicamente los valores atípicos en un conjunto de datos?

¿Qué tipo de productos construye MAD Street Den?

¿Cuáles son las opciones de salida de Mu Sigma?

¿Cuáles son los desafíos de construir un equipo de datos en una startup?

¿Cuáles son algunos de los análisis de datos más interesantes que se hayan hecho?

Cómo hacer que el aprendizaje del análisis de datos y el tema del algoritmo sea más fácil e interesante

¿Cuáles son los grandes proyectos de datos en torno a craigslist?

Implementar, dice Naive Bayes, realmente no ayudará mucho. Pero debe tener una comprensión muy profunda de cómo funcionan los algoritmos para comprender sus modos de falla y sus pros y contras. Esperarían que supieras: ¿funcionaría aquí un enfoque de embolsado o refuerzo? ¿Sería apropiado un modelo gráfico probabilístico frente a una máquina de vectores de soporte? ¿Cuál es el núcleo correcto para un SVM? Ese tipo de cosas.

No es necesario que haya implementado SVM para saber eso, pero debe tener una comprensión muy profunda de cómo funcionan los SVM.

Zeeshan Zia

More Interesting

¿Es GDS (Global Distribution Systems, donde se almacenan los datos de la aerolínea) una base de datos o un tipo de big data?

¿Qué escuela es mejor para el aprendizaje automático?

¿Qué lo motivó a convertirse en gerente de ciencia de datos en lugar de permanecer en el papel de un científico de datos senior?

¿Qué es el software Tally? ¿Cómo ayuda a capturar los datos del canal?

¿Qué curso de ciencia de datos es mejor para un principiante, el nanodegree analista de datos de Udacity o el curso de ciencia de datos?

¿Cuál es la forma más efectiva de estructurar un equipo de ciencia de datos?

¿Cuáles son los métodos de normalización de datos más comunes utilizados en el aprendizaje automático?

¿Cuáles son buenas técnicas de aumento de datos para un conjunto de datos de imágenes pequeñas?

¿Qué es la ciencia de datos? Estoy interesado en los conceptos de minería de datos ¿Alguien podría sugerir por dónde empezar?

Soy un desarrollador de Java pero quiero hacer un doctorado en ciencia de datos de Canadá. ¿Cuáles son las buenas universidades en Canadá y cuáles son sus requisitos?

¿Cuáles son los mejores recursos para aprender la visualización de datos?

Cómo manejar unos 8 millones de tweets (17 GB) para un paso de preprocesamiento

¿Por qué debería aprender ciencia de datos?

¿Cuál es el criterio de elegibilidad para aprender análisis de big data?

¿Cuál es el mejor instituto de capacitación en ciencia de datos?

Web Analytics