¿Necesito conocer algoritmos de aprendizaje automático para asegurar un trabajo como analista de datos?

Desde cero? Muy raramente

A menos que esté creando un algoritmo completamente nuevo por sí mismo, por lo general ya hay buenas implementaciones de biblioteca disponibles y son precisas, precisas y optimizadas.

Sin embargo, creo que implementar algoritmos de aprendizaje automático desde cero es un ejercicio muy útil, ya que obtendrá una mejor comprensión de cómo funcionan realmente los algoritmos. Leer sobre ellos es una cosa, pero codificar cada pequeño detalle es algo completamente diferente.

de sklearn import svm
clf = svm.SVC
clf.fit (x, y)

Estas tres líneas de código encajarán en un clasificador SVM (Support Vector Machine) en los datos. La cantidad de tiempo se ahorra usando esto en lugar de codificar SVM completo. Y recuerde que la precisión sería mucho mayor.

Lee esto.

La respuesta de Akashdeep Jassal a ¿Implementó algoritmos de aprendizaje automático desde cero con el propósito de aprender?

AlgoritmosAnálisis de datosAprendizaje automáticoCiencia de datosdatosMinería de

¿Se puede estafar el algoritmo de Zoopla para inflar el precio de una propiedad?

¿Cómo se desarrollaron los algoritmos cuánticos?

¿Alguien podrá escribir un algoritmo que pueda hacer dinero en el mercado durante un período de 20 años?

¿Cuáles son las diferencias entre las estructuras de datos y los algoritmos?

Si clasifica todos los pesos de una red neuronal entrenada en orden ascendente, ¿cómo se vería la curva de los datos ordenados?

¿Cuántas veces debo repetir 1 palabra clave en el contenido de un sitio web para obtener un alto rango?

¡Por supuesto que sí! ¿Cómo se llamará analista de datos si no conoce los algoritmos de análisis de datos? El aprendizaje automático es parte del análisis de datos, eso es lo que usa para crear esos modelos. Sin ML, solo está haciendo estadísticas básicas, tablas dinámicas y gráficos de barras y eso no es exactamente ciencia de datos.

Dedique tiempo a aprender cómo funcionan en detalle cada uno de los algoritmos de ML más populares y en qué tipo de casos de uso se aplican. A continuación, querrá saber cómo usar los parámetros de control de cada uno de esos algoritmos dado un determinado caso de uso / problema

Alket Cecaj

Bueno, eso depende.

Realmente no existe una definición definitiva de un analista de datos, por lo que depende de la descripción del trabajo de la empresa específica.

He visto algunas publicaciones de trabajo para analistas de datos cuando realmente buscan más de un científico de datos, ingeniero de datos, ingeniero de aprendizaje automático, etc. Estas publicaciones de trabajo más avanzadas a veces requieren una experiencia significativa en R, Python, Hadoop, Machine Learning, y más. Por otro lado, también he visto ofertas de trabajo para un analista de datos que solo requiere algo de experiencia en Microsoft Excel y conocimientos estadísticos básicos.

Entonces la respuesta no es un sí o un no estricto, es tal vez. Depende de la definición de la compañía de un analista de datos. En su mayor parte, diría que, como analista de datos, no necesita saber nada demasiado avanzado en lo que respecta al aprendizaje automático. Para la mayoría de los puestos de analista de datos, probablemente necesite algo de experiencia con R / Python, SQL, un título en un campo STEM y tal vez algo de experiencia con regresión lineal / logística.

El aprendizaje automático normalmente se deja para los científicos de datos y las posiciones cuantitativas más avanzadas.

Colleen Farrelly

No.

Hay una gran parte de la minería de datos que no se trata de aprendizaje automático. Principalmente tiene que ver con modelar e inferir información útil de los datos mediante la aplicación de estadísticas descriptivas, estadísticas inferenciales y visualización de datos.

Sin embargo, aprender Machine Learning le dará la oportunidad de obtener un mejor trabajo.

Colleen Farrelly

No, la gente de BI generalmente no los usa. Es más informes (SQL) y estadísticas básicas.

Akashdeep Jassal

More Interesting

¿Cuál es un buen enfoque de aprendizaje automático para recomendar noticias basadas en el historial de lectura de un usuario?

¿Qué otros algoritmos de clasificación utilizan la estrategia 'Divide y vencerás' además de la clasificación rápida y la combinación?

¿Las compañías aéreas han mejorado la eficiencia de sus algoritmos de sobreventa?

La mayoría de las definiciones / teoremas / ejemplos de privacidad diferencial que he encontrado son para consultas que devuelven un solo número por columna, como un promedio. ¿Existen mecanismos diferencialmente privados para otros tipos de consultas, como los que subconjustan filas en función de algún criterio?

Cómo resolver esto usando programación dinámica

Cómo calcular óptimamente grandes factoriales de orden 10 ^ 5 para operaciones repetidas (por ejemplo, encontrar permutaciones)

Recientemente llegué a un llamado indicador de opciones binarias del sitio web 'www.investoo.com' que afirma una tasa de éxito del 83% al predecir el resultado de las opciones binarias. ¿Es una estafa?