Cómo mejorar sus habilidades de análisis de datos a diario

Estamos rodeados, incluso abrumados por los datos que puede utilizar para practicar sus habilidades de análisis de datos.

En política y economía :

  • Mire el trabajo realizado por DataKind, en gran parte con datos públicos.
  • Mire el Quarterly Journal of Economics y el Journal of Political Economy para ver ejemplos de investigación.
  • Echa un vistazo a la excelente colección FRED de la Reserva Federal de St. Louis.
  • FiveThirtyEight a menudo utiliza datos públicos para su análisis de encuestas y deportes.

¿Qué tipo de preguntas debes responder? En general, trataría de equilibrar el impacto con la viabilidad, por ejemplo:

  • Política: Predecir resultados geopolíticos y medir la creciente influencia económica y política (ver El Proyecto GDELT).
  • Mida la corrupción y su compleja relación con el desarrollo. ¿Necesita medidas de desarrollo? Ver: Unión Europea | Datos

En medicina:

  • Hay datos fascinantes sobre el desempeño del médico y del hospital disponibles aquí: Data.Medicare.gov.
  • Material de los Centros para el Control y la Prevención de Enfermedades
  • Echa un vistazo a Metabase: la base de datos de bases de datos biológicas

¿Qué tipo de preguntas puede hacer con respecto a la medicina? Esto debería ser fácil: ¿cómo influyen la calidad, la ubicación y el gasto del médico y la institución médica en los resultados del paciente? ¿Qué enfermedades, tratamiento y características de las instalaciones están más estrechamente relacionadas con el costo y la gravedad proyectados?

En los negocios :

  • Echa un vistazo a Kaggle, Quandl, Enigma, y ​​si eres estudiante de Wharton Research Data Services.
  • Explore los datos (actualmente) disponibles para el Desafío del conjunto de datos de Yelp.
  • Explore la cobertura de los medios. Muchos medios de comunicación tienen API que puede utilizar, como Times Developer Network – API.
  • Para ver la práctica de ingeniería, puede comenzar con la API de GitHub.
  • Para ver el capital de riesgo, comience con CrunchBase Data Hub.
  • Para ver el crédito al consumidor, comience aquí: datos del Lending Club.
  • Echa un vistazo a la revista Administrative Science Quarterly para inspirarte en la investigación empresarial.

Las preguntas en negocios y economía obviamente se centran en predecir el valor y predecir el cambio. Por ejemplo: Raspe los datos de la propiedad y haga un análisis para predecir el valor de la vivienda. O responda: ¿Cuáles son las tendencias en la producción o el consumo de [X], algún producto que le interese?

Otros temas: El depósito de aprendizaje automático de UCI es popular para desarrollar problemas de práctica.

Creo en la importancia de comprender las técnicas de aprendizaje automático para la práctica del análisis de datos, pero si no está interesado en el campo más amplio de la ciencia de datos, comience por dominar la econometría y la validación cruzada. Realmente entiendo los métodos estadísticos y sus implicaciones.

Bien, entonces estás practicando. ¿Que sigue?

  • ¡Estudia, estudia, estudia! Por ejemplo: ¿Cuáles son las habilidades más valiosas para aprender para un científico de datos ahora?
  • Por supuesto, lee blogs. Aquí está mi último favorito: Algoritmos de transmisión
  • ¡Sigue una interesante investigación de análisis de datos! Puede comenzar explorando autores y presentaciones aquí: NIPS Annual Meeting 2015.
  • Para obtener más información sobre la arquitectura de datos, ocasionalmente llego en persona a eventos como este: NYC Data Engineering.
  • Aprenda múltiples lenguajes de programación y herramientas para ampliar sus habilidades. Vea Code Wars y Seven Languages ​​en Seven Weeks.

El análisis de datos, como aprender un idioma o aprender ingeniería de software, es una odisea. La buena noticia es que puedes hacer un trabajo interesante y valioso mucho antes de lograr el dominio.

Una pregunta muy interesante. Alexander Leeds y Ricardo Vladimiro han dado respuestas completas.

Sin embargo, la aplicación de las técnicas también es fundamental para comprender la ciencia de datos. Sin embargo, aquí están mis pocos puntos, las habilidades pueden no ser necesariamente técnicas.

  • Observación : ¡Sí! Lo escuchaste bien. La observación es muy importante. Digamos que mientras navega por los sitios puede pensar en cómo mejorarlo. Suponga que reservar un boleto de autobús en vuelo, boletos aéreos baratos, hoteles, vacaciones, reserva de paquetes de trenes – Yatra.com o redBus.com es bastante tedioso. ¿Por qué dar entradas en lugar de simplemente decir la siguiente frase al sitio?

“Encuentra un autobús entre las 8 p.m. y las 10 p.m. desde Mumbai a Kolhapur que llega alrededor de las 6 a.m.”

Reduce tantos clics y aumenta la experiencia del usuario. Si observa que se trata de un problema de datos y puede resolverse utilizando un analizador, etc. Simplemente observando los sitios, se dará cuenta de qué problemas existen y qué técnicas de ciencia de datos podrían aplicarse. La observación es una práctica.

  • Charlas / videos: vaya y asista a charlas, mire videos, presente charlas. Esto debería mejorar su capacidad para conectar los puntos. Uno de los principales desafíos en el mundo de los datos es la capacidad de conectar los puntos, es decir, los datos y construir un negocio a partir de ellos.
  • Afina tus habilidades : habilidades de programación, comunicación, nuevas tecnologías, etc. Lo básico es la práctica.

Estos pensamientos emanaron durante el curso de una discusión con Bargava.

En los últimos años, hay un desarrollo importante en tecnologías de todo el mundo donde esto lleva a reducir una gran cantidad de trabajo en los negocios. Por lo tanto, todas las empresas tienen que hacer un esfuerzo adicional en el futuro para mantenerse en la cima de los negocios. Además de mejorar sus productos, también deberán mejorar la experiencia del usuario personalizando los servicios. Además, los clientes son cada vez más exigentes con respecto a la calidad y la compra de mejores productos. Para eso, el análisis ayuda a mejorar el futuro del negocio. Lea este artículo para descubrir las tendencias tecnológicas de su negocio y mejorar sus habilidades de análisis de datos a diario utilizando el método de análisis basado en búsquedas.

Analítica

Entonces, ¿qué es la analítica? ¿Qué haría para su negocio y cómo puede mejorar el análisis de datos ?

La analítica es un campo abarcativo y multidimensional que brinda representación gráfica, estadísticas, modelado predictivo y técnicas de aprendizaje fáciles para encontrar patrones significativos y conocimiento de sus datos.

Hoy, agregamos las computadoras a la mezcla para almacenar cantidades crecientes de datos y ejecutar sofisticados algoritmos de software que producen los conocimientos rápidos necesarios para tomar decisiones basadas en hechos. Al poner en funcionamiento la ciencia de los números, los datos y el descubrimiento analítico, podemos descubrir si lo que pensamos o creemos es realmente cierto. Y producir respuestas a preguntas que nunca pensamos hacer. Ese es el poder de la analítica

Método de análisis de búsqueda

En 2017 se introdujeron muchas tecnologías de análisis de inteligencia empresarial que poseen excelentes análisis para que los ejecutivos y gerentes de negocios mejoren sus negocios y analicen a diario. La analítica se puede definir como el proceso de analizar y dar sentido a la avalancha de datos que se acumula todos los días desde cada punto de contacto posible con el cliente, donde las plataformas de analítica impulsadas por la búsqueda proporcionan un mayor éxito para que las empresas comprendan lo que se necesita y lo que no es una empresa. . busque para descubrir los datos deseados en segundos donde incluso las personas comunes pueden rastrear y analizar fácilmente los datos sin depender de TI. La gente puede rastrear fácilmente el KPI y analizar el negocio de manera eficiente.

¡Me encanta esta pregunta! Entonces esto es lo que hago:

  1. Debería ser obvio: practicar tanto como pueda. Esto no es fácil en una posición de liderazgo de equipo, así que trato de practicar cosas nuevas que involucran nuevos puntos de vista, técnicas y preguntas.
  2. Yo hago MOOCs. Admito que a medida que pasa el tiempo, los MOOC se vuelven menos interesantes porque hay menos pepitas de nuevos conocimientos. Hubo un tiempo en que hice 2 MOOC al mes que tenían al menos 1 mes de duración. Esto es alrededor de 20 horas a la semana de estudio. Hoy en día lo hago en promedio 4 horas a la semana. La razón es menos ejercicios y menos MOOC.
  3. Podcasts Vivo a unos 35 km del trabajo. El mejor de los casos en invierno, 45 minutos de manejo al trabajo y luego otros 45 minutos de regreso a casa. Escucho muchos podcasts sobre ciencia de datos, aprendizaje automático, big data pero también psicología, economía, videojuegos y un par de noticias relacionadas que realmente me gustan.
  4. Tengo una fuente de blogs en los que me meto cada dos semanas. No demasiadas cosas realmente pero interesantes. Principalmente matemáticas, visualización y videojuegos.
  5. Raramente leo algo con lo que me tropiezo. Si aparece algo interesante porque alguien me envió un enlace o aparece en Twitter o Facebook, lo envío a Evernote y en mi revisión semanal los domingos por la noche, los leo.
  6. Mantengo notas de todo lo que hago. Esto no es solo para datos sino todo lo que hice o hice profesionalmente. Custodio mi propio conocimiento constantemente y mantengo notas muy detalladas sobre muchas cosas, desde procedimientos, cursos, técnicas, artículos, documentos, cheatsheets, etc. Guardo todo esto en Evernote. De nuevo, revisión semanal del domingo.
  7. Leer libros. ¡O audiolibros cuando los podcasts no son suficientes! Tiendo a leer negocios, psicología, economía.
  8. Responda las preguntas de Quora. ¡Historia verdadera! Muchas veces me tomo el tiempo de intentar investigar antes de escribir. Es por eso que algunos fines de semana respondo tantas preguntas. Las preguntas de Quora presentan algunas ideas nuevas muy agradables para pensar y, por ejemplo, escribir en mi blog. Los usuarios de Quora y sus preguntas me hacen pensar fuera de la caja.

Por último, pero no menos importante, una cosa que comencé a hacer después de leer un par de libros fue ser escéptico sobre lo que escuché. Noticias, conversaciones con amigos y colegas, etc. Siempre trato de averiguar de dónde provienen los datos, por qué se llegó a una conclusión, etc.

Gran pregunta!

Tres temas clave para mejorar cualquier habilidad en el trabajo:

  1. Amplitud funcional
  2. Profundidad técnica
  3. Capacidades más maduras

Obtener una amplitud funcional en el análisis de datos significa interactuar con los clientes de su análisis y con los equipos de negocios y administración que lo utilizan para tomar decisiones. Interactuar con ellos puede brindarle consejos e ideas específicos sobre qué mejorar y lo que requieren como habilidades y capacidades.

Adquirir profundidad técnica es donde descubrimos más sobre nuestros métodos de análisis y resultados al evaluar los primeros principios sobre los que se pueden construir, o al intentar escribir algunos algoritmos nosotros mismos. Esto significa familiarizarse con las agallas de su algoritmo y ser capaz de mecanizar los algoritmos de aprendizaje o visualización usted mismo.

Ganar más madurez en la capacidad es una combinación de excelencia técnica y funcional. Esto también significa personalizar su oferta como analista y aprender a aprender. Este es un paso necesario para cualquier persona que busque convertirse en líder o mentor de otros en el uso de algoritmos y en lo que están intentando. Naturalmente, esto requiere una comprensión profunda de los aspectos técnicos de los métodos y algoritmos, y también requiere un sentido de la persona y empatía por lo que están tratando de hacer.

¡Espero que esto ayude!

Para mejorar en el análisis de datos, hay algunos pasos simples que puede seguir:

1. Desarrollar antecedentes sólidos: esta es una cosa que realmente diferencia a un buen Científico de Datos de uno malo. El análisis de datos no es un campo separado, por así decirlo, es una intersección de muchos campos como algoritmos, matemáticas aplicadas, estadísticas, herramientas de Big Data. Por lo tanto, un buen historial en estas áreas puede llevarlo al éxito. Con un fondo débil, solo puedes ir tan lejos.

2. Tome algunos buenos cursos: después de adquirir una sólida formación en esas áreas, comience a tomar algunos buenos cursos en línea sobre Análisis de datos. Hoy en día hay muchos buenos cursos disponibles en línea sobre análisis de datos, MOOC y también de universidades.

3. Aplique su conocimiento : esta es la parte más importante para mejorar sus habilidades de análisis de datos. Si eres bueno en matemáticas y razonamiento, sentirás que los cursos y técnicas relacionados con el aprendizaje automático son bastante fáciles, pero una vez que comiences a aplicar estas técnicas a algunos datos del mundo real, sentirás la diferencia. Los datos del mundo real son desordenados y ruidosos. Debe desarrollar la intuición para abordar los problemas del análisis de datos del mundo real. Hay muchas plataformas en línea donde puede encontrar interesantes problemas de análisis de datos para trabajar. O puede realizar una pasantía en alguna empresa de análisis de datos que trabaje en algunos problemas interesantes.

4. Leer, leer y leer: este es el componente más crucial entre todos. El campo de análisis de datos está explotando a una velocidad exponencial. Todos los días se desarrollan nuevas técnicas para resolver algunos problemas de análisis de datos. Debe mantenerse actualizado con las tendencias actuales en esta área, de lo contrario quedará obsoleto. Debería leer buenos blogs en Data Analytics y leer documentos de investigación en esta área.

Gracias por el A2A.

Mejorar diariamente es un poco agresivo en mi opinión. Algunas cosas en el análisis son bastante fáciles y rápidas de entender y comprender, pero mejorar sus habilidades es su capacidad de comprender cuándo esos conceptos pueden adaptarse para adaptarse a su proyecto actual.

Algo que trato de hacer una vez al mes:

  1. Lea libros blancos y blogs de analistas.
  2. Después de leer algo interesante y comprender el concepto, cree un experimento mental (no es necesario que lo escriba pero esté en un lugar donde no lo interrumpan) y aplíquelo a una idea de proyecto.
  3. Cree los datos que se ajusten a su proyecto de pensamiento (mucho más difícil de lo que piensa y no tiene que ser solo dimensiones precisas.
  4. Reproduzca el enfoque sobre el que ha leído.

Entonces esto es muy parecido a la tarea. Crear los datos me ha ayudado mucho a reconocer formatos y dimensiones, por lo que si un proyecto futuro se puede modificar para que coincida con el marco, sé que puedo aplicar ese enfoque y sabré cómo analizarlo.

Sin embargo, no todos los enfoques son la mejor opción. El hecho de que pueda analizarse no significa que alcanzará los objetivos del proyecto.

Espero que esto ayude.

La mayoría ha sido mencionada por otros, pero desde A2A, estas son las 4 actividades principales que me mantienen alerta:

1. trabajo

Espero que no sea demasiado obvio, pero trabajo aproximadamente 8-10 horas por día y la mayor parte de ese tiempo lo paso usando habilidades relevantes. Si bien solo una pequeña parte es ‘pure analytics’ ™ (estadísticas, aprendizaje automático), las otras cosas son igualmente importantes para obtener resultados:

  • Recopilación de requisitos
  • Discusiones
  • Limpieza de datos
  • ETL

Y soy afortunado en el sentido de que mi empleador no se asusta de intentar una vanguardia (sangrienta) cuando se trata de herramientas e infraestructura. Muy amplias oportunidades de aprendizaje en ese frente.

2. Audiolibros

Viajar diariamente es fácilmente de 2.5 a 3 horas de mi día y la única opción sensata es conducir yo mismo. Mientras leo en casa por la noche, me he convertido en un gran fan de Audible. El formato de audiolibro funciona muy bien para libros no técnicos, libros de no ficción.

Si puedo hacer algunas recomendaciones aquí:

  • El punto de inflexión, por Malcolm Gladwell
  • Engañado por la aleatoriedad, por Nassim Nicholas Taleb
  • Pensando rápido y lento, por Daniel Kahneman
  • La señal y el ruido, de Nate Silver

La tendencia general es que aprecio los libros que le advierten contra la aplicación ciega y no crítica de técnicas, sus propios prejuicios y sacar conclusiones precipitadas.

Además de eso, también escucho otras cosas que no son relevantes para esta pregunta. 😉

3. Libros

Parte de lo que leo es muy similar a los audiolibros. Pero ocasionalmente, tengo en mis manos un libro técnico. Estos están destinados principalmente a llenar los vacíos de mi educación unipersonal: series de tiempo, estadísticas bayesianas y transmisión de datos. Estos requieren atención completa (y silencio), lo cual es difícil de conseguir. Lamentablemente, es solo una parte muy pequeña de mi tiempo dedicado.

4. MOOC

Los conocimientos adquiridos de los MOOC disminuyen rápidamente en mi opinión. Si tienes conocimientos básicos sólidos en estadísticas y ML, hay pocas novedades para aprender allí.

Dicho esto, considero que es una forma buena y relajada de prevenir la atrofia de las habilidades: ‘pure analytics’ ™ es solo una pequeña parte del trabajo en la mayoría de los proyectos de análisis. Y en esa pequeña parte, probablemente solo use un pequeño subconjunto de sus conocimientos.

La ayuda de MOOC para mantener al menos los elementos básicos algo vivos, incluso cuando no se usan profesionalmente. Y a veces, tomas un nuevo dato interesante.

También recomendación aquí: encuentro el Machine Learning | Curso de especialización de la Universidad de Washington muy bien hecho. Incluso tuve un par de veces un ¡ajá!

Esos 4 cubren la gran mayoría. Realizo encuentros ocasionales, pero principalmente para mantenerme en contacto con otras personas.

No hago proyectos de mascotas reales. Sin embargo, hago un código desechable rápido para probar cosas nuevas. La mayoría del código que escribo en casa suele ser una extensión de las cosas que hago en el trabajo.

Para usted, el análisis de datos se divide en dos en técnica y método, y consulta. El análisis de datos depende de la hipótesis y analiza el conjunto de datos. Puede ver métricas, como promedios y cálculos. También puede emplear métodos avanzados como algoritmos de aprendizaje. Sin embargo, se necesita trabajo para organizar los datos entrantes en las características exactas. Las características son solo importantes como agregaciones. La configuración más importante y experimental es cómo aplica el análisis de datos. Ya sea que trabaje para su supervisor o para alguien que le pida consejo, necesita la habilidad para comunicar los requisitos y resultados. Necesitas trabajar bien con la gente. Esta es una función de asesoramiento que utiliza una técnica y un método ya buenos. Una buena combinación de ambos debería prepararlo para trabajos reales. Le recomiendo que tome cursos relacionados en la escuela en cualquier programa que use análisis de datos. Debes hacer proyectos en la escuela y postularte a una pasantía. La experiencia laboral real en cualquier empresa, por avanzada que sea, es importante. Te prepara para las habilidades sociales correctas y el rol profesional.

Los objetivos de su plan de aprendizaje podrían alinearse con los objetivos de su carrera. Estoy respondiendo esto desde la perspectiva de alguien que administra todo el negocio, que es un negocio de análisis. Necesito saber a quién contratar para qué roles, así como también necesito tener un buen dominio de las tecnologías que utilizaremos, incorporaremos y crearemos. Mi objetivo es saber leer y escribir en las diversas piezas del rompecabezas, pero no ser yo mismo el que trabaje como científico de datos. Tengo experiencia en matemáticas y ciencias, aunque cuando comencé, tenía poca experiencia en programación. Me sorprendió gratamente lo conceptual que es una programación similar a otras ciencias y continuaré aprendiendo a programar, una vez más para que la alfabetización no desarrolle el producto per se.

El viaje inicial es:

  1. Hable con los clientes sobre los problemas de datos que buscan resolver y aprenda lo que no sabe y lo que está en su lugar para ayudar a resolver sus problemas. Qué tipo de datos, qué tipo de almacenamiento, etc. En nuestro negocio, atención médica y medicina, el procesamiento del lenguaje natural se utiliza para manejar datos no estructurados, por lo que tenía una dirección sobre dónde comenzar mi viaje.
  2. Tome las evaluaciones de “Analytics Edge curso por MIT EdX” para 15.071x: The Analytics Edge de edX | Class Central para la programación de aprendizaje automático en R, que se utiliza en muchos programas comerciales convencionales como paquete estadístico. Puede aprender el contexto de muchas materias principales en ciencia de datos, tales como: Inteligencia Artificial * CART * agrupación * Regresión lineal * Regresión logística * Aprendizaje automático * Análisis predictivo * Modelado predictivo * Bosques aleatorios * Análisis de texto * Árboles * Optimización lineal * Optimización de enteros .

Pasé dos horas al día en esta clase más una noche durante 5 horas por semana durante 10 semanas para terminar las tareas y exámenes semanales. Hay docenas de problemas desafiantes a la semana.

3. MIT también ofrece un certificado en Big Data. Si se inscribe en la clase anterior, le enviarán un aviso para clases adicionales. Programas para profesionales | MIT Educación Profesional

Pasaré la misma cantidad de tiempo en esta clase que estoy tomando ahora.

Planeo tomar la introducción de la clase CS50 de Harvard en línea también disponible en EdX (Tomamos el curso de informática increíblemente popular de Harvard y podemos ver por qué los estudiantes lo aman) para profundizar mi base básica de CS.

Sin embargo, este viaje continuará, incluso con esta modesta inversión, me encuentro construyendo sobre este aprendizaje a diario a través de conversaciones de trabajo, etc. y estoy muy satisfecho con el ROI en términos de tiempo y esfuerzo.

Es posible que no tenga exactamente los mismos objetivos, aunque espero que mi pensamiento pueda ayudarlo con su propio plan de desarrollo.

Jeesh … 11 A2A es mi nuevo récord, aunque probablemente estoy lejos de ser la persona adecuada para responder esto (William Chen lo está, y estoy a punto de hacerlo con A2A) ya que no es mi enfoque principal en el trabajo (aunque espero continuará viendo superposición).

Honestamente, la mayor parte de lo que hago es tomar clases de matemáticas, porque eso funciona para mí. En algún momento seguí encontrándome con cosas que quería entender mejor, y realmente me molestó que no estuviese bien equipado, así que eventualmente dije que lo jodas y comencé a tomar clases de matemáticas aplicadas en línea.

Vale la pena estudiar muchas clases / áreas, no porque lo ayuden directamente , sino que indirectamente lo expondrán a diferentes formas de pensar (por ejemplo, los SVM realmente hicieron esto por mí) y trabajar con datos.

Pero hay muchos recursos no universitarios por ahí … Si no estudiaste ML en la universidad, entonces definitivamente deberías tomar el curso de Machine Learning de Andrew Ng (gratis la última vez que lo revisé). Más allá de eso, hay algunos cursos decentes de Udemy que he seguido.

La otra cosa es tener problemas en el mundo real donde puedes aplicar estas cosas. Eso te hace pensar, probar y buscar nuevos enfoques, y crear herramientas útiles para tus propios fines.

Si trabajas en ciencia de datos, esto es obvio, pero para mí casi siempre es secundario al desarrollo general de software (con un par de excepciones), pero me he equivocado con algunas áreas divertidas diferentes.

Puede ser divertido jugar con algoritmos, aunque después de unos 9 meses de educarme y hacer cosas en papel, lo dejé hasta que obtuve más dinero para hacer cosas reales.

También he descubierto que Fantasy Sports es un desafío increíblemente divertido para el modelado estadístico y similares, si te gusta (además puedes ganar dinero si lo haces bien). Desafortunadamente, no mucho después de que realmente me metí con DFS, los grandes dejaron de apoyar a NY en espera de alguna legislación este otoño, lo que fue una verdadera sorpresa (especialmente después de escribir mucho código para automatizar la recopilación de datos, etc.)

Básicamente, infórmese y aborde los problemas que cree que serían divertidos.

A2A. Para mí, es principalmente práctica. Soy afortunado de que la mayor parte de mi aprendizaje hoy sea sobre negocios, no sobre estadísticas o programación. Ahora que tengo los conceptos básicos (que provienen de la escuela de posgrado, Coursera y en la práctica laboral), mi prioridad es comprender lo que está sucediendo en mi empresa y decidir la mejor manera de usar mi tiempo.

Leo blogs y boletines de ciencia de datos, y sigo a personas interesantes en Twitter para estar al tanto de las nuevas tecnologías y aprender de los demás. Sin embargo, el kit de herramientas que usa para realizar análisis rara vez es su restricción después de comenzar a trabajar y acostumbrarse a su rol.

Esto es similar a otra pregunta que respondí recientemente: la respuesta de Steve Carnagua a ¿Cómo puede un científico de datos mejorar en la discusión de datos?

hay un arte en la ciencia … desafíate a ti mismo con diferentes conjuntos de datos. Las imágenes / videos son MUY diferentes a las variables categóricas 0/1 de Internet. Algunos problemas tienen una subestructura increíble, otros no … el primero requiere métodos más exóticos para transformar señales y trabajar en espacios geométricos no euclidianos donde el segundo se comportará bien, dependiendo de lo que esté haciendo con los métodos de primer / segundo orden.

Para realizar un análisis de datos valiosos, debe tener una breve vista de los datos. Es como adaptar un vestido, y los datos son su material. Los datos de alta calidad le brindan análisis de alta calidad. Pero también debe tener una comprensión del conocimiento del dominio.

Entonces, ¿cómo obtendrá este conocimiento de dominio? Simplemente vaya al área de dominio de donde obtuvo estos datos, observe, haga preguntas, imagine cómo funciona el sistema.

Después de comprender los datos, averigüe qué tipo de estadísticas inferenciales se pueden aplicar a partir de estos datos. Entonces, ¿qué algoritmos de aprendizaje automático se pueden aplicar?

¿Cuál es la posible pregunta (s) de investigación? Trabaja y escribe tus hallazgos.

Personalmente, leo algunos documentos teóricos (sobre minería de datos) y trato de reproducir los experimentos que encuentro en blogs y libros. Miro videos sobre minería de datos en Youtube. Además, me gusta ir a Kaggle. Kaggle es un buen ambiente de aprendizaje para practicar habilidades de minería de datos.

Aprendes haciendo.
El análisis no siempre es un camino feliz. Así que interactúa con tus compañeros de trabajo y forma un grupo de trabajo (otros estudiantes si estás en la escuela), estudia los resultados de los proyectos de cada uno. Mire los resultados, los enfoques y forme algo similar a un club de lectura donde todos traigan libros blancos o blogs, técnicas, etc.
Como isla aprenderás muy poco. Como grupo aprenderán mucho y se desafiarán mutuamente. Si alguien está atascado, póngalo en la pizarra y analice las opciones. Si el resultado es incorrecto, pase por los fracasos.
Aprenda el linaje de datos y los procesos de datos = el ciclo de vida completo de los datos y el impacto que esto puede tener en sus datos. Comprenda que los datos no son perfectos y sepa cómo la calidad de los datos impacta sus resultados.

Tome el curso Andrew Ng sobre “Introducción al aprendizaje automático”. Viene con un conjunto de ejercicios que debes realizar. Esa es una excelente manera de iniciarse en este mundo.

Una vez que haya superado eso, probablemente debería comenzar a participar en competiciones abiertas, pasar tiempo de calidad con los datos e intentar mejorar sus resultados. Participe en los foros y vea lo que el ganador hace de manera diferente que usted no ha hecho. De esa manera, tiene un punto de referencia y comprende los consejos y trucos del oficio. Estar dentro de esa comunidad, tratar de aprender tanto como sea posible.

¡Buena suerte!

Una vez que haya analizado y practicado, querrá trabajar realmente en la profesionalidad de su análisis.

Aquí hay una guía sobre cómo estructurar adecuadamente su análisis y hacerlo profesional:

https://www.linkedin.com/pulse/a

¡Avísame si ayudó!

Hay una muy buena comunidad llamada Analytics Community | Discusiones analíticas | Discusión de Big Data donde puedes encontrar cualquier cosa y todo desde cero. Incluso tienen hackatones y otras competencias que te ayudarán a afinar tus habilidades y también te darán una comprensión holística de cómo se hacen las cosas.

Solo compruébalo y seguro te encantará. Todo lo mejor.

¡Espero que esto ayude!