Cómo hacer que el aprendizaje del análisis de datos y el tema del algoritmo sea más fácil e interesante

Voy a dividir esto en 2 partes:

  1. Análisis de los datos
  2. Algoritmos

Análisis de los datos:

Entonces conoce las definiciones, conoce las herramientas, conoce los algoritmos. O tal vez no. Entonces, ¿cómo resolver esto? La respuesta más efectiva que he podido encontrar: SOLO HAZLA .

  1. Elija un conjunto de datos de su agrado.
    1. caesar0301 / awesome-public-datasetssets
    2. https://www.kaggle.com/datasets
    3. ¡O haz el tuyo! Podrías escribir un script para descargar todas las publicaciones en tu muro o algunas publicaciones de Twitter, ¿qué tienes?
  2. Luego, antes de comenzar a ejecutarlo a través de cada algoritmo de Machine Learning, intente enmarcar 5 preguntas que le gustaría responder con ese conjunto de datos.
  3. Revisa cada pregunta
    1. ¿Qué necesita esta pregunta? ¿Una predicción? Una clasificación?
    2. ¿Cuál sería el más adecuado para este tipo de preguntas, trazado simple, agregación , regresión o incluso modelos generativos?
  4. Organice sus datos de acuerdo a sus necesidades.
    1. Tal vez dividirlo en varios lotes si es demasiado grande
    2. ¿Limpiarlo un poco si es necesario?
      1. Por ejemplo, eliminar todos los píxeles grises y reemplazarlos con píxeles negros aumentó la precisión de un clasificador de imágenes que hice para el conjunto de datos MNIST en casi un 7% .
  5. Que comiencen los programas.
    1. Escriba los programas que necesita para sus preguntas.
    2. Use el idioma que desee. R, Python, Matlab, Java
    3. Prueba diferentes modelos en caso de que el que elijas no funcione tan bien como quieras
  6. Recoge tus resultados.
    1. Esto es importante
    2. Reúna todos los resultados en cualquier forma, parcelas, tablas, sin embargo, los resultados salen
  7. Este es el paso más crítico.
    1. Escriba sus resultados en forma de trabajo de investigación.
    2. Indique su objetivo, las preguntas que intenta responder, qué revelarían potencialmente
    3. ¿Cómo lo hiciste? ¿Qué conjuntos de datos usaste, qué esperas ver?
    4. Repase cada resultado e intente escribir su inferencia del resultado, ¿qué revela ese resultado de los datos que analizó?
      1. Está perfectamente bien si no revela nada, pero no dejes que sea el caso para todos tus resultados, de alguna manera supera el punto
  8. Felicitaciones , acabas de realizar un análisis de datos adecuado. En el camino, terminaste aprendiendo cómo:
    1. Encuentra un conjunto de datos
    2. Crea preguntas para responder usándolo
    3. Modela tus respuestas
    4. Organiza tus datos
    5. Utilice varios modelos estadísticos para esos datos.
    6. Averigua qué modelos funcionan de manera óptima para tus datos
    7. Interpreta tus resultados
    8. Escribe tus resultados

Algoritmos

Cuatro palabras: sin dolor, sin ganancia.

Los algoritmos parecerán desafiantes al principio e incluso después de estudiarlos para ganarse la vida. Son muy interesantes, pero seguro que no van a ser fáciles.

Muy bien, para que conozca el algoritmo, conozca la prueba de corrección, conozca el tiempo de ejecución. ¿Pero tienes la intuición? Dadas 2 situaciones para el mismo problema, ¿podría argumentar qué algoritmo funcionaría mejor?

  1. Una vez que haya entendido un algoritmo, realmente lo haya entendido, analícelo .
    1. ¿Dónde funcionará esto mejor? ¿Para qué entrada reinará este algoritmo como el rey?
    2. ¿Dónde será en su peor momento? ¿Cómo pondrías el algoritmo de rodillas?
    3. Esto suena genérico, pero funciona
  2. Si estás preparado, crea un visualizador
    1. Representar cada paso de una iteración de algoritmos gráficamente
    2. Tal vez incluso ejecute visualizaciones de 2 algoritmos uno al lado del otro para la misma entrada
  3. Este es realmente amplio, pero ciertamente hace las cosas interesantes.
    1. Busca problemas a tu alrededor, ¿cómo los resolverías?
    2. Aquí hay una instancia de mi vida:
    3. Vivía en un departamento alquilado en Massachusetts. El techo del apartamento estaba equipado con múltiples paneles solares. Había muchos huecos sin llenar en y entre los múltiples paneles. Los paneles eran de diferentes tamaños y eficiencia en términos de producción de electricidad.

      E t voilà, tenemos un problema que resolver. Dada una superficie de dimensiones L • B y K diferentes paneles solares, cada uno de dimensión [matemática] P_i • Q_i [/ ​​matemática] i de 1 a K , y cada uno con eficiencia [matemática] E_i [/ ​​matemática] ¿cómo organizaría los paneles solares de modo que se maximice la cantidad de electricidad producida y se minimice el espacio no utilizado en el techo.

  4. Quizás esto también pueda ser de alguna ayuda. ¿De dónde puedo aprender algoritmos practicando problemas?

Pero aquí hay algo crítico. Haz lo que te interese. Si esto no es interesante para usted, ¿por qué? ¿Es porque el tema en sí no te atrae o tal vez es por un mal maestro? Odiaba la física, pero luego encontré a Walter Lewin.

Entonces, si no es interesante por falta de interés en el tema, recomiendo darle una buena oportunidad (es una habilidad bastante buena), pero encontrar algo que realmente te interese.

Si es por un mal maestro, Internet es tu mejor amigo. Hay una gran cantidad de cursos sobre Algoritmos y Ciencia de Datos de universidades como Stanford, MIT, UC Berekely, University of Washington, UCSD . Utiliza esos recursos y contempla la gloria.

¡Buena suerte!

Escriba los programas para cada algo que aprenda y ejecútelos para ver resultados diferentes. Mantenga un registro de su tiempo de ejecución también. Evaluar el algo de los tiempos de ejecución en términos de tiempo y complejidad espacial.

More Interesting

¿Puedo comenzar a aprender ciencia de datos y big data a los 34 años o es demasiado tarde?

¿Cuál es su opinión sobre el curso de ciencia de datos de la Asamblea General?

¿Cuál es su definición personal para big data?

¿Los estadísticos viven en la tierra de la teoría, los aprendices de máquinas crean las soluciones prácticas y los científicos de datos son los que se ensucian las manos? Por supuesto, hay quienes viven en más de uno de estos mundos.

¿Qué papel juegan las estadísticas en la ciencia de datos en comparación con habilidades como programación o visualización y comunicación?

¿Cómo se pueden aplicar los grandes datos a los pronósticos económicos?

¿Qué empresas serían consideradas estrellas en ascenso con Big Data?

¿Es posible la carrera en ciencia de datos sin codificación o muy poca codificación?

¿Cómo se toman los estados de Facebook o Tweets, que están escritos en un idioma mixto, en el análisis de sentimientos?

¿Cuál es la mejor manera de crear una extensión simple de Chrome que almacene una base de datos y revele los resultados relevantes cuando se busca?

Cómo hacer aplicaciones basadas en un modelo basado en datos que toma datos de entrada y muestra predicciones de algo en particular

¿Alguien ha pasado por Springboard y Udacity analista de datos / programas de ciencia? Estoy buscando garantías de empleo e información de contenido educativo.

Estoy interesado en aprender ciencia de datos, aprendizaje automático y lenguaje R. ¿Cómo debo comenzar para cualquiera de estos cursos?

¿Cómo definimos objetivos y resultados clave (OKR) para el equipo de ciencia de datos?

¿Cuáles son los beneficios de la remodelación de datos?