Voy a dividir esto en 2 partes:
- Análisis de los datos
- Algoritmos
Análisis de los datos:
Entonces conoce las definiciones, conoce las herramientas, conoce los algoritmos. O tal vez no. Entonces, ¿cómo resolver esto? La respuesta más efectiva que he podido encontrar: SOLO HAZLA .
- ¿Cuáles son los mejores libros sobre estadísticas para la ciencia de datos?
- ¿Cuál es la diferencia entre procesamiento de datos y análisis de datos?
- Seguridad de la información o ciencia de datos, ¿cuál elegir?
- ¿Cuáles son las aplicaciones de los procesos estocásticos, particularmente en ciencia de datos y aprendizaje automático?
- ¿Cuáles son las desventajas comunes de tener un conjunto de datos dispersos al crear un modelo ML?
- Elija un conjunto de datos de su agrado.
- caesar0301 / awesome-public-datasetssets
- https://www.kaggle.com/datasets
- ¡O haz el tuyo! Podrías escribir un script para descargar todas las publicaciones en tu muro o algunas publicaciones de Twitter, ¿qué tienes?
- Luego, antes de comenzar a ejecutarlo a través de cada algoritmo de Machine Learning, intente enmarcar 5 preguntas que le gustaría responder con ese conjunto de datos.
- Revisa cada pregunta
- ¿Qué necesita esta pregunta? ¿Una predicción? Una clasificación?
- ¿Cuál sería el más adecuado para este tipo de preguntas, trazado simple, agregación , regresión o incluso modelos generativos?
- Organice sus datos de acuerdo a sus necesidades.
- Tal vez dividirlo en varios lotes si es demasiado grande
- ¿Limpiarlo un poco si es necesario?
- Por ejemplo, eliminar todos los píxeles grises y reemplazarlos con píxeles negros aumentó la precisión de un clasificador de imágenes que hice para el conjunto de datos MNIST en casi un 7% .
- Que comiencen los programas.
- Escriba los programas que necesita para sus preguntas.
- Use el idioma que desee. R, Python, Matlab, Java
- Prueba diferentes modelos en caso de que el que elijas no funcione tan bien como quieras
- Recoge tus resultados.
- Esto es importante
- Reúna todos los resultados en cualquier forma, parcelas, tablas, sin embargo, los resultados salen
- Este es el paso más crítico.
- Escriba sus resultados en forma de trabajo de investigación.
- Indique su objetivo, las preguntas que intenta responder, qué revelarían potencialmente
- ¿Cómo lo hiciste? ¿Qué conjuntos de datos usaste, qué esperas ver?
- Repase cada resultado e intente escribir su inferencia del resultado, ¿qué revela ese resultado de los datos que analizó?
- Está perfectamente bien si no revela nada, pero no dejes que sea el caso para todos tus resultados, de alguna manera supera el punto
- Felicitaciones , acabas de realizar un análisis de datos adecuado. En el camino, terminaste aprendiendo cómo:
- Encuentra un conjunto de datos
- Crea preguntas para responder usándolo
- Modela tus respuestas
- Organiza tus datos
- Utilice varios modelos estadísticos para esos datos.
- Averigua qué modelos funcionan de manera óptima para tus datos
- Interpreta tus resultados
- Escribe tus resultados
Algoritmos
Cuatro palabras: sin dolor, sin ganancia.
Los algoritmos parecerán desafiantes al principio e incluso después de estudiarlos para ganarse la vida. Son muy interesantes, pero seguro que no van a ser fáciles.
Muy bien, para que conozca el algoritmo, conozca la prueba de corrección, conozca el tiempo de ejecución. ¿Pero tienes la intuición? Dadas 2 situaciones para el mismo problema, ¿podría argumentar qué algoritmo funcionaría mejor?
- Una vez que haya entendido un algoritmo, realmente lo haya entendido, analícelo .
- ¿Dónde funcionará esto mejor? ¿Para qué entrada reinará este algoritmo como el rey?
- ¿Dónde será en su peor momento? ¿Cómo pondrías el algoritmo de rodillas?
- Esto suena genérico, pero funciona
- Si estás preparado, crea un visualizador
- Representar cada paso de una iteración de algoritmos gráficamente
- Tal vez incluso ejecute visualizaciones de 2 algoritmos uno al lado del otro para la misma entrada
- Este es realmente amplio, pero ciertamente hace las cosas interesantes.
- Busca problemas a tu alrededor, ¿cómo los resolverías?
- Aquí hay una instancia de mi vida:
- Vivía en un departamento alquilado en Massachusetts. El techo del apartamento estaba equipado con múltiples paneles solares. Había muchos huecos sin llenar en y entre los múltiples paneles. Los paneles eran de diferentes tamaños y eficiencia en términos de producción de electricidad.
E t voilà, tenemos un problema que resolver. Dada una superficie de dimensiones L • B y K diferentes paneles solares, cada uno de dimensión [matemática] P_i • Q_i [/ matemática] i de 1 a K , y cada uno con eficiencia [matemática] E_i [/ matemática] ¿cómo organizaría los paneles solares de modo que se maximice la cantidad de electricidad producida y se minimice el espacio no utilizado en el techo.
- Quizás esto también pueda ser de alguna ayuda. ¿De dónde puedo aprender algoritmos practicando problemas?
Pero aquí hay algo crítico. Haz lo que te interese. Si esto no es interesante para usted, ¿por qué? ¿Es porque el tema en sí no te atrae o tal vez es por un mal maestro? Odiaba la física, pero luego encontré a Walter Lewin.
Entonces, si no es interesante por falta de interés en el tema, recomiendo darle una buena oportunidad (es una habilidad bastante buena), pero encontrar algo que realmente te interese.
Si es por un mal maestro, Internet es tu mejor amigo. Hay una gran cantidad de cursos sobre Algoritmos y Ciencia de Datos de universidades como Stanford, MIT, UC Berekely, University of Washington, UCSD . Utiliza esos recursos y contempla la gloria.
¡Buena suerte!