¿Cómo se introdujo por primera vez en Machine Learning / Data Science?

Hablando en verdad, aprendí (o me enseñaron) Machine Learning mucho antes de darme cuenta de lo que realmente era capaz y el papel de los datos en Machine Learning.

Nunca he oído hablar de eso en mi vida de estudiante. Hice mi licenciatura en Ingeniería Electrónica. Luego, para perseguir Maestros, me mudé al Instituto Indio de Tecnología, Kharagpur . Mi especialización de maestría se centró en el procesamiento de imágenes y la visión por computadora en lugar de la electrónica central. Estoy inmensamente en deuda con mi alma mater por abrirme un mundo completamente nuevo de ciencia computacional.

Es aquí donde aprendí sobre el maravilloso mundo de la informática y cómo se puede usar en cualquier campo como una herramienta poderosa para lograr nuestro objetivo.

En mi curso de maestría tomé dos asignaturas llamadas Reconocimiento de patrones y comprensión de imágenes y análisis de imágenes médicas . Mientras estudiaba estas materias no estaba realmente atento en clase. Escuché los términos Machine Learning e IA, pero nunca pude evaluar sus capacidades.

Realmente lo entendí cuando mi asesor, el Dr. Debashis Sen, me asignó mi proyecto de Maestría. No puedo discutir el proyecto en detalle aquí. Pero se basó en datos de seguimiento del ojo humano y su análisis para alcanzar un objetivo particular. Ahora, el trabajo era nuevo. No había documentación adecuada para seguir y no tenía experiencia previa en el aprendizaje automático y el trabajo con grandes conjuntos de datos.

Busqué en Google vorazmente. Estaba planeando hacerlo en MATLAB primero, pero luego lo abandoné por razones obvias como licencia, problemas de versión, no hay suficiente material. Recogí Python muy rápido. Una cosa sobre Python era que era liviano y podía ejecutarse incluso en el navegador. Había paquetes disponibles para cada maldita cosa.

Encontré un canal en Youtube llamado sentdex . Este chico fue asombroso. Enseñó ciencia de datos y aprendizaje automático desde cero a través de tutoriales de codificación en vivo. Ese fue mi punto de partida. Aparte de ese stackoverflow siempre fue útil cada vez que me atascaba en cualquier problema. Terminé mi proyecto y obtuve resultados sustancialmente buenos. Tanto mi asesor como yo estábamos felices de que nuestra nueva empresa fuera más o menos exitosa.

Esta es mi historia. Nunca aprendes a menos que te aplasten en una fecha límite, ya sea real o virtual. El internet es tu amigo. Úsalo con sabiduría.

Buena suerte.

Si te gusta mi respuesta, por favor vota y sígueme para obtener respuestas similares.

Aprendizaje automáticoCiencia de datosdatosMinería de

¿En qué debería concentrarme después de aprender el aprendizaje automático si no estoy interesado en el aprendizaje profundo?

¿Cuáles son algunos buenos libros / recursos para que un principiante obtenga una buena introducción al aprendizaje automático?

¿Qué podríamos hacer con Asimo si la computadora dentro estuviera con el poder de la caja de aprendizaje profundo Nvidia DGX-1?

¿Hay algún lugar en la ciencia donde la biblioteca estadística de Python sea pobre o inmadura en comparación con R?

Cómo lidiar con una variable independiente categórica que tiene más de 500 variables en un problema de clasificación

¿Es cierto que las unidades de estado sólido no son confiables? ¿Puedes perder todos tus archivos sin previo aviso?

Tenía un poco de experiencia en análisis predictivo dentro del dominio biomédico. Sugeriría los siguientes pasos para cualquiera que esté buscando ingresar al dominio de Machine Learning / Data Science.

1. Adquirir fuertes habilidades técnicas

Excelente comprensión de las técnicas y algoritmos de aprendizaje automático , como k-NN, Naive Bayes, SVM, Decision Forests, etc.
Experiencia con kits de herramientas comunes de ciencia de datos , como R, Python, Weka, NumPy, MatLab, etc.
Experiencia con herramientas de visualización de datos , como D3.js, GGplot, etc.
Competencia en el uso de lenguajes de consulta como SQL, Hive, Pig
Experiencia con bases de datos NoSQL , como MongoDB, Cassandra, HBase
Excelentes habilidades de estadística aplicada , como distribuciones, pruebas estadísticas, regresión, etc.

2. Reúna la experiencia del mundo real

El 18% de los científicos de datos llegaron a la cima de la escala de ciencia de datos después de completar una pasantía. Por lo tanto, si tiene una maestría, es una buena idea buscar una pasantía en el campo, en lugar de buscar un doctorado. inmediatamente.

En el mundo real, sería raro obtener un empleo como científico de datos, justo después de la universidad. La mayoría de las personas comienzan como analistas (analista de datos, analista de BI, analista de negocios incluido), académicos, pasantes, especialistas en TI, ingenieros de software y consultores. Solo el 2% de la gente consiguió su primer trabajo como científico de datos. También puede trabajar en un proyecto en su tiempo libre y mostrar la visualización de datos en LinkedIn y otras plataformas de redes sociales. Eso ayudará a su marca personal.

3. Toma clases en línea y prepárate

He estado abogando por tomar cursos en línea durante mucho tiempo. Lo he estado haciendo yo también, y hay un claro beneficio. Para obtener un trabajo de científico de datos, e incluso para obtener la admisión para un programa de MS Data Science, la preparación personal es muy importante.

4. Trabaja en tus habilidades blandas

Por supuesto, la ciencia de datos se trata de Matemáticas, Programación y Tecnología. Pero, en el lugar de trabajo actual basado en datos, las habilidades blandas como excelentes habilidades de comunicación, curiosidad intelectual, creatividad, inteligencia cultural, inteligencia emocional y una gran perspicacia comercial son igualmente importantes.

5. Pase tiempo en la preparación de la entrevista

No ignores la preparación de la entrevista. Independientemente de sus calificaciones y destreza técnica, un entrevistador puede confundirlo con una serie de preguntas que no esperaba. Para una entrevista de ciencia de datos, un entrevistador hará preguntas que abarcan una amplia gama de temas, que requieren un sólido conocimiento técnico, la capacidad de manejar la presión, la capacidad de pensar fuera de la caja y las habilidades de comunicación. Sus estadísticas, conocimiento de la industria, programación y habilidades de modelado de datos se pondrán a prueba a través de una variedad de preguntas y estilos de preguntas, diseñados intencionalmente para mantenerlo en pie y obligarlo a demostrar cómo opera bajo presión. La preparación es una clave importante para el éxito cuando busca un trabajo de científico de datos. Aquí hay una lista curada de preguntas de entrevistas de ciencia de datos.

También puedes echar un vistazo a las siguientes publicaciones de blog:

Cómo obtener trabajos de ciencia de datos y aprendizaje automático / IA »Wiki Ùtil Cómo convertirse en un científico de datos

Trabajos de ciencia de datos en India: roles y responsabilidades, habilidades y experiencia requeridas, principales industrias, cursos y capacitación y las mejores empresas para trabajar

MBA vs MS Business Analytics vs MS Data Science – Consejos para elegir el programa correcto

¡Espero que esto ayude!

Tanmoy Ray

Recientemente me gradué del programa de MBA en NYU ( NO el programa que recomiendo si estás tratando de ciencia de datos, tuve mucha suerte ) con una oferta para unirme al equipo de ciencia de datos en un banco de EE. UU., Que he aceptado.

Durante mi MBA, asistí a un “Data Hackathon” en Cornell Tech y me hice amigo de todos los científicos de datos que estaban allí como mentores de la empresa patrocinadora. Uno de ellos me invitó a visitar la oficina y conocer al resto del equipo. Terminé teniendo una entrevista con ellos, lo cual fue exitoso.

Mi experiencia previa en programación, mi interés en las estadísticas y la probabilidad, y el trabajo en proyectos académicos en el comercio sistemático fueron vistos favorablemente. Hice una pasantía de verano en una startup FinTech que involucró algunas disputas y modelado de datos en Python, esto también fue una gran ventaja (tal vez más porque la compañía a la que me estoy uniendo está en un dominio similar).

Tuve un total de 8 rondas de entrevistas (6 de ellas en un día) y me pusieron a prueba en codificación, estadísticas, estudios de casos de minería de datos y análisis de casos de negocios. Esta compañía tiene un gran equipo de ciencia de datos con algunos candidatos MIS y MBA, mientras que la mayoría de las compañías tienen equipos más pequeños compuestos por doctorados y postdoctorados.

Fue un proceso bastante difícil, pero disfruté mucho las rondas técnicas y los casos y estoy emocionado de ver cómo es realmente el trabajo.

Ajay Mishra

Estaba en un programa de doctorado / doctorado y había estado haciendo mis rotaciones de investigación en estadística (era estudiante de estadística durante ~ 4 años antes de eso). Uno de los seminarios a los que asistí fue sobre aplicaciones de aprendizaje automático en medicina. Dejé el MD aproximadamente un mes después y pasé el resto de ese semestre aprendiendo algoritmos de ML utilizados en epidemiología genética (artículo de graduación aquí: https://www.slideshare.net/Colle …).

Hice mi trabajo de posgrado en estadística, con mi enfoque de investigación en el aprendizaje automático (también un poco de topología), consulte https://www.slideshare.net/Colle … Mientras estaba en la escuela, consulté a tiempo parcial como parte de mi título, por lo que adquirí experiencia en una variedad de aplicaciones de aprendizaje automático y ciencia de datos en medicina y ciencias sociales.

He estado en puestos de ciencia de datos desde que me gradué.

Souvik Chakraborty

Para conseguir un trabajo o una pasantía, priorizaría el conocimiento práctico del candidato y los proyectos paralelos que desarrolló por su cuenta. Esto muestra el afán de aprender y la autogestión del candidato que una certificación puede no generar. Una calificación de posgrado puede ayudarlo en el proceso de negociación una vez que sea seleccionado en comparación con otros con solo títulos de graduación. Aunque, como mencioné, su selección se basará principalmente en cómo habla a través de su exposición práctica en proyectos de análisis de datos.
Hay toneladas de proyectos por ahí, pero requerirá que alguien conozca al menos R / python para intentarlo y ponerlo como parte de su cartera.
Si tiene alguna consulta, envíeme un mensaje con su perfil.
Gracias

Tanmoy Ray

Genial, soy igual aquí, pero no estoy haciendo nada.

Bueno, si no tiene idea de ningún lenguaje de programación como Python y R, primero debe aprenderlo para comprender el lenguaje, puede aprenderlo de Codecademy: aprender a codificar, interactivamente, de forma gratuita, esto es solo un curso de un día, Puedes hacerlo todo en un solo día. Y después de esa visita siraj raval, enseña en videos en vivo (Siraj Raval) sobre Deepnet, tensorflow, machine learning. Por cierto, él le dirá cómo escribir códigos en su máquina y otras cosas como configurar tensorflow (para eso: ¡vaya a Descargar Anaconda ahora! Para descargar anaconda, porque le dan muchas cosas, luego vaya a TensorFlow a cómo configurar)

Y después de unas horas si todavía no tienes idea de lo que estoy haciendo, revisa algunas conferencias en YouTube de Geoffery hinton y Andrew ng.

Moideen Kalladi

No nos ha contado sobre sus antecedentes / edad / carrera, etc. Sin embargo, lea el libro Algoritmo de matriz de Pedro Domingos y vea si le gusta. Después de eso tienes una clase de Andrew NG.

Moideen Kalladi

More Interesting

¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?

Para un puesto de ciencia de datos, ¿por qué las empresas hacen preguntas sobre la estructura de datos?

¿Crees que los algoritmos de aprendizaje automático pueden cambiar la forma en que hacemos simulaciones numéricas?

¿Qué es la agrupación?

En la regresión logística multinomial, ¿por qué el valor p en la prueba de razón de probabilidad es significativo pero en las estimaciones de parámetros no es significativo para cada dimensión?

¿Sigue siendo el curso de aprendizaje automático de Andrew Ng el mejor curso de aprendizaje automático disponible?

¿Cómo se puede hacer la experimentación de aprendizaje profundo en una PC en casa?

Como el sistema de recomendación está relacionado con el aprendizaje automático, ¿cuál será la próxima moda en los sistemas de recomendación?

¿Cuáles son los tipos de máquina?

¿Qué enfoques utilizas para vectorizar funciones en Matlab?