¿Cómo y cuándo comenzaste con Kaggle?

Lo mejor de Kaggle es que tiene algo para todos. Para alguien que recién comienza, tiene las competencias de iniciación, por el tipo curioso que organiza competencias de investigación sobre una amplia variedad de temas que varían desde sistemas de recomendación hasta neurociencia computacional, y para profesionales experimentados existen las competencias maestras de entrada privada.

Si está buscando comenzar y tiene cero experiencia trabajando con datos, Titanic: Machine Learning from Disaster sería un lugar ideal para calentarse. La competencia es simple, fácil de entender y presenta una serie de tutoriales para ayudar a los participantes.

Por ejemplo, mire el siguiente enlace: http://www.kaggle.com/c/titanic-…
Este es un tutorial muy bien escrito para comenzar con R y el aprendizaje automático. Comienza desde lo básico y te lleva a Bosques Aleatorios.

En caso de que quieras comenzar con Python, mira este tutorial: http://www.kaggle.com/c/titanic-…

Una vez que obtenga un poco de impulso, vale la pena pasar un tiempo leyendo sobre las soluciones de las competiciones anteriores, que se pueden encontrar aquí:
Soluciones pasadas | Kaggle

He sido un entusiasta de Kaggle durante algún tiempo y me doy cuenta de que aprendes mucho leyendo los foros y las publicaciones de blog de otros competidores. Kaggle promueve una cultura muy colaborativa, aunque prospera en la competencia. Encontrará que, en muchos casos, las personas cargan su código fuente en el medio del concurso, elevando así el listón de otras soluciones.

Comencé ‘Kaggling’ hace tres años cuando era un novato en el campo del aprendizaje automático / ciencia de datos.

Estaba usando más técnicas de modelado estadístico en mi trabajo en ese momento. También estaba haciendo algunos cursos MOOC para mejorar mi conocimiento en este campo y aprendí muchos conceptos nuevos de ellos. Pero no pude usar todos esos conceptos de aprendizaje automático en aplicaciones comerciales de la vida real. Así que estaba buscando un lugar donde pudiera usar todas esas habilidades y perfeccionarlas. Fue entonces cuando me topé con Kaggle y comencé a participar en las competiciones.

No hace falta decir que me ayudó mucho en los últimos tres años a mejorar mis habilidades de aprendizaje automático.

Hace 1 mes. (Aparentemente)

Yo y dos de mis amigos queríamos comenzar a resolver problemas reales de ciencia de datos.

Somos estudiantes de pregrado y hemos estado tomando varios cursos de coursera, edx, udacity, youtube y otros.

Hemos estado haciendo proyectos académicos de ciencia de datos / ML.

entonces comenzamos a seguir blogs de ciencia de datos.

Pero como estábamos interesados, pensamos darle una oportunidad a Kaggle.

Comenzamos con el problema del Titanic y pasamos a resolver la Predicción de Crímenes de San Francisco, la selección de Kobe Bryant Shot.

Las cosas que me gustan de kaggle son: en primer lugar, la increíble sección de tutoriales para principiantes y, en segundo lugar, el foro de discusión donde puede conversar con los mejores kagglers sobre algún problema específico.

No estamos cerca de la cima de la clasificación. pero estamos mejorando y aprendiendo cosas nuevas todos los días.

Para los estudiantes subestimados es algo difícil conseguir un trabajo en el campo de la ciencia de datos.

pero tener un buen perfil de kaggle seguramente puede darte un borde superior.

Empecé hace aproximadamente un año, y estaba muy ocupado al principio. Usé R como mi herramienta principal y básicamente estaba usando Kaggle para aprender R, mientras que al mismo tiempo usaba R para competir en Kaggle. Solo hice algunas competiciones oficialmente, pero también jugué con muchos datos para probar mis propios experimentos, algunos de los cuales nunca ingresé oficialmente. La razón principal por la que no he estado activo últimamente es que lleva mucho tiempo, es muy adictivo, la competencia es intensa. En muchos casos, si no trabaja en un equipo (siempre fui individual), debe aprender un dominio de conocimiento con el que no está familiarizado. Esto podría ser tan poco como leer una página web, o tanto como leer volúmenes enteros de libros. Para el problema de Travelling Santa, que era uno de mis favoritos, utilicé muy pocas herramientas externas e implementé mis propias versiones de varios algoritmos heurísticos. Kaggle me ayudó a entender que no hay nada que disfrute hacer más que resolver problemas relacionados con datos.

La analítica es un nuevo campo que llama la atención día a día. Me uní a kaggle para examinar mi conocimiento y habilidad. Es muy bueno aprender y practicar. Comencé con ‘Titanic: Machine Learning from Disaster’ usando SAS. Hice lo que sea para mejorar mi precisión. Es tan divertido como aprender. Obtuve ideas de foros o tutoriales en línea, no particularmente en SAS.

Ahora los días ‘R’ y ‘Python’ se están volviendo populares. También empiezo a aprender ‘R’, en kaggle la mayoría de los usuarios / kagglers están usando ‘R’ o ‘Python’. Hay varios ‘MOOC’ de estos ‘R’, ‘Python’ y ‘Machine Learning / Data Analytics’.

edX, Coursera – Cursos en línea gratuitos de las mejores universidades | Coursera, DataCamp: la manera fácil de aprender R & Data Science en línea, Udacity – Clases en línea gratuitas y Nanodegrees, udmey Resources and Information., Aprenda haciendo | Code School, etc., que proporciona MOOC relacionados con análisis / aprendizaje automático / R / Python.

Hace 9 meses, estaba buscando y aprendiendo cosas sobre ciencia de datos. Era totalmente nuevo en el campo de la ciencia de datos. Revisé algunos sitios web y encontré cuáles son sus habilidades clave y algunos consejos para principiantes.

Luego descubrí que kaggle es un muy buen lugar para comenzar para los principiantes que desean tener una carrera en el campo de la ciencia de datos. Al principio, todo era muy confuso para mí. Vi que la mayoría de la competencia requería Python en lenguaje R, y en ese momento estaba bastante familiarizado con Python y no tenía conocimiento de R. Luego, tardé de 3 a 4 meses en comenzar a aprender R y tomé algunos cursos en línea para Python.

Luego tomé la máquina Titanic aprendiendo del desastre. Hice mi primera presentación y luego mejoré mi puntaje. Todavía tengo que aprender muchos temas en los que no soy bueno en este momento.

He estado participando activamente en Kaggle desde marzo de 2017.

Antes de eso, participé en una competencia en clase del curso de Modelado predictivo aplicado, el titánico para aprender lo básico y otro sobre los animales de refugio después de terminar el componente de aprendizaje supervisado en el MLND de Udacity.

Sin embargo, hasta ahora he trabajado más en la pista de núcleos y en el análisis y visualización de datos exploratorios en lugar de la pista de competencias. Sin embargo, tengo 3 medallas de bronce en la pista de los núcleos, 2 más para ser un maestro. Mi culminación de Udacity también fue una competencia de kaggle en la clasificación de imágenes, pero no lo hacía de manera competitiva, sino que usé el conjunto de datos para terminar la culminación.

Espero ser más regular a partir de 2018 y centrarme más en el lado del modelaje para mejorar en las competiciones. Pero incluso entonces no soy realmente un kaggle por el bien de la persona. Me gusta la comunidad y me gustaría mejorar, pero no puedo garantizar que sea un usuario súper activo o que esté más integrado en la comunidad.

¡Roberto Medri me presentó el sitio cuando estaba haciendo una pasantía en Etsy en el verano de 2012!

Nunca superé la barrera de competir realmente hasta que hice mi primera competencia en vivo con Ye Zhao en Hack / Reduce cerca del MIT. Eso fue en mayo de 2013.

Te sugiero que comiences con Data Science en Coursera. No lo he probado, pero parece un curso bastante bueno y extenso.

También puede probar la Introducción a la ciencia de datos o el Análisis exploratorio de datos en Udacity.

Comencé con el problema de Titanic usando los tutoriales de Titanic (cuál es el problema, solo una hora): Comience a resolver el problema de Kaggle con R: Tutorial de una hora

Pero luego me volví adicto por algún tiempo y también estaba seguro de que al menos podría sostener el bate. Seguí jugando con las herramientas (principalmente R y Python … pequeño bi de Weka solo para mantener la adrenalina fluyendo) y seguí intentándolo hasta que llegué a la tabla de líderes en 2 meses. Luego perdí el interés por un tiempo pero volví en poco tiempo.

Hoy en día, me aseguro de competir en diversos problemas, de modo que incluso si no llego a la cima, al menos aprenderé algo y todo esto no será una pérdida de tiempo. Eso es algo que me mantiene motivado y trato al menos un problema al mes.

Me enfrento al mismo dilema, me encantaría ganar competiciones y mi objetivo es ser competente a finales de este año. Descubrí que el mejor lugar para comenzar es con Machine Learning en Coursera. Además, Kaggle tiene un fantástico kit de arranque como lo menciona Madhav Kumar.