¿Cuál es una buena puntuación porcentual en los problemas de conocimiento de Kaggle para principiantes?

Siempre lea un foro en cada competencia. Es muy probable que encuentre un tema sobre superar el punto de referencia allí; casi con certeza contiene un pequeño fragmento de código, que funciona relativamente bien, pero no demasiado bien. Yo diría que un principiante debería poder mejorar este resultado básico por un tiempo; si puede hacerlo, está haciendo un buen trabajo, lea los métodos de los ganadores e intente comprender cómo aplicarlos para su solución.
Como un muy buen ejemplo, sugeriría Higgs Boson Machine Learning Challenge: ya está terminado, pero puede rastrear cómo se desarrollan las ideas en la comunidad, ejecutar una validación cruzada y compararla con lo que escriben en el foro (y , probablemente, puntaje LB). Finalmente, eche un vistazo al tema de los ganadores: es bastante impresionante.

Es obvio que cada competencia difiere de las demás, y puede ser muy difícil incluso pasar del percentil 50 al, por ejemplo, el 60. El único indicador bueno y confiable de tu progreso es que puedes hacerlo mejor que ayer.

¡Mucha suerte en las competiciones!

More Interesting

Cómo elegir el número de árboles en el aprendizaje automático

¿Es cierto que las predicciones en el espacio de alta dimensión son más difíciles en torno al origen?

¿Cómo se determina el rango de posibles valores lambda cuando se realiza la validación cruzada en una regresión de lazo?

¿Qué tan buena es la Universidad de Edimburgo, en comparación con la CMU para estudios de posgrado e investigación en aprendizaje automático y neurociencia computacional?

Soy Editor de Adquisiciones y para obtener conocimiento y autoaprendizaje de análisis de datos y habilidades de aprendizaje automático. ¿Alguien podría ayudarme a trazar un plan?

¿Cómo se compara la industria del aprendizaje automático con las opciones de carrera dentro del desarrollo web?

En general, ¿necesita tener un doctorado para obtener un trabajo de Machine Learning / Data Mining en una startup o en una gran empresa?

¿Cuáles son los posibles remedios si está atascado en la comprensión de la parte técnica de un trabajo de investigación de STEM?

Estoy muy interesado en el aprendizaje automático y quiero trabajar en algunos proyectos de código abierto. ¿Qué proyectos puedes sugerir?

¿Son los modelos de aprendizaje profundo / redes neuronales siempre superiores en las tareas de PNL?

¿Cuáles son algunas posibles aplicaciones de aprendizaje profundo que son bastante novedosas?

¿Cuál es el algoritmo de aprendizaje automático más rápido para implementar para la detección de fraudes?

¿Cuál ha sido la experiencia de la gente con RapidMiner?

Cómo demostrar que minimizar la suma residual de cuadrados es equivalente a maximizar la función de log-verosimilitud

¿Cuál es la diferencia entre el entrenamiento por lotes, en línea y mini-lote en redes neuronales? ¿Cuál debo usar para un conjunto de datos de pequeño a mediano tamaño con fines de predicción?