¿Cuál es la diferencia de enfoque para resolver un desafío de Kaggle y trabajar en un problema de investigación de LA bien definido?

El desafío de Kaggle es, ante todo, un desafío. Tiene una métrica definida que determina si ganas o no. Algunas personas lo confunden con problemas de investigación de ML aplicados , que parecen tratar de optimizar los parámetros y elegir los mejores algoritmos para una tarea en particular.

Kaggle Competition <Investigación aplicada <ML Research

Cuando compites en Kaggle, probablemente hagas algunos análisis exploratorios e ingeniería de características. Pero eso es solo una parte de un problema de investigación aplicada. Un documento técnico debe contener una conclusión que proporcione una idea sobre el enfoque de la clase de problemas similares. No como la idea de “cuando tenga dudas, importe xgboost “, sino “aquí hay una tabla enorme que compara los puntajes y sus métricas de confiabilidad como SD” y algunos razonamientos sobre los caminos de mejora para este problema. Cuando termina la competencia de Kaggle, se acaba. Los ganadores publican sus soluciones (producto de la competencia, esencialmente) y, en general, nadie se sorprende. Cuando se trata de investigación aplicada, el problema no desaparece inmediatamente después de la publicación del documento, pero ahora el mundo tiene nuevos conocimientos sobre cómo se podría resolver esto de una manera confiable y efectiva.

Sí, ese es un problema bastante grande también, porque muy a menudo las soluciones obtenidas en Kaggle, a pesar de ser extremadamente efectivas, a menudo pueden ser inestables, no escalables y en general perjudiciales para la producción.

Ahora, para la investigación pura de ML, a diferencia de Kaggle, puedes ver todo tipo de cosas allí. Desde la discusión de la mejor arquitectura para un sistema de reconocimiento de imágenes en un marco existente bien probado hasta un algoritmo absolutamente nuevo con análisis de convergencia, límites inferior y superior para la eficiencia y un montón de teoremas con pruebas, si desea un gran ejemplo, simplemente tome un vistazo a COLT: Conferencia sobre teoría del aprendizaje. 23-26 de junio de 2016 – Asociación para el Aprendizaje Computacional

TL; DR para esta comparación:

Kaggle : aquí están los parámetros óptimos para xgboost para este conjunto de datos

ML aplicado : aquí está el mejor algoritmo para esta clase de problemas y algunas ideas de por qué es así

ML normal : mira, encontramos una manera de combinar un montón de árboles de decisión en un algoritmo de conjunto fuerte

COLT : hoy vamos a demostrar que las redes neuronales pueden sustituir a las máquinas de Turing

Respondiendo a la pregunta adicional, claro, hay algunas soluciones dignas de publicación, la mayoría de las veces están relacionadas con la visión por computadora. En CV, el conocimiento sobre qué arquitecturas funcionan y cuáles no se adquiere por experiencia, y cada artículo que describe la red detrás del resultado agrega otra pieza de un rompecabezas. Tal vez no sea un descubrimiento innovador, pero ciertamente amplía nuestro conocimiento. El criterio para agregar conclusiones basadas en el experimento aún permanece.

Hay desafíos de Kaggle alojados por gigantes de la industria destinados a tratar de resolver los problemas prácticos que enfrentan.

Los ejemplos de tales desafíos prácticos incluyen:

  1. https://www.kaggle.com/c/acquire
  2. https://www.kaggle.com/c/expedia… .

Incluso si las soluciones propuestas no tienen un alto factor de novedad, solo vale la pena publicar, al menos en las pistas de la industria o aplicaciones en las conferencias, mostrar y concluir que algún algoritmo o enfoque funciona para resolver un cierto tipo de problema de la industria del mundo real. No en la pista de investigación.

Existen pocas publicaciones que se refieran a los conjuntos de datos de desafío de Kaggle, por ejemplo, https://www.researchgate.net/pub

More Interesting

¿Hay algún lugar para ingenieros de software que no aprendan IA o Machine Learning en los próximos 10 años o todos tienen que aprenderlo?

Cómo obtener la etiqueta del tema que modela la salida LDA

¿Cuáles son las historias de éxito del aprendizaje profundo para el procesamiento del lenguaje natural y los marcos y bibliotecas utilizados o creados por ellos?

¿Qué conocimientos de matemática / estadística y CS debo dominar (no matemático / stat / CS, pero graduado en ingeniería) para carrera / investigación en aprendizaje automático?

¿Cómo detectar el sarcasmo en frases u oraciones mientras se extrae texto? ¿Hay alguna metodología utilizada?

¿Debo aprender C ++, Python o Java para construir un sistema de aprendizaje automático de grado de producción?

¿Cómo debe comenzar un principiante con la investigación en Machine Learning?

¿Dónde puedo encontrar un conjunto de datos de texto traducido de cualquier idioma a otro válido para ser entrenado en un modelo de traducción automática en aprendizaje automático?

¿Cómo son convexos los métodos del núcleo?

¿Por qué es importante usar pruebas de regresión?

¿Cómo entrenamos redes neuronales en datos numéricos?

¿Quiénes son algunos de los mayores usuarios de Apache Hive? ¿Cuáles son sus casos de uso? ¿experiencias?

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?

¿Cuáles son los mejores cursos introductorios para el aprendizaje automático disponibles en Internet para principiantes?

¿Qué es AdaBoost?