¿Qué conceptos y prácticas de metodología de investigación genérica se utilizan en el campo del aprendizaje automático?

Seguir prácticas metodológicas sólidas es esencial en la investigación del aprendizaje automático (no hacerlo es una razón que a menudo cito para rechazar los documentos de investigación de minería de datos).

Éstos son algunos de ellos:

  • Resultados con validación cruzada. Los experimentos de aprendizaje automático supervisados ​​generalmente se realizan dividiendo su conjunto de datos en subconjuntos de entrenamiento / prueba y luego midiendo el rendimiento (por ejemplo, precisión de clasificación) del modelo en el conjunto de prueba después de entrenar el modelo en el conjunto de tren. Si solo hace esta división una vez, entonces no puede informar con seguridad las métricas de rendimiento, ya que no sabe cuánto dependen esas métricas de la división particular que utilizó. Es por eso que estos experimentos deben informar resultados con validación cruzada, utilizando, por ejemplo, los métodos k-fold o leave-N-out.
  • Mediciones de referencia. Los resultados de un experimento de algoritmo de aprendizaje automático generalmente no tienen ningún sentido por sí mismos: tienen sentido al compararlos con una línea base adecuada. Por ejemplo, compare estos dos escenarios. En el primero, tiene un algoritmo de aprendizaje con una precisión del 99%, pero si simplemente hubiera seleccionado la clase / etiqueta más común, el resultado habría sido un 97% de precisión. En el segundo, tiene un algoritmo de aprendizaje que es 80% preciso, pero la línea de base de la clase más común es 50% precisa. Claramente, el segundo escenario es, en general, no tan preciso como el primero (80% vs 99%), pero el problema de aprendizaje, medido por la línea de base, también es mucho más difícil que el primero (50% vs 97%) y así ¡El algoritmo de aprendizaje ha logrado mucho más!
  • Prevención de fugas de datos y aprendizaje del conjunto de pruebas. Cuando divide o prepara un conjunto de datos para llevar a cabo un experimento de aprendizaje automático, debe dividirlo de manera sólida; si no lo hace, distorsionará sus resultados y posiblemente capacitará a su modelo utilizando la información que se encuentra en su conjunto de pruebas (¡Qué es hacer trampa!). Un gran ejemplo de esto es el problema del viaje en el tiempo. La página de fugas de Kaggle también es muy informativa y tiene un gran ejemplo.

Además de estas sugerencias específicas de aprendizaje automático, el método científico (ciclo desde la generación de hipótesis hasta la prueba) aún se aplica: la diferencia típica es que otros campos incluyen un paso de “recopilación de datos”, mientras que muchos experimentos de datos tienen un conjunto de datos que ya está disponible.

Los métodos comunes en el aprendizaje automático incluyen métodos de conjunto (refuerzo y embolsado), métodos de descenso de gradiente y árboles.

More Interesting

¿Cómo debo revisar la literatura relevante sobre un tema muy específico sobre el cual no tengo mucho conocimiento?

Cómo saber cuáles son las últimas áreas de investigación en informática

¿Qué campos de investigación tendrán más impacto fuera de la academia en los próximos años?

¿Cuáles son algunos temas de investigación recientes sobre diseño de máquinas?

¿Qué habilidades prácticas debe aprender un aspirante a investigador de aprendizaje automático (Linux, computación paralela, GPU, etc.)?

¿Cuál es la mejor manera de hacer investigación CS en Stanford como estudiante?

¿Cuáles son los ciertos algoritmos que un principiante debe dominar para ser competente en visión por computadora?

¿Cuáles son los tipos correctos de aplicaciones móviles?

¿Qué es mejor, participar en una investigación que está fuera del instituto de origen o participar en una investigación en el instituto de origen?

¿Qué tan importante es el álgebra lineal en informática, es decir, cómo se interrelacionan los dos?

Estoy haciendo un gran proyecto escolar sobre visión por computadora y robótica. ¿Cuáles son algunos libros no técnicos que podría leer sobre estas áreas temáticas?

¿Cuál es el equivalente de Xerox Parc / Bell Labs / JPL hoy?

¿Cómo podría un estudiante obtener un trabajo en Google Research o Microsoft Research?

¿Ha habido algún progreso en la arquitectura de subsunción desde que se introdujo?

¿Cuáles son los temas más candentes para la investigación en simulación y modelado de yacimientos?