¿Qué se entiende por una solución de referencia en el aprendizaje automático?

Comprendamos el término punto de referencia sin tener en cuenta el contexto. Benchmark es estándar con el que se comparan las soluciones, para tener una idea de si las soluciones son mejores o peores.
Ahora vamos a ponerlo en contexto de aprendizaje automático. La evaluación comparativa aquí significa, una solución estándar que ya funciona bien. ¿Cuáles serían los factores en los que se probará su solución? Principalmente dependerá de la cantidad de datos de entrenamiento / prueba, cuál es la precisión con la que se está desempeñando su solución, en comparación con la solución de referencia. Lo que buscan los hosts es una solución que funcione mejor que su solución existente. Por supuesto, no lo van a regalar, para que pueda analizar y encontrar algo mejor. Solo tiene que encontrar una buena solución y esperar que funcione mejor que la solución de referencia. Esto podría lograrse implementando algoritmos más sofisticados, o ver las cosas de manera más integral. Como principiante, sospecho que podrías hacer esto.

Tiene razón, las soluciones deben ser al menos tan buenas como el punto de referencia.
“¿Cómo puede alguien asegurar eso cuando no se conoce la solución real?” La mayoría de los problemas tienen un conjunto de datos de prueba y entrenamiento. El punto de referencia está sobre la precisión en el conjunto de prueba.
Además, personalmente sugeriría no comenzar con Kaggle si eres un principiante y estás planeando una carrera como persona de Aprendizaje automático, es mucho menos parecido a problemas del mundo real (pero definitivamente es más divertido). Puede volver cuando entienda bien los conceptos básicos y comprenda cómo ajustar los algoritmos principales.

More Interesting

¿Existe una buena herramienta de aprendizaje de idiomas?

¿Qué problemas o conjuntos de datos existen cuando usar el impulso da mejores resultados que usar un SGD simple?

Según muchas personas, la inteligencia artificial y el aprendizaje automático son las principales razones de los despidos de trabajo de TI. ¿Qué trabajos han sido reemplazados por estas disciplinas?

¿Cuáles son las principales diferencias entre TensorFlow y SciKit Learn?

¿Qué parte del autoencoder realmente representa las características aprendidas?

Cómo lidiar con datos sin patrones en los que necesito realizar un modelo de clasificación

¿Es posible aplicar las técnicas de N-gram para el análisis de sentimientos?

¿Hay algún proyecto / investigación de Machine Learning interesante en el que pueda trabajar de forma independiente?

Cómo entrenar algoritmos relacionados con IA sin una GPU decente

Cómo descargar el conjunto de datos para el resumen de texto extractivo

¿Cuáles son algunos buenos textos en MCMC?

¿Cuáles serían los proyectos / servicios más interesantes en el cuidado de la salud que involucren alta tecnología como dispositivos móviles, big data y data science? Por ejemplo, Ginger.io.

¿Cuál es el mejor código de Python que extrae todas las frases y parte de las etiquetas de voz (POS) de una oración?

Durante la validación cruzada k-fold, ¿cuáles son algunas soluciones posibles cuando la varianza de las estimaciones de error de prueba es muy alta?

¿Qué empresas del área legal usan Machine Learning?