¿Podemos obtener automáticamente datos de prueba / entrenamiento para un sistema Machine Learning to Rank (MLR)?

No estoy seguro si entiendo su pregunta correctamente. Corríjame si me equivoco: lo que está pidiendo es cómo generar datos “artificiales” para experimentar con MLR.

Claro, puede extraer muestras aleatorias de una distribución particular para crear conjuntos de datos de entrenamiento y prueba. Sin embargo, tenga en cuenta que su modelo MLR solo funcionará bien con los datos extraídos de la misma distribución. Más concretamente, si entrena un sistema MLR en algunos datos de juguetes que no tienen nada que ver, por ejemplo, clasificando las opiniones de los clientes por sentimiento (digamos de una escala 1-10 para negativo a positivo), este modelo no lo ayudaría a abordar el último.

Sugerencia: Si desea generar datos de entrenamiento artificial para MLR, a menudo puede simplemente usar conjuntos de datos de regresión y “aplastar” la variable explicativa en un rango entero fijo.

Tal vez una idea para jugar con un conjunto de datos: el conjunto de datos de la película Te IMDb (Análisis de sentimientos). Aquí, el sentimiento se “resumió” para una tarea de clasificación binaria, p. Ej. 1-4 estrellas = negativo, 7-10 estrellas = positivo. Lo que realmente puede hacer es eliminar IMDb para esas revisiones y obtener las calificaciones de enteros de 1-10 estrellas para entrenar un sistema MLR.

Aprendizaje automáticoCiencia dedatosinformática

Related Content

¿Cuáles de los cursos de Machine Learning tienen las mejores tareas y están disponibles en la web?

¿Por qué los científicos usan palabras no rigurosas como "ultra intenso"?

¿Qué opinas de todos estos programas de maestría de Data Science que están saliendo?

Cómo elegir un modelo ML cuando el objetivo es tanto una predicción razonable como una inferencia

¿Cuáles son los métodos de normalización de datos más comunes utilizados en el aprendizaje automático?

¿Cuál es el primer paso para aprender a hackear sitios web o Wi-Fi?

¿Es cierto que si no eres muy bueno con los números y las estadísticas, no puedes ser bueno en el análisis de datos?

More Interesting

¿Cuál es el mejor instituto de formación Hadoop de big data en Noida?

¿Cómo es un día típico para un científico de datos en LinkedIn?

¿Qué campo debo elegir, redes informáticas o ciencia de datos? Amo los dos.

¿Cuál es el camino de aprendizaje de big data?

¿El análisis de datos es diferente del análisis de datos?

¿Qué tipos de datos utilizan los informáticos para encontrar mejores valores de números irracionales como pi?

¿Cuál es el mejor idioma para aprender para convertirse en analista de datos?

¿Hay algún programa de capacitación en ciencia de datos para empleados de H1B que trabajan en otro dominio?

¿Cuáles son las mejores herramientas utilizadas para el modelado de datos?

¿Qué instituto es mejor para el curso de ciencia de datos en Bangalore?

¿Cuáles son los problemas de big data más destacados en FinTech?

¿En qué escenario empresarial se hace necesario el aprendizaje en línea, actualizar el modelo en tiempo real con la llegada de nuevos datos?

Mis tesis de licenciatura y maestría son en procesamiento de imágenes y aprendizaje automático. ¿Está mal intentar otros temas en mi doctorado?

¿Cuáles son las API de aprendizaje automático que puedo usar para analizar la calidad de los datos?

¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?

Web Analytics