Puede hacer sus evaluaciones de dos maneras: intrínseca o extrínsecamente
Evaluación intrínseca: en este tipo de evaluación, debe comparar los datos preprocesados con los datos sin procesar. ¿Como hacer eso? Depende de tus datos. Si los datos son lenguajes naturales, ¡puedes calcular la cantidad de ruido de alguna manera! La perplejidad puede ser una medida de evaluación que está buscando.
Evaluación extrínseca: en este tipo de evaluación, debe usar sus datos en posibles aplicaciones (generalmente conocidas e importantes) y ver si usar sus datos preprocesados puede mejorar el rendimiento de esas aplicaciones en comparación con los resultados obtenidos por la misma aplicación pero con datos en bruto. La métrica de evaluación aquí depende completamente de la aplicación con la que está evaluando sus datos. Por ejemplo, si está utilizando sus datos para entrenar a un SMT, es posible que necesite usar BLEU / WER / TER y si está utilizando sus datos para la recuperación de documentos, es posible que deba evaluar los resultados a través de MAP / [correo electrónico protegido] / NDCG .
- ¿Qué tensiones tienen entre sí el diseño de productos y el aprendizaje automático?
- ¿Cuáles son los mejores cursos de ciencia de datos en Udemy?
- Como persona con una maestría en química y un doctorado en ingeniería eléctrica y nanotecnología, a los 26 años sin experiencia en ciencias de la computación, ¿es demasiado tarde o demasiado difícil enseñarme a mí mismo el aprendizaje automático?
- RNN para modelado de idiomas en Tensorflow. ¿Cómo puedo rellenar las secuencias si mi entrada está constituida por la incorporación de palabras?
- Cómo estudiar el aprendizaje automático mientras se construye una cartera
Para concluir, no proporcionó ningún detalle en su pregunta y, por lo tanto, yo (y otros) no puedo proporcionar ninguna respuesta directa. Buscar sobre los puntos mencionados anteriormente podría ayudar.