¿Qué datos puedo recopilar y hacer un procesamiento de Big Data para diagnosticar en mis sistemas?

Respuesta simple

Si está interesado principalmente en fallas, existen bastantes soluciones existentes.

Echa un vistazo a New Relic (no afiliado y nunca usado).
También es posible que desee configurar Google Analytics.

Hay más soluciones, seguramente puede obtener más respuestas si involucra personas de “Web” y “Sitio web”, no de Hadoop / Machine Learning.

Respuesta compleja

¿Qué datos puedo recopilar: todos!

Como siempre, el 10% de los datos recopilados servirían al 90% de las tareas.

El inicio de sesión en cada hit de punto final, junto con la ID de usuario y la ID de cookie del navegador, le proporcionaría suficientes datos sobre los patrones de uso. Ese es el primer 5%.

(Sí, esto puede obtenerlo directamente de los registros del servidor web o newrelic / googleanalytics, pero eventualmente le gustaría tener los registros en un lugar en más o menos el mismo formato).

El registro a nivel del navegador sobre dónde hicieron clic sus usuarios para aumentar aumentará los registros anteriores con una idea de dónde deberían haber llegado al sitio (pero tal vez nunca lo hicieron debido a problemas de su lado). Ese es el próximo 3% para un total de 8%.

Iniciar sesión en el hecho de que la página acaba de comenzar a cargarse (tal vez se han mostrado elementos básicos de la interfaz de usuario y las solicitudes de Ajax están en camino para obtener más) le daría una idea de lo que sus usuarios simplemente eligieron no esperar y lo que de hecho no pudo cargar debido a algunos problemas de su lado. Ese es el próximo 2% para el 10% total, como se anuncia.

¡Buena suerte y diviertete!

More Interesting

¿Qué es mejor para la detección de automóviles: Haar Cascade o HOG?

¿La correlación entre dos variables cuenta como evidencia débil de un vínculo causal entre ellas?

¿Necesita saber la teoría de la medida para hacer investigación de aprendizaje automático?

Como persona con una maestría en química y un doctorado en ingeniería eléctrica y nanotecnología, a los 26 años sin experiencia en ciencias de la computación, ¿es demasiado tarde o demasiado difícil enseñarme a mí mismo el aprendizaje automático?

Cómo probar y depurar código, código de optimización numérica y / o modelos de aprendizaje automático

¿Cómo genera fastText un vector para una palabra que no está en el modelo pre-entrenado?

Cómo comenzar con el aprendizaje de múltiples núcleos

¿Qué piensa la gente del siguiente documento que señala los límites del aprendizaje de extremo a extremo?

¿Cómo afectan los registros duplicados en el conjunto de datos de entrenamiento a un clasificador Naive Bayes?

¿Cómo determina el algoritmo de aprendizaje automático de Quora la clasificación de la calidad de la pregunta?

En las arquitecturas VGG-16 y VGG-19, ¿por qué hay más capas convolucionales 3 × 3 apiladas consecutivamente en las capas altas que en las capas inferiores?

¿Qué piensa Pedro Domingos de la investigación de aprendizaje automático que está ocurriendo en la industria versus la academia?

¿Cuál es la diferencia entre la regularización y el sesgo inductivo en el aprendizaje automático?

¿Cómo usa la NASA el aprendizaje automático?

¿Es el aprendizaje automático una mejor forma o técnica para comprender los datos y hacer pronósticos que las estadísticas?