¿Cuál es la diferencia entre los datos generados por la actividad y los generados por la máquina en la terminología de Big Data?

La conclusión es que “no hay una demarcación clara entre los datos generados por la actividad y los datos generados por la máquina, ya que los datos en algún sentido se generan utilizando un algoritmo bien definido”. Cuando digo algoritmo, no es esencialmente un proceso automatizado, puede ser un procesamiento manual como la predicción electoral.

Respuesta de alto nivel:

Los datos de actividad generada son datos generados a partir de una actividad que involucra a un grupo de usuarios, la comunidad o un individuo. Por ejemplo: Tweets de usuarios sobre depresión. Datos relacionados con la conciencia del consumidor, datos de respuesta a emergencias.

Los datos generados por máquina son datos generados a partir de una máquina que recibe cierta entrada, que tiene un modelo en forma de algoritmo y obtiene datos como salida. Un ejemplo muy ingenuo es “Generador de números aleatorios”, datos de cobertura de un programa, datos de f-MRI, etc.

¡¡Espero eso ayude!!

More Interesting

¿Cuáles son los proyectos de ciencia de datos más interesantes en Quora?

Cómo comenzar a participar y prepararse en hackatones para la ciencia de datos

¿Qué información buscará un científico de datos en un conjunto de datos de un procesador de pagos en línea que consta de transacciones, información comercial y otra información sobre negocios comerciales?

Para la validación cruzada K-fold, ¿qué k se debe seleccionar?

¿Qué credencial de ciencia de datos es más valiosa, un certificado en línea de la escuela de extensión de Harvard o un MSC en línea del Data Science Tech Institute (París)?

¿Qué dicen los grandes datos sobre el ajedrez? ¿Hay algún algoritmo numérico simple para evaluar las posiciones de ajedrez que no impliquen calcular árboles de posición? ¿Tienen éxito al predecir los resultados de los juegos de ajedrez entre jugadores de habilidades similares?

¿Cuáles son las características de Big Data como servicio?

¿Puedo hacer cosas de aprendizaje automático / minería de datos sin ser un "tomador de decisiones"?

¿Cuáles son los beneficios de la remodelación de datos?

¿Puedo aprender minería de datos sin aprendizaje automático?

¿Cuál es la diferencia entre la minería de datos y el desguace web?

Soy un novato en la minería de datos. ¿Cuál es el mejor algoritmo de aprendizaje automático para la minería de datos en términos de precisión y tiempo? Me parece que SVM se ha utilizado ampliamente, pero ¿hay alguna otra opción mejor que SVM?

¿Cuáles son las opciones de la plataforma de análisis para datos no tan grandes?

¿Cuáles son algunas ideas o proyectos en Machine Learning o análisis de big data en un hackathon?

¿Cómo es una implementación de ciencia de datos de producción?