Me gusta leer artículos de nuevos sitios la mayoría de las mañanas.
Así que imagíneme esta mañana haciendo clic en decir, msnbc.com. Luego procedo a hacer clic en 5 historias diferentes abriéndolas en una pestaña separada en mi navegador móvil. Del artículo 1 al 5, leo cada uno, luego hago clic en el botón de comentarios para comentar cada historia. Cuando termine, veo una sección de “Artículo recomendado” en cada artículo y decido abrir algunos de estos enlaces. Leo, comento y abro más artículos recomendados.
Ahora, la mayoría del servidor mantendrá una entrada de registro para cada navegación realizada por los usuarios del sitio / servidor web. Entonces, dada la narración de mi navegación por el sitio de noticias de la mañana, imagine la tasa de entrada del registro en el servidor. Luego imagine que hay al menos 1000 personas que usan el mismo sitio nuevo como yo en todo el mundo. Lo que tendrá una secuencia de creación de entrada de registro en el servidor. Este es el CLICK STREAM para ese sitio: una secuencia de registros de registros creados por cada clic que un usuario hace en el sistema front-end.
- ¿Cómo realizan los científicos de datos la selección del modelo? Al abordar, por ejemplo, un problema de clasificación, ¿cómo eligen los científicos de datos entre regresión logística, SVM, KNN, árboles de decisión, redes neuronales, etc.? ¿Es diferente para Kaggle?
- ¿Cuál es la importancia de utilizar la tendencia central en el análisis de datos?
- ¿Cuál es la diferencia entre el científico de datos y el científico de investigación en Google?
- ¿Cuál es, en su opinión, la mejor medida de disimilitud para el análisis de imágenes en otras áreas del análisis de datos topológicos?
- ¿Cuál es la diferencia entre un ingeniero y un científico, y cuál es más divertido?