¿Puedes estimar la calidad de una persona por su historial de navegación en Internet?

Esta es una pregunta muy interesante. Dado nuestro entorno cada vez más rico en datos, la propensión de las interfaces usuario / computadora a fomentar búsquedas impulsivas y las contribuciones de las redes sociales al flujo de información; Esta no es una tarea inverosímil.

Por supuesto, probablemente habría que tener en cuenta los casos atípicos (lo que predeciría que sería frecuente), pero dadas las estrategias correctas, me imagino que podría incluirse una estimación general. (Suponiendo que tiene una definición específica de “calidad” en mente).

Nota: NO recomendaría aplicar una búsqueda de frecuencia de palabras clave a la totalidad de la actividad de Internet de una persona.

Para hacer lo que está proponiendo, sugeriría examinar primero las debilidades del enfoque y luego identificar formas de eludirlas. Esbozaré un ejemplo de tal debilidad y posibles soluciones en detalle. Esperemos que puedas extrapolar desde allí.

Esta imagen es solo para atractivo visual. No se relaciona directamente con el texto. Imagen

Sesgo de volumen: el usuario puede dedicar un número desproporcionado de búsquedas a un área general durante un corto período de tiempo. Esto podría deberse a la prevalencia de enlaces a contenido relacionado o al “estado de ánimo” del usuario.

  • Considere el siguiente escenario: (1) Una persona busca un video corto. (2) El usuario no encuentra el video que está buscando, pero está expuesto a una variedad de enlaces de sugerencias y hace clic impulsivamente en uno que parece atractivo. (3) El usuario no puede encontrar un video que sea satisfactorio, pero rápidamente pasa por más de 30 videos diferentes y continúa frustrado.
  • El escenario anterior es probablemente bastante común, especialmente en sitios web con una gran cantidad de enlaces (como se mencionó). Algunos sitios que podrían ser propensos a esto incluyen Youtube, Quora, Facebook, Wikipedia, etc.
  • Ahora podemos ver surgir el problema. Obtendrá un resultado sesgado si no se ajusta a este fenómeno. La representación excesiva de las búsquedas de Youtube, Quora, Facebook, Wikipedia, etc. alterará en gran medida los resultados, especialmente dado que el tipo de contenido que un individuo puede investigar utilizando estos sitios puede ser bastante diferente del tipo de información que dará una buena estimación. de la “calidad de una persona”.

Sin embargo, el sesgo de volumen puede tener algunas soluciones. Sugeriría lo siguiente como puntos de partida, aunque es probable que necesite emplear alguna prueba + error + diseño racional adicional para optimizar estas técnicas. Tenga en cuenta que solo estoy produciendo esto en la parte superior de mi cabeza, por lo que probablemente haya algunos errores evidentes que es posible que deba corregir también. Sin embargo, debería darte un lugar para ir.

  • “Comprimir” conjuntos de búsquedas que ocurrieron a través de “vinculación” en lugar del uso del teclado. Digamos que alguien accede a 40 enlaces de su feed de Facebook. Tome grupos de búsquedas (digamos que 10 búsquedas van juntas, otras 17 van juntas y 13 van juntas) y regístrelas como búsquedas individuales etiquetadas con un “tema / tema” y una “fuerza de tema / tema”. (Este último se basa tanto en la probabilidad de que el tema sea real como en su nivel de importancia). Las siguientes viñetas describen formas de lograr esto.
  • Palabras clave encontradas en las páginas individuales, etiquetas, temas cualitativamente definidos: ¿están todas las páginas relacionadas / siguen un tema que puede distinguirse de las relaciones generadas automáticamente que ha aplicado el “motor de sugerencias” del sitio web? Si son relativamente dispares y solo siguen patrones que corresponden a la media de un gran número de individuos de control (que se ha determinado experimentalmente que se comportan de una manera no dirigida), reduzca la puntuación otorgada a ese conjunto de búsquedas. Si siguen un tema que excede las relaciones esperadas del “motor de sugerencias”, hay más indicios de que la persona tiene una meta de cierto peso psicológico, y se les debe dar una puntuación más alta, ya que podrían decirle más sobre eso La calidad de la persona.
  • “Separe” los grupos de búsqueda temáticos de las búsquedas de fondo más aleatorias. Al aplicar algún tipo de algoritmo a las búsquedas de conglomerados realizadas dentro de una serie de enlaces por tema (ver arriba), se pueden identificar temas que reflejan algo psicológicamente significativo para su sujeto. Estos grupos temáticos recibirán una puntuación más alta que los más aleatorios y recibirán una designación de tema / etiqueta.
  • Volviendo al ejemplo de Facebook: Alguien podría acceder a 17 enlaces mal interrelacionados a los que se les asigna una puntuación de 0.05 unidades en función de la frecuencia de las palabras clave compartidas por esos sitios (en relación con los controles). Esta frecuencia cae por debajo del umbral necesario para obtener una designación de tema / etiqueta, por lo que ese grupo se elimina. La persona puede ir a 10 sitios que están más fuertemente interrelacionados, recibiendo una puntuación de 0.72 y una designación de “biotecnología + Biografía de bricolaje” según lo determinado por las palabras clave compartidas más frecuentes (con sus sinónimos) o un método similar. Los 13 enlaces están muy relacionados entre sí (0,93) y se designan “empresarios biomédicos + jóvenes científicos + innovación”. Ahora puede usar “biotecnología + bricolaje bio” (0.72) y “empresarios biomédicos + jóvenes científicos + innovación” (0.92) en su análisis posterior. Ha excluido parte del sesgo de volumen inherente a la navegación web.

Dar una explicación más completa de estas ideas requeriría más tiempo del que poseo actualmente. Espero que esto lo haga pensar y le permita formular sus propias estrategias adicionales para tales análisis.

Lo más importante para recordar es que habrá una variedad de formas de sesgo, solo tiene que implementar algoritmos que ajusten este sesgo al mínimo (e investigue los controles adecuados para usar dentro de los algoritmos para reducir el ruido de fondo).

Buena suerte en tus estimaciones. Avíseme si encuentra algo interesante, me encantaría saberlo.

¡¡¡¡¡No, en absoluto!!!!!

Según yo, el historial web es lo más cercano a los pensamientos de una persona. Puedes pensar lo que quieras. Pero lo que importa es lo que haces.

así, una persona puede navegar en la red por lo que quiera. no significa que él o ella quiera hacerlo.

por ejemplo llévame. mi búsqueda de google será principalmente así

  1. como ser mentalista
  2. ¿Cómo hacer una bomba?
  3. lenguaje de programación para principiantes
  4. como impresionar a mi novia

¿Puedes adivinar mi personaje?

tienes tu respuesta: p

sí. Internet es la plataforma en la que una persona busca varias cosas de su interés. Puede buscar cualquier cosa que elija. Un buen historial de navegación en Internet significa que alguien busca cosas buenas como películas, materiales de estudio. , sobre cosas nuevas, etc.