¿Qué métricas deberían usarse para crear una puntuación de confiabilidad automática para los artículos de Wikipedia?

No se deben usar métricas, porque Wikipedia es transparente. Tan pronto como anuncies un sistema determinista para elevar artículos, las personas abusarán de él. Número de citas? Los defensores agregarán ciegamente citas a un artículo. Credibilidad de citas? Agregarán citas del New York Times. ¿Plantillas que indican que el artículo es confiable o no? La gente agregará esas plantillas.

En mi opinión, es práctico (¿pero con qué fin?) Evaluar la fiabilidad de un artículo de acuerdo con algunas heurísticas y análisis. Cuando encuentro por primera vez un nuevo artículo cuya fiabilidad es una preocupación, en los primeros 1 a 5 segundos busco un formato convincente, referencias, estructura (¿bien organizado?), Tono del artículo (palabras cargadas, argumentación) y un montón de cosas que básicamente se reduce a profesionalismo. Y luego: reversiones, plantillas, quién lo está editando, qué está pasando en la página de discusión.

Hay una gran cantidad de investigación sobre esto, y parece que hay algunos indicadores generales que se mantienen bastante bien en promedio: número de ediciones, edad, número de enlaces salientes y entrantes, número de editores distintos, todos se correlacionan con la calidad.

Pero. Eso no significa que sean buenos indicadores de la calidad de un artículo específico que le interese. Pueden ser totalmente engañosos para esa página.

Lo mejor que se me ocurre es la cantidad de editores distintos que han contribuido significativamente a la versión actual de la página. De esa manera, al menos tienes una buena oportunidad de que muchas personas lo vean y lleguen a algún tipo de acuerdo. Pero este puntaje es bastante costoso de calcular. Lamentablemente, no es práctico para el análisis en vivo en este momento (hablé de esto con la gente de operaciones de Wikimedia hace solo unos días en Wikimania).

No necesariamente sugeriría que necesita un puntaje de confiabilidad automático cuando existe un sistema de clasificación de artículos producido por WikiProjects.

Dicho esto, hay muchas cosas que puede usar, que incluyen:

  • cantidad de reversiones y cantidad de guerras de reversión (necesita encontrar una manera de excluir la reversión de spam, básicamente debe verificar la reversión entre usuarios que no han sido bloqueados posteriormente)
  • presencia de plantillas de advertencia tanto en el artículo como en la página de discusión
  • ‘svn culpar’ como análisis del texto del artículo: compare el número de editores generales del artículo con la cantidad de material que les queda en el artículo
  • cantidad de personas que miran el artículo (solo funciona para artículos razonablemente populares; no se puede obtener la cantidad de listas de vigilancia cuando ese número es inferior a 30)
  • compare los datos del cuadro de información entre las versiones de Wikipedia en diferentes idiomas: ya existe un proyecto llamado “tabla de anomalías de muerte” que intenta encontrar artículos sobre personas en las que figuran como vivas en la Wikipedia en inglés, pero aparecen como muertas en las versiones de Wikipedia en otros idiomas. ver http://en.wikipedia.org/wiki/Wik
  • ‘Qué enlaces hay aquí’: cuántos otros artículos tienen enlaces

Ya existe un proyecto que calcula la confiabilidad de los artículos de Wikipedia: WikiTrust – http://www.wikitrust.net/