¿Pueden la minería y el análisis de big data encontrar un sesgo en los medios occidentales?

Sin aceptar necesariamente la premisa de la pregunta, la respuesta teórica es sí.

Se puede analizar cualquier tipo de conjunto de datos (en esta pregunta, los “medios”) pero cada uno tiene algún tipo de desafío / s.

El desafío será limpiar los datos, por ejemplo, ¿cómo define exactamente qué es “” occidental “frente a otros medios? ¿La fuente de publicación? ¿El escritor o la atribución? ¿Qué pasa con los escritores fantasmas o las noticias que aparecen en los medios orientales pero realmente iniciadas por escritores occidentales y todas las permutaciones en el medio?

Si se utiliza un análisis automatizado, por ejemplo, clasificación ML Para sesgos o no sesgados: ¿Cómo planificar las particiones de datos para el conjunto de entrenamiento? Conjunto de validación cruzada?

¿Realmente tiene suficientes ejemplos de referencia de medios no sesgados? Tal vez sí tal vez no. Tal vez necesiten digitalizarse aún si resulta que el periodismo justo solo existía antes de la era de la computadora (no digo que lo sea. Solo qué pasa si la ilustración del escenario).

El desafío secundario es qué tipo de PNL será bueno para usar. por ejemplo, guante? ¿intención? ¿Análisis de los sentimientos? ¿Qué pasa con los medios no escritos en inglés? ¿Tiene suficiente referencia de corpus solo para fines de PNL? ¿Versión NLTK en dialectos X? ¡El lenguaje, el idioma y los mensajes subliminales utilizados en ciertas expresiones de los medios es un ejercicio difícil por sí mismo!

Finalmente. ¿Qué pasa si el sesgo de los medios (si se demuestra que existe) es solo una consecuencia del sesgo de observación en lugar del sesgo del escritor? ¿Significa que el sesgo comenzó desde la fuente de información?

Entonces, teóricamente, este análisis puede hacerse. El punto preocupante es cuán objetivo sería también el análisis de datos y representaría adecuadamente toda correlación y causalidad.

Pero es un buen proyecto (académicamente, si nada más).

En mi humilde opinión, los humanos usarán su propia inteligencia, experiencia y sesgos también para filtrar los medios que no coinciden con su visión del mundo … por lo que el sesgo X probablemente no escuchará a los medios Y ya que pensarán que los medios Y están predispuestos contra X. Etc. entonces el ciclo continúa y todos tendemos a agruparnos en nuestros propios prejuicios.

Para muchas personas, suspender sus sistemas de creencias para escuchar otros puntos de vista es un ejercicio duro y no trivial en el contexto de nuestro mundo digital acelerado y la sobrecarga de noticias / medios

More Interesting

¿Cuáles son algunos buenos proyectos de ciencia de datos?

¿Cuál es el escenario actual / las perspectivas futuras de la ciencia de datos en la India en comparación con Silicon Valley?

¿Cómo se transfiere una persona trabajadora a tiempo completo a la ciencia de datos?

¿Es necesario implementar algoritmos principales de aprendizaje automático desde cero al menos una vez para obtener una pasantía en ciencia de datos en una empresa prestigiosa?

¿Cuál es un instituto de capacitación en big data en Bangalore?

En el aprendizaje automático, si no sé mucho sobre la corrección de lo anterior, ¿puedo tratar de corregir el modelo a través de grandes cantidades de datos de entrenamiento?

¿Sería la programación asincrónica una habilidad importante para un ingeniero de datos?

¿Qué tan importante es la teoría de juegos para un científico de datos?

¿Qué distribución de Linux es más adecuada para principiantes y entusiastas de la ciencia de datos / big data?

¿Cómo utilizan los bancos la minería de datos?

En ajedrez, ¿por qué es tan ventajoso jugar al blanco?

¿Qué tan buena es la colocación cooperativa para el programa de Big Data en SFU? ¿Cómo son las oportunidades de trabajo para el programa de Big Data en Vancouver para graduados de SFU?

¿Es la ciencia de datos una sólida trayectoria profesional o simplemente otro rol sensacional que desaparecerá después de unos años de prominencia?

¿Cuáles son las habilidades necesarias para obtener un trabajo como analista de datos o científico de datos para alguien que acaba de completar una licenciatura en ingeniería?

¿Cuáles son buenas maneras de evaluar los temas generados al ejecutar LDA en un corpus?