Sin aceptar necesariamente la premisa de la pregunta, la respuesta teórica es sí.
Se puede analizar cualquier tipo de conjunto de datos (en esta pregunta, los “medios”) pero cada uno tiene algún tipo de desafío / s.
El desafío será limpiar los datos, por ejemplo, ¿cómo define exactamente qué es “” occidental “frente a otros medios? ¿La fuente de publicación? ¿El escritor o la atribución? ¿Qué pasa con los escritores fantasmas o las noticias que aparecen en los medios orientales pero realmente iniciadas por escritores occidentales y todas las permutaciones en el medio?
- ¿Entrar en Big Data es una buena opción ahora?
- ¿Cuál es la diferencia entre Big Data y Hadoop?
- ¿Qué trabajos son más abundantes, puestos actuariales o puestos de ciencia de datos? ¿Requiere esto último un título de maestría o superior?
- ¿Cómo se usa MySQL en ciencia de datos?
- ¿Cuáles son las aplicaciones de los procesos estocásticos, particularmente en ciencia de datos y aprendizaje automático?
Si se utiliza un análisis automatizado, por ejemplo, clasificación ML Para sesgos o no sesgados: ¿Cómo planificar las particiones de datos para el conjunto de entrenamiento? Conjunto de validación cruzada?
¿Realmente tiene suficientes ejemplos de referencia de medios no sesgados? Tal vez sí tal vez no. Tal vez necesiten digitalizarse aún si resulta que el periodismo justo solo existía antes de la era de la computadora (no digo que lo sea. Solo qué pasa si la ilustración del escenario).
El desafío secundario es qué tipo de PNL será bueno para usar. por ejemplo, guante? ¿intención? ¿Análisis de los sentimientos? ¿Qué pasa con los medios no escritos en inglés? ¿Tiene suficiente referencia de corpus solo para fines de PNL? ¿Versión NLTK en dialectos X? ¡El lenguaje, el idioma y los mensajes subliminales utilizados en ciertas expresiones de los medios es un ejercicio difícil por sí mismo!
Finalmente. ¿Qué pasa si el sesgo de los medios (si se demuestra que existe) es solo una consecuencia del sesgo de observación en lugar del sesgo del escritor? ¿Significa que el sesgo comenzó desde la fuente de información?
Entonces, teóricamente, este análisis puede hacerse. El punto preocupante es cuán objetivo sería también el análisis de datos y representaría adecuadamente toda correlación y causalidad.
Pero es un buen proyecto (académicamente, si nada más).
En mi humilde opinión, los humanos usarán su propia inteligencia, experiencia y sesgos también para filtrar los medios que no coinciden con su visión del mundo … por lo que el sesgo X probablemente no escuchará a los medios Y ya que pensarán que los medios Y están predispuestos contra X. Etc. entonces el ciclo continúa y todos tendemos a agruparnos en nuestros propios prejuicios.
Para muchas personas, suspender sus sistemas de creencias para escuchar otros puntos de vista es un ejercicio duro y no trivial en el contexto de nuestro mundo digital acelerado y la sobrecarga de noticias / medios