¿Por qué se requieren conocimientos de aprendizaje automático para un periodista de datos? ¿Por qué la exploración y visualización de datos por sí sola no es suficiente para el periodismo de datos?

Nunca he oído hablar de tal requisito, ¿dónde viste esto?

El aprendizaje automático hasta ahora ha tenido un uso muy limitado en el periodismo. No digo que nunca haya sucedido. Es solo que no ha habido muchos comentarios detallados al respecto. Puedo pensar en dos proyectos de investigación bien conocidos que han hablado sobre el aprendizaje automático en sus metodologías:

  • La Constitución de Atlanta Journal “Médicos y abuso sexual”: sobre la investigación del AJC sobre la mala conducta del médico
  • Reuters “La Cámara del Eco” La Cámara del Eco

Tendría que pedirles directamente más detalles. Pero a primera vista, con lo que sabemos de cómo se hace tradicionalmente el periodismo y los muchos métodos poderosos que pueden ser mejores para los periodistas que el aprendizaje automático, no preveo muchos beneficios directos / obvios del aprendizaje automático cuando viene a hacer periodismo en un futuro cercano.

Pocos proyectos de periodismo funcionan con “big data”, es decir, conjuntos de datos que tienen cientos de millones de filas o más), para empezar. Además, gran parte del periodismo empresarial se basa en la construcción y recopilación de los propios datos de una manera inherentemente escalable.

Pero el aprendizaje automático no se trata solo del volumen, sino de la capacidad de adaptarse independientemente a los nuevos datos. Adaptarse a los nuevos datos es algo que a los periodistas básicamente no se les exige a diario, por hora o por segunda vez, al menos no de la manera en que lo hace un científico de datos de Netflix.

Por ejemplo, cada reportero experimentado sabe cómo se ve la evidencia de maldad en su ritmo. El problema general para un reportero es encontrar esa evidencia * eficientemente *. Un periodista de salud tiene que pasar una gran cantidad de tiempo siguiendo rastros en papel y haciendo entrevistas. Pero no tienen que anticipar que un hospital va a matar negligentemente a un paciente de una manera totalmente nueva.

En contraste, el científico de datos de Netflix no solo debe saber qué le gustará a un fanático de Star Wars en la colección actual / popular de Netflix. Pero tiene que construir un sistema que pueda adaptarse * instantáneamente y bajo demanda * a una película completamente nueva, y predecir cómo encajará en la colección existente (y siempre cambiante) de Netflix, no importa decirle a ningún usuario aleatorio si le gustaría ver “El ciempiés humano”

El aprendizaje automático no solo no se ajusta a la mayoría del modelo de recopilación de información de informes, sino que no se ajusta a la forma en que el periodismo afirma las cosas en el mundo. Si lees los 2 ejemplos que publiqué, encontrarás que, independientemente del aprendizaje automático que utilizaron, sus afirmaciones se hacen con las mismas afirmaciones y autoridad del periodismo de investigación tradicional.

El algoritmo de un científico de Netflix puede funcionar recomendando un fanático de “Star Wars” para ver “Deep Space 9” en lugar de “Battlestar Galactica”, siempre y cuando la recomendación DS9 sea * lo suficientemente buena * para mantener al fanático entretenido. No existe tal continuo para el periodismo. Si publica una historia alegando que su análisis exhaustivo de datos ofrece un 70% de posibilidades de que un médico local se convierta en un violador violento, su carrera periodística no durará mucho.

Sarah Cohen (https://www.linkedin.com/in/sara…) lo dijo mejor en una conferencia de periodismo computacional el año pasado: el periodismo no hace mucha predicción porque trata de describir el mundo tal como es ** .

Para algunas ideas sobre qué habilidades de datos son más directamente relevantes para el trabajo de periodismo ::

  • Diversión seria con números
  • Detrás de la historia: seguimiento de los agentes de policía problemáticos en Florida
  • Cómo el Sun Sentinel informó sobre su cobertura ganadora del Premio Pulitzer de policías fuera de servicio