Cómo clasificar si un artículo de noticias es falso o real utilizando el aprendizaje automático

Gracias por A2A.

Hay varias formas de hacer esto, pero el espectro del género de noticias es el problema principal, formalmente podemos afirmar que la distribución del género de noticias será directamente proporcional al coeficiente de complejidad / eficiencia del sistema.

Exploremos algunas técnicas / enfoques para resolver este problema.

1. Análisis indexado basado en datos del motivo:

diseña su sistema de base de datos de manera que cada fragmento de memoria asignado represente un motivo (tema), es decir, Barak Obama, idiota (Trump 😛), elección UP, etc. Ahora utiliza técnicas de aprendizaje en línea / mejora de características para mantener su base de datos actualizada sobre ese tema, ahora Si ve una nueva noticia con respecto a esa técnica, puede hacer minería en las redes sociales, aprender en línea a descubrir la verdad real acerca de las noticias. El uso de Google Analytics también puede jugar un buen papel.

2. Minería generalizada basada en la confianza en línea:

Este es un conjunto súper de solución. En estas técnicas, usted descubre pocos sitios web de noticias buenos, nacionales e internacionales, y les da un puntaje de confianza basado en su corrección histórica de las noticias, y cada vez que entra en juego un nuevo artículo de noticias, simplemente busca estos sitios web y ver si está presente allí o no y, por lo tanto, utilizando el puntaje de confianza puede predecir / validar la exactitud del artículo de noticias.

PD: honestamente, es más un problema de aprendizaje generalizado que una clasificación total.

Déjeme saber si usted necesita más información . Puedes seguirme en Quora (totalmente opcional: D)

¡¡prestigio!!:)

Piensa en ello como humano:
Un artículo ha publicado en un periódico. En general, solíamos creer que ese incidente o ese hecho es una verdad. Si conocemos ese dominio, solo nosotros podemos saber si la noticia es real o falsa. Por ejemplo, si hubo una nueva publicación sobre un botín en un hotel cercano, al principio puede creer en ese incidente y considerarlo como VERDADERO. Ahora, cuando sales y encuentras que el hotel está funcionando perfectamente bien, no ocurrió ningún botín. Ahora tiene el hecho de que prueba que el artículo era FALSO.
Piense en ello como una máquina:
En el aprendizaje automático, puede clasificar en función de hechos y cifras. Al principio, su ML algo puede dar una clasificación incorrecta, pero eventualmente a medida que obtiene los datos y la información correctos puede corregir su predicción. Hay muchos algoritmos de clasificación, bayes, DT, PCA, NN, etc.

Decir que un artículo publicado es real o falso a veces también es difícil para los humanos. Me gustaría saber sobre su conjunto de datos, entonces solo puedo comentar sobre qué algoritmo de clasificación debe implicar.