Los valores atípicos son valores de Entity-Pair que pueden arrojar todo su clasificador o modelo de entrenamiento fuera de la base.
Ejemplo: en un clasificador de ingresos / activos promedio anual de 50-100 personas si incluye a Bill Gates, automáticamente todos en ese estudio se convierten en millonarios en promedio. Esto casi seguramente conducirá a un alto valor de falsos positivos y falsos negativos.
Un valor atípico no es un valor falso o vacío de significado. Es definitivo y preciso, pero cuando está vinculado con las otras tuplas en su modelo, simplemente no está en el mismo rango. Si tuviera que arrojar un par de valores atípicos en un conjunto de datos, lo que haría un clasificador exitoso es vincularlos todos, ya que son diferentes a otros WRT. Cuán diferente se basará en las condiciones que pones en el clasificador.
Donde como, el ruido es basura. Nula, información nula que no es útil en absoluto, bajo ninguna circunstancia. Los conjuntos de datos tienen esos también. Digamos que hay 2 columnas en su conjunto de datos. “Profesión e ingresos”. Y tienen alrededor de cien mil registros. De estos 100,000, digamos que 50 son del tipo en el que la profesión está listada correctamente, pero la columna de Ingresos tiene términos como: “pastel”, “pastelería”, “hello kitty” o “pikachu”, etc., o digamos durante la transmisión. 50 registros fallaron y se transmitieron parcialmente o mientras la conversión de un formulario .csv / .xls de alguna manera perdieron su valor inicial y ahora muestran algunos literales basura como estos:
Cualquier carácter ASCII que vea en el cuadro. A veces esto sucede. Luego, todos estos registros son Ruido y deben eliminarse de su conjunto de datos para que no falle su modelo.
Un valor atípico no hará que su modelo falle. Solo la respuesta es defectuosa (… la mayoría / algunas de las veces se basa en la cantidad de registros y la cantidad de valores atípicos).
Donde como, el ruido casi seguramente fallará su modelo. 9 de cada 10 veces.
- ¿Cuál es el activo más valioso que Google creó con su investigación de autos sin conductor? ¿Son datos, algoritmos o qué?
- ¿Cuál es el alcance y la aplicación del aprendizaje automático y la inteligencia artificial en el campo de la defensa?
- ¿Funcionarán múltiples electrodomésticos en un sistema operativo uniforme en el futuro? o simplemente hay una necesidad de trabajar en esta dirección? ¿Si es así, entonces cómo?
- ¿Se puede usar la suma de todo el conocimiento sobre Quora para la inteligencia artificial?
- ¿Cuáles son algunos algoritmos de inteligencia artificial necesarios para los desarrolladores de juegos?