¿Qué algoritmos de máquina requieren escala / normalización de datos?

Todos los algoritmos basados en la distancia requieren escala. Esto incluye todos los algoritmos de ajuste de curvas (regresiones lineales / no lineales), regresión logística, KNN, SVM, redes neuronales, algoritmos de agrupamiento como el agrupamiento de k-medias, etc.

Los algoritmos que se utilizan para la factorización de la matriz, la descomposición o la reducción de la dimensionalidad como PCA, SVD, máquinas de factorización, etc. también requieren normalización.

Los algoritmos que no requieren normalización / escala son los que se basan en reglas. No se verían afectados por ninguna transformación monotónica de las variables. La escala es una transformación monotónica: el orden relativo de un valor menor a mayor en una variable se mantiene después de la escala. Ejemplos de algoritmos en esta categoría son todos los algoritmos basados en árboles: CART, bosques aleatorios, árboles de decisión potenciados por gradiente, etc. Estos algoritmos utilizan reglas (series de desigualdades) y no requieren normalización.

Además, los algoritmos que se basan en distribuciones de las variables, como Naive Bayes, tampoco necesitan escalarse.

AlgoritmosAprendizaje automáticoClasificación

Related Content

¿Qué consejos y técnicas puedo aprender para retener mi comprensión de algoritmos y estructuras de datos?

¿Cuál es el mejor factor de contracción para un tipo de peine? ¿Por qué?

¿Resolver problemas en Topcoder / Codeforces es una buena manera de aprender Java Collections Framework?

¿Implementar un algoritmo de detección de esquinas es un buen ejercicio para la visión por computadora?

¿Cuál es el algoritmo más fácil para encontrar el camino más corto en un robot seguidor de línea para un principiante?

¿A los programadores les gustan las funciones recursivas? ¿Por qué o por qué no?

Chip-wise es suficiente GPU, ¿o hay otras pilas de hardware que puedan competir?

More Interesting

¿Qué algoritmos usa Quora para restringir que el contenido de ciertos escritores se transmita tanto como otros?

¿Qué son los algoritmos gráficos?

Para verificar que la lista vinculada es circular, ¿cuál será la condición del bucle? Conozco un proceso adicional como tomar dos punteros. Por favor sugiérame

¿Qué algoritmo es mejor para datos no estructurados?

¿Qué es el algoritmo TDIDT?

¿Cuáles son las amplias variedades en programación dinámica que se preguntan con frecuencia en los concursos de codificación?

¿Cuáles son las mejores prácticas para implementar la paginación en un sitio web con una gran cantidad de datos?

Cómo ordenar la lista de números dada en orden de registro (n)

¿Cómo se puede resolver este problema mediante la búsqueda binaria, Shil y la fábrica de juguetes?

¿Cómo podemos resolver el siguiente problema en O (n)?

Cómo calcular óptimamente grandes factoriales de orden 10 ^ 5 para operaciones repetidas (por ejemplo, encontrar permutaciones)

¿Cuál es el libro más legible y efectivo para aprender introducción a los algoritmos informáticos?

Teoría de conjuntos: ¿un subconjunto es un tipo de intersección?

¿Cómo calculo el antilog de -0.7006?

¿Qué algoritmo se usa para detectar "No más interruptores posibles, barajar" en la saga Candy Crush?

Web Analytics