¿Cómo explica la localidad de caché el hecho de que la ordenación rápida suele ser más rápida que la ordenación por fusión?

P: ¿Cómo explica la localidad de caché el hecho de que la ordenación rápida suele ser más rápida que la ordenación por fusión?

Mi autoridad para responder a esta pregunta proviene de los experimentos que hice en tiempos de ejecución como parte de mi libro, Optimized C ++ . Recomiendo realizar experimentos antes de hacer afirmaciones sobre el rendimiento.

A1: ¿Qué te hace pensar que quicksort es más rápido que el tipo de fusión? Mi observación de la biblioteca estándar de C ++ ordena std :: sort (), que generalmente se implementa como quicksort, y std :: stable_sort (), que es un tipo de combinación, reveló que std :: stable_sort () es más rápido cuando ambos se realizan sobre una matriz.

A2: Quicksort, como se suele demostrar a los estudiantes universitarios de CS, se implementa sobre una matriz, mientras que la ordenación por fusión se implementa sobre una estructura de datos vinculada. Cuando se compara de esta manera, std :: sort () en una matriz fue aproximadamente un 25% más rápido que list :: sort () en los mismos datos, que es una combinación de clasificación en una estructura de datos vinculada.

Las estructuras de datos vinculados están, por naturaleza, dispersas en la memoria, mientras que los elementos de la matriz están muy juntos. Un desarrollador con mentalidad de rendimiento puede sospechar de la fusión cuando se implementa sobre una estructura de datos vinculada, pero el comportamiento real de la memoria caché puede ser difícil de predecir a partir de una regla general informal como esta.

AlgoritmosAlgoritmos de clasificación

Related Content

¿Qué son los patrones de búsqueda?

¿Cómo obtenemos el número total de formas de la disposición de n cosas distintas en n lugares correspondientes donde ningún elemento está colocado correctamente?

¿Para qué se usan realmente los algoritmos?

Necesito saber cómo describir el cálculo del PageRank de punto fijo. ¿Alguien sabe algo al respecto?

¿Hay algún campo de arranque en EE. UU. Que se centre en C ++ y algoritmos?

¿Cuál es el método de fuerza bruta?

¿Cómo puedo encontrar la ruta más larga de un gráfico bidireccional utilizando el algoritmo BFS?

Quicksort naturalmente explota la localidad de caché porque opera en sub matrices contiguas cortas durante la mayor parte de su tiempo de ejecución.

Por el contrario, mergeseort y muchos otros, como heapsort, realizan lecturas dispersas que no se pueden conocer de antemano y también desperdician el resto de la línea de caché alrededor del valor que realmente necesitan.

Verá, la memoria de acceso aleatorio es un poco inapropiado. Mientras que DRAM tiene casi la misma latencia para cualquier dirección arbitraria, la jerarquía de caché no. Es más eficiente mantener los accesos en un espacio de direcciones pequeño con respecto al tiempo, que es un subconjunto de un espacio de direcciones más grande y así sucesivamente para todos los niveles de caché. Quicksort probablemente usa muchos más niveles de pila que los niveles de caché, pero los explota perfectamente.

Kurt Guntheroth

More Interesting

¿Contamos la estructura original dada mientras contamos el número total de isómeros?

¿Cuál es el mejor método para resolver un problema de 'cuál es el siguiente número en esta secuencia'?

¿Cuál es el método de práctica más eficiente para mejorar las preguntas sobre algoritmos?

¿Cómo podemos encontrar la segunda ruta más pequeña entre dos nodos en un gráfico ponderado / no ponderado de manera eficiente?

Dadas las coordenadas de 3 puntos, cómo encontrar el centro del círculo formado por estos puntos con alta precisión. Para lograr una alta precisión, debe haber algún proceso de división. ¿Hay alguna forma de hacerlo?

Cómo hacer un juego de programa de asesor de IA en Unity3D

¿Cuáles son las buenas implementaciones de búfer circular sin bloqueo en Java?

Cómo ordenar datos multivariados

Cómo explicar el concepto de un algoritmo a un niño

¿Qué esquema o algoritmo de compresión se usa en el formato de video 4K?