¿Qué tan rápido es el algoritmo de clasificación altamente paralelo más rápido, teóricamente? Quiero decir, la clasificación puede hacer tantos hilos separados como desee y todos se ejecutan simultáneamente. ¿Mejoraría sobre el límite [math] \ Omega (n \ log n) [/ math] para un solo subproceso?

La primera pregunta es difícil: encontrar el algoritmo de clasificación altamente paralelo más rápido, teóricamente, requiere una prueba matemática de que no hay una mejora asintótica posible.

La segunda pregunta es mucho más fácil: aunque existe una prueba de que no puede mejorar el resultado O (n log n) para un tipo de comparación, en el número de comparaciones, sí … puede distribuir esta carga de trabajo para mejorar el rendimiento.

Puede hacerlo sincronizando sus subprocesos para operar en diferentes partes de la misma memoria compartida, en épocas de cierta profundidad. Cada subproceso necesita solo una cantidad constante de memoria para el mantenimiento (saber qué índices comparar). La teoría aquí es la de una red de clasificación.

Se sabe que varios enfoques proporcionan una profundidad (número de épocas) de “tiempo paralelo” (con hilos ilimitados) de [matemáticas] O ((log (n)) ^ 2) [/ matemáticas]. Por ejemplo, Batcher impar-incluso mergesort – Wikipedia y clasificador Bitonic – Wikipedia documentan dos de estos bien.

En la práctica, si no tiene los hilos (bueno, los núcleos), puede o no obtener una aceleración, con este tipo de enfoque. El número de comparaciones es [matemáticas] O (n (log (n)) ^ 2) [/ matemáticas]. En el peor de los casos, con 1 subproceso, esto aumenta el tiempo en un factor de log n.

AlgoritmosAlgoritmos de clasificaciónInformática teóricaProgramación informática

Related Content

¿Alguien sabe de una prueba de acceso público de que la poda alfa beta funciona?

¿Hay alguna manera de colapsar una expansión de Maclaurin a la función original?

Sea m una máquina de turing y sea w una corriente de entrada de m. ¿Cómo puedo definir el tiempo de ejecución tm (w) de m en la entrada w?

Cómo ser más competente en matemáticas por mi cuenta

Informática teórica: ¿se puede crear una máquina que sea más poderosa que una máquina de turing?

¿Cuáles son los mejores libros sobre teoría de grafos?

¿Cuál es una manera fácil de entender la física?

No creo que al ordenar usando varios procesadores (subprocesos) se mejore desde O (nlogn). La complejidad del algoritmo se calcula utilizando el número de operaciones que se necesitan para completar. Entonces, incluso si se paraleliza, el tiempo de ejecución general se reducirá, pero no el orden de complejidad. Puede aumentar ya que se requiere una operación de fusión después de la finalización de múltiples procesadores (hilos).

Para la reducción del tiempo de ejecución, el límite teórico se puede obtener de la ley de Amdhal o de la ley de Gustafson.

Consulte el artículo de Wikipedia sobre lo anterior.

Homer Quan

La ordenación de matrices 2D es mejor para las matrices de procesadores 2D.

Verifique cómo hacer un ” ShearSort” en mallas 2D. Si tiene N núcleos, esto debería ser rápido. Asegúrese de que todos los procesadores puedan comunicarse tanto vertical como horizontalmente (no solo en software sino también por soporte de hardware).

O (Nlog (sqrt (N))) para 1 núcleo.

O (log (sqrt (N))) para N núcleos

Introducción a la clasificación paralela en topologías basadas en malla

Algoritmo de clasificación de corte para ordenar una matriz * n en O (n ^ 2logn) en orden de serpiente

Kurt Guntheroth

Depende de los datos. Si conoce el rango y la distribución (en condiciones ideales, distribuidas de manera uniforme). La ordenación de contador te dará Ω (n). La mejor clasificación de cubos se acercará a eso (paralela o no).

Kurt Guntheroth

Parece que esto podría ser en cualquier lugar tan efectivo como la clasificación de burbujas para un oráculo, dependiendo del significado de “tener” y si los hilos son independientes. Si está altamente paralelizado, podría depender más de la velocidad de comunicación que un mísero O (log n) número de “pasos”. Perdón por una respuesta informal.

Narasimman Ramiah

Creo que un tipo de comparación usando n procesadores se ejecuta en tiempo de registro (n). Eso es solo fuerza bruta. Puede haber formas más rápidas.

Homer Quan

Compruebe el método paralelo de Batcher en Knuth vol. 3)

Kurt Guntheroth

More Interesting

Se nos dan probabilidades [matemáticas] P (A) = P (B) = P (C) \ geq 2/3 [/ matemáticas] y sabemos que [matemáticas] P (A \ cap B \ cap C) = 0 [/ mates]. ¿Qué podemos decir sobre [matemáticas] P (A) [/ matemáticas]?

¿Cuál es el significado del XOR Lemma de Yao?

¿Será difícil ingresar a una escuela de posgrado en astronomía de un entorno no tradicional (especializaciones diferentes a astronomía, física, matemáticas, CS, etc.)?

¿Cuáles son algunos buenos canales de matemáticas en YouTube por los que todos los estudiantes de CS deben pasar?

¿Cómo se llama el número de elementos en un conjunto?

¿Qué otras cosas debo probar aparte de programar o codificar?

¿Cuál es la diferencia entre teoría de la computación y algoritmo?

¿Qué papel juega la habilidad matemática en la ingeniería informática o la codificación?

¿Cuáles son las aplicaciones de las matemáticas en la programación?

¿Los problemas de optimización en el aprendizaje profundo son típicamente convexos o no convexos?

¿Qué es una explicación intuitiva de P = NP?

¿Habría algún límite matemático potencial para una máquina física con el propósito de replicarse a sí mismo?

¿Las matemáticas son importantes en la programación?

¿Cómo debo aprender matemáticas para el algoritmo de programación?

Proyectos teóricos de informática o desarrollo de aplicaciones, ¿qué le sugerirías a los estudiantes de primer año de informática?

Web Analytics