Tenemos una serie de N palabras, ¿cómo podríamos clasificarlas con O (N) complejidad de tiempo?

No estoy de acuerdo con otras respuestas. O (n.log (n)) es solo un límite estricto para las clasificaciones in situ y la clasificación de datos de entrada con propiedades de dispersión desconocidas.

Pero si las condiciones son correctas, puede usar, por ejemplo, la clasificación Radix (también conocida como clasificación postal por código postal) para clasificarlas con un costo muy cercano a O (n) .

Acabo de dar la idea (en realidad estoy describiendo la primera etapa de la ordenación relacionada pero más simple de Bucket sort). Imagine que cada palabra comienza con una letra diferente y tiene tantas palabras como letras en el alfabeto, solo leer la palabra una vez permitirá colocarla en el lugar correcto. Por supuesto, esta idea también funciona si tomamos las primeras dos o tres letras en lugar de solo la primera.

Si B es el número de cubos y tiene una buena dispersión de los datos de entrada, la complejidad del tipo se convierte en O (B + n log (n / B)) (esto se debe a que si varias palabras chocan en el mismo segmento, aún deben ser ordenado).

Para fines prácticos, la parte log (n / B) puede verse como una pequeña constante si sabemos que los datos tienen buenas propiedades de dispersión. Por supuesto, la complejidad ahora depende de la longitud promedio de los datos de entrada. Es muy eficiente para conjuntos de datos pequeños (incluso mejor si tiene muchas palabras de entrada idénticas), menos eficiente para palabras más largas.

¿Por qué ordenar por correo? Porque la idea es exactamente la que usan las oficinas de correos cuando clasifican por código postal.

Otra opción podría ser usar un algoritmo de ordenamiento paralelo. Al hacerlo, incluso puede obtener una complejidad de clasificación mejor que O (n) , generalmente O (n / p. Log (n)) donde p es el número de procesadores disponibles. Pero también se le debe advertir que dicho algoritmo también suele tener un alto costo constante y que la complejidad no lo es todo.

Related Content

¿Qué idioma es mejor para comprender la importancia de las estructuras de datos?

¿Cuáles son algunos problemas informáticos para los que no existe un enfoque de fuerza bruta?

¿Mejorará la velocidad de búsqueda y clasificación de algoritmos o hemos alcanzado el límite?

¿Cuál es el número esperado de movimientos necesarios para terminar un juego de serpientes y escaleras?

¿Cuál es la mejor manera de ordenar un terabyte de matriz de datos, cuando tiene RAM limitada (500k), y cada elemento de la matriz tiene un par de elementos de datos, de aproximadamente 1-10k cada uno?

¿Cuál es la mejor computadora portátil para juegos con menos de 1,00,000 INR en India?

¿Dónde puedo aprender Amazon Web Services (Cloud Computing)?

No puedes Si usa comparaciones, la ordenación lleva un tiempo proporcional a [math] n \ log n [/ math]. Si no utiliza las comparaciones, termina con un ordenamiento de cubeta de arriba hacia abajo, pero su complejidad temporal dependerá de la longitud del prefijo común de dos cadenas, y termina de nuevo con un tiempo proporcional a [matemática] n \ log n [/ math].

Así que simplemente usa una clasificación rápida. Es posible adaptar la clasificación rápida específicamente a las cadenas de modo que las comparaciones sean más rápidas (comparando caracteres individuales en lugar de la cadena completa), pero creo que eso es lo mejor que puede hacer.

Shahzad Masud

No puede hacer eso en la complejidad N, pero el mínimo es nLogN (clasificación rápida)

Amir Monfared

More Interesting

Si recibe fondos de miles de millones de dólares y tiene la tarea de crear un motor de búsqueda para competir con Google, ¿cómo sería su motor de búsqueda?

¿Está sesgado el algoritmo de aleatorización del Reproductor de Windows Media?

¿Cuál fue el primer algoritmo ejecutado por computadora?

¿Qué algoritmo es fácil de aprender pero aún tiene una gran importancia?

¿Qué son los patrones de búsqueda?

¿Cómo eliminará elementos de manera eficiente mientras itera una Colección?

¿Nuestro código genético utiliza algoritmos de compresión?

¿Cuáles son los mejores algoritmos de agrupamiento para puntos de datos numéricos multidimensionales?

¿Cómo se le ocurrió al autor la fórmula (programación dinámica) en la editorial CIELRCPT - Editorial (Ciel y Receipt)?

¿En qué tipos de gráfico DFS y BFS producirán el mismo árbol (misma fuente) independientemente de la secuencia de visitas de los vecinos?

¿Aproximadamente cuántas personas en el mundo pueden resolver un cubo rubix sin algoritmos?

Cómo mejorar si he pasado 10 años aprendiendo programación pero aún no puedo resolver la mayoría de los problemas de algoritmos

¿Cuál es el mejor algoritmo de programación que hayas creado?

¿Cuál es el uso en tiempo real de C, C ++, estructuras de datos y algoritmos?

¿Por qué mi método de generador aleatorio no funciona en Java?

Web Analytics