¿Cuál es la mejor estructura y algoritmo de datos para encontrar un valor máximo dentro de un subconjunto de una población de datos que satisfaga alguna condición de rango?

Un árbol de búsqueda binaria con equilibrio automático es una solución simple y eficiente para este problema. Existen varias estructuras de datos específicas que implementan árboles de búsqueda binarios de equilibrio automático. Consulte el artículo de Wikipedia: http://en.wikipedia.org/wiki/Sel…. Cualquiera de ellos debería estar bien.

Específicamente, en cualquier momento tiene aproximadamente 15 * 60 * 500 = 450000 precios actuales. Varios cientos de veces por segundo, quieres
(a) inserte un nuevo precio
(b) elimine un precio anterior que acaba de llegar a los 15 minutos
(c) busque el precio más alto por debajo de algún umbral.
Cada una de estas operaciones lleva tiempo [math] O (\ log (n)) [/ math] en un árbol de tamaño [math] n [/ math]; aquí [math] \ log (n) = 19 [/ math] aproximadamente, por lo que deberían tomar una pequeña fracción de milisegundo.

Para facilitar (b), querrá una manera de identificar eficientemente el precio más antiguo para poder eliminarlo; simplemente mantener todos los precios en un buffer de anillo hace el trabajo. El anillo de búfer y el árbol ocupan espacio [matemático] O (n) [/ matemático], por lo que tal vez decenas de megabytes en total, menos si pones esfuerzo en ese aspecto.

Related Content

Cómo dividir una matriz en 2 nuevas variables de matriz y encontrar el promedio de ellas

¿Es la estructura de datos y el conocimiento del algoritmo un requisito previo para los problemas en Topcoder?

¿Cuál es la estructura de datos utilizada para realizar la recursividad?

¿Cómo se escriben los algoritmos de espacio?

¿Qué algoritmo se puede usar para pasar de datos de frecuencia a una nota musical?

¿Cuál es más rápido: clasificación rápida o burbuja, y por qué?

¿Qué servidores de chat de video / texto recomienda para un sitio de redes sociales de alto volumen?

Depende de algunas cosas:

1) Tasa de adición / eliminación de datos.
2) Tasa a la que las consultas son problemas
3) Rango de los datos, que en su caso son los precios de una mercancía. Suponiendo que son de la misma entidad, dudo si cambiaría mucho

Para 1) hay una compensación natural entre mantener una cola y escaneo secuencial o un BST de auto-equilibrio y borrar periódicamente.

Para 2) En caso de una tasa de consulta extremadamente alta, tendría sentido almacenar en caché los resultados sobre cualquier estructura de datos utilizada.

Para 3) Si el rango de datos no es muy grande, se podría mantener una granularidad fija de rangos, por ejemplo en un hashmap (digamos H) donde la clave sería rangos y valores sería el par del precio real y la marca de tiempo. El mejor precio para el comienzo. Ahora, cada vez que se realiza una actualización u, H se actualiza en la posición apropiada si u es mejor (precio más alto y punto de tiempo válido … su restricción de 15 minutos) que el valor establecido anteriormente.

Las consultas son búsquedas constantes con un poco de compromiso en la precisión.

Greg Price

More Interesting

¿Las estructuras de datos y los algoritmos son universales en todos los idiomas?

¿Existe un algoritmo para generar todas las combinaciones de manera ordenada?

¿Alguna vez ha enviado un artículo científico sobre un algoritmo que funciona tan bien como los métodos más modernos pero realmente no sabe por qué? ¿Puedes decir 'tal vez' al explicar tu método?

Cómo ser bueno en el desarrollo de algoritmos muy complejos

¿Qué algoritmos necesito aprender para resolver al menos 5 problemas en los concursos de CodeChef Long?

¿Alguien ha utilizado un algoritmo genético para resolver la ecuación de Schrodinger (o alguna ecuación diferencial)?

¿Qué es el recorrido del árbol y por qué los necesita?

¿Cuál es la técnica / algoritmo utilizado por mensajeros como WhatsApp y BBM para comprimir imágenes?

Cómo encontrar el segundo número más pequeño de 3 entradas sin usar la matriz

¿Por qué se usa la compresión de backend?

¿Por qué el algoritmo de búsqueda binaria no es adecuado para usar en una tabla con punteros?

Estoy tratando de incrementar un elemento de matriz de caracteres inicializado a cero pero no puedo, ¿por qué?

Como estudiante universitario, ¿debería centrarme más en aprender estructuras de datos y algoritmos o aprender tecnologías como aplicaciones, web, desarrollo de iOS, etc.?

¿Por qué hay una necesidad de matrices dinámicas si tenemos matrices de longitud variable?

¿Cómo funciona el algoritmo en LinguaLift?

Web Analytics