¿Cómo tenemos equilibrio de carga en los reductores en caso de sesgo de datos?

Pruebe Skewtune – Adaptive Hadoop MapReduce – Alojamiento de proyectos de Google

Documento relacionado: – http://nuage.cs.washington.edu/p…

Lo he intentado … Es bastante decente … También puede lidiar con Mapper Side Skew

¿Hay algún conjunto de datos biológicos periódico con respecto al tiempo y forma un bucle cuando se traza entre ellos pero no contra el tiempo? Mira el comentario!
¿Cuál es la diferencia entre datos e información en términos informáticos?
¿Cuáles son los mejores institutos de capacitación y certificación de Big Data y Hadoop en Bangalore?
Cómo elegir un algoritmo de minería de datos al minar un conjunto de datos real
¿Existe un papel significativo para el big data en la economía?

Los equilibrios se cargan dinámicamente al reorganizar grupos clave sobre la marcha … utiliza la heurística como un “reductor que está inactivo”

Aquí hay una encuesta decente sobre este tema: – http://nuage.cs.washington.edu/p…

Otro documento de encuesta más reciente: – http://www.cs.cmu.edu/~kair/pape…

Pero si su implementación / aplicación puede permitir la división de grupos de claves (es decir, no se requiere una acción de reducción global por clave), puede leer un documento publicado recientemente por mí que trata el problema de diseñar una función eficiente de Particionamiento de claves optimizando un objetivo – Anotación de entidad a escala web usando MapReduce

Apache HadoopBig DataData ScienceMapReduce

Related Content

¿Cuándo salió el término Big Data y cómo difiere de los datos normales?

¿Los científicos de datos suelen utilizar el análisis discriminante lineal? ¿Por qué o por qué no?

¿Cuál es la diferencia entre la tabla de clasificación pública y privada en Kaggle?

¿Cuál es la mejor tecnología, ciencia de datos o big data?

¿Cuál es la herramienta de big data más fácil que se puede utilizar para el aprendizaje automático?

¿Cómo se puede utilizar la asignación al azar para evaluar la independencia de las variables?

Pruebas A / B: ¿Es útil el diseño de una base de datos de esquema en estrella para las empresas tecnológicas que experimentan continuamente?

More Interesting

¿Cuáles son los criterios de selección para la admisión en un programa de maestría en Ciencias de la Computación, Data Science Strand? ¿Se da preferencia a la experiencia laboral?

¿Es Python el lenguaje de programación más importante para el análisis de datos?

¿Qué es mejor para el análisis de datos, Python (usando las bibliotecas NumPy, Scipy, etc.) o Hadoop?

¿Cómo puedo seguir una carrera en seguridad de datos?

¿Qué necesito saber para convertirme en científico de datos?

Cómo iniciar una nueva empresa de ciencia de datos en un país en desarrollo como Bangladesh

¿Cuál es la mejor práctica para el preprocesamiento de datos antes de un modelo de aprendizaje automático?

¿Por qué debería elegir Krux como mi plataforma de gestión de datos?

¿Cuáles son las preguntas más frecuentes sobre entrevistas de ciencia de datos?

¿Con qué lenguaje de programación debo comenzar para la ciencia de datos, considerando que soy nuevo en ambos?

¿Cuáles son algunos algoritmos de aprendizaje automático menos conocidos, que no son tan famosos pero potentes?

¿Cuáles son los temas candentes para una tesis de maestría relacionada con el aprendizaje profundo o big data?

Ciencias de datos o nube, ¿cuál es mejor?

¿Cuál es la forma más efectiva de estructurar un equipo de ciencia de datos?

¿Puedo convertirme en desarrollador full stack y científico de datos en 1,5 años?

Web Analytics