¿Cuáles son algunos de los temas de investigación en el campo de Hadoop Framework?

1.Modelado de políticas de colocación y replicación de bloques en HDFS
2. Expansión del espacio de nombres HDFS
3.Diseño de seguridad de Hadoop
Puertos 4.Hod a varios sistemas de colas de trabajo del campus
5. Integración de la virtualización (como Xen) con las herramientas de Hadoop
6. Aprovisionamiento de servicios de larga duración a través de HOD
7. Un marco compatible con Hadoop para descubrir la topología de la red e identificar y diagnosticar hardware que no funciona correctamente
Página en 8.un marco mejorado para la depuración y el rendimiento, optimizando los trabajos de Hadoop y hadoop.
9.Mapa reduce las mejoras de rendimiento
10. Optimización de ordenamiento aleatorio en el marco de MR
Estos son algunos temas en los que puede hacer su investigación y descubrir algún resultado productivo. Además, me gustaría sugerir algunos innovadores que pueden ser beneficiosos, como puede crear un clúster que use algunas características únicas de cada sistema de correo y en un solo clúster puede agregar todas las características de diferentes sistemas de correo diferentes. Para obtener más temas e ideas, puede visitar Big Data Training, Big Data Online Training, Big Data Courses | Intellipaat.com

Quizás lo primero que debe hacer es reconocer que la pila Hadoop ha evolucionado, y que lo que se ha construido sobre ella es mucho más capaz que Hadoop 1.0., Incluyendo Apache Spark y Berkeley Data Analytics Stack, o BDAS. Esa pila incluye un ciclo de aprendizaje; en esencia, la pila puede poner en práctica los resultados obtenidos mediante el uso de la biblioteca de aprendizaje automático Spark, o MLLib.

Hadoop 1.0 es solo almacenamiento y procesamiento de grandes datos. Por el contrario, gran parte del poder del BDAS evolucionado proviene del aprendizaje automático, un medio para ir más allá de la programación humana hacia un reconocimiento más profundo de la imagen, la comprensión del lenguaje, etc. Con un ciclo de aprendizaje automático, las máquinas aprenden continuamente y agregan esa capacidad adicional para El sistema con el tiempo. Piense en el aprendizaje automático como una extensión de la programación humana, la capacidad del sistema que no puede ser posible solo con la codificación humana. Los autos sin conductor no serían posibles sin el aprendizaje automático.

La pila de análisis de datos de Berkeley: presente y futuro – DataEDGE 2015

primero es una buena idea prepararse para su maestro a partir de ahora, segundo hay muchos temas para investigar en Hadoop y mapreduce y estos son algunos de ellos:
1. programación
2. Datos asimétricos en Mapa y Reducir
3. problema rezagado y ejecución especulativa “mi campo de interés ahora”
4. localidad de datos
5. HDFS

y también si va al sitio web de Ieee explorer y escribe Hadoop o HDFS o mapreduce, le mostrará todos los documentos a través de los años sobre temas de hadoop y mapreduce

para que pueda leer un artículo sobre cada tema y determinar su interés

quizás … marco de gestión de datos, marco de ejecución distribuido, alineación de secuencias múltiples en hadoop, rendimiento de reducción de mapas en hadoop … o para un tema más divertido: ¿Es posible que Google no se hubiera desarrollado sin hadoop?

Puede consultar esta clase en línea de Stanford, Reza Zadeh. Los organizadores del curso son uno de los mejores investigadores en el campo de la informática distribuida. Espero eso ayude.