Creo que las áreas más grandes en los conceptos de computación en la nube estarán en el ámbito de los grandes datos. También hay muchos problemas interesantes si está buscando crear una startup. Esos problemas se refieren principalmente a la implementación y a cómo trasladar las empresas existentes a modelos de computación más nuevos.
En el lado de Big Data, las áreas que encuentro interesantes son acerca de cómo combinar diferentes conjuntos de datos de manera significativa. Un requisito en el futuro será determinar métodos efectivos y eficientes para usar los datos existentes para actividades de big data sin afectar la forma en que ya se almacenan y usan.
Una de las cosas que ha traído el movimiento NoSQL (y los datos no estructurados en general) es la dependencia de la aplicación para proporcionar contexto y significado a esos datos. Ese contexto y significado no están bien capturados de una manera que pueda transferirse a otros usuarios potenciales de los datos. En un modelo de datos relacionales, puede encontrar mucho significado inherentemente en la estructura de datos en sí.
- ¿Cuáles son algunos buenos cursos en Hyderabad para Python y R para ciencia de datos?
- ¿Es obligatorio para un aspirante a científico de datos conocer las técnicas de manejo de Big Data?
- ¿Qué datos debo tener en cuenta al comparar el crecimiento de los países?
- ¿Cómo es la práctica en Facebook como científico de datos?
- ¿Qué tipo de métodos de ciencia de datos se pueden aplicar a los datos de tráfico web?
Otros aspectos son sobre qué tipos de datos se pueden combinar de manera significativa y cuáles no. Veo muchos ejemplos de datos estadísticamente irrelevantes que se usan juntos. Produce un buen tablero o gráfico de información, pero en última instancia no tiene sentido para un análisis real porque los datos en realidad no se combinan de la manera propuesta. Puede ser posible desarrollar modelos para limitar esto o al menos proporcionar alguna información sobre qué datos pueden mostrar causalidad y cuáles pueden mostrar simplemente correlación.
Usted menciona un interés particular en PaaS e IaaS. El lado de la plataforma es rico para explorar los conceptos anteriores, así como para crear métodos y algoritmos más eficientes para combinar múltiples conjuntos de datos dispersos y fuentes. Ifttt.com es un buen ejemplo de esto con los sitios sociales populares, pero me gustaría ver la capacidad de combinar cualquier plataforma con otra más fácilmente.
Por el lado de IaaS, uno de los principales obstáculos que escucho es sobre las inseguridades del hipervisor. Existen métodos para hackear el hipervisor para obtener el control de otra VM que se ejecuta en el mismo hipervisor. Las técnicas actuales no son adecuadas para prevenir o exponer este comportamiento. Otra área que me gustaría ver es la computación verdaderamente distribuida a lo largo de las líneas de cada PC, computadora portátil, servidor y dispositivo en una organización que pueda alimentar partes de la computación total para esa organización. Cada tarea de procesamiento puede procesarse como una que se envía a la organización, convirtiendo efectivamente a toda la oficina en una gran supercomputadora. Hay mucho por hacer con algoritmos, ciencias de la computación y aplicaciones para que esto funcione sin problemas.