Cómo hacer un trabajo orientado a la investigación en big data

En primer lugar, gracias Ayush Kumar por A2A

El tema de la tesis será algo que debería definir. (Usted y su director de investigación) generalmente el tema depende del problema que enfrenta o lee (la investigación es una gran cantidad de conferencias) al respecto, y su objetivo es resolverlo ( probablemente no al 100%).

Te daré algunos de los campos principales en los que puedes encontrar un gran tema para tu tesis:

Genética : algunos buenos artículos científicos (para hacerse una idea)

  • Artículos recientes | Big Data y Genética y Genómica | The Scientist Magazine®
  • Identificación de factores genéticos en la enfermedad con Big Data
  • Los científicos usan grandes datos para descubrir una causa genética para la esquizofrenia | ExtremeTech
  • Los registros médicos del futuro pueden incluir secuencias del genoma y rastreadores FitBit.

IoT : gran campo para Big Data.

  • El poder de IoT y Big Data | ZDNet.
  • Big data vs. Internet de las cosas: cómo difieren los proyectos.
  • El impacto de Internet de las cosas en Big Data.
  • Grandes datos para desbloquear el valor del internet industrial de las cosas.

Los requisitos previos para comenzar su investigación en Big Data difieren de un tema a otro, pero hay algunas habilidades comunes:

  1. Ecosistema Hadoop (HDFS, Hive, Flume, Pig, ..).
  2. Habilidades en bases de datos (UML, SQL, PL / SQL, No SQL).
  3. Dominar uno o más lenguajes de programación utilizados en Big Data (generalmente Java).
  4. Tener idea de plataformas de Big Data preconstruidas (Hortonworks, Cloudera, MapR).

La investigación se trata de leer y siempre hacer (auto-preguntar) las preguntas POR QUÉ

Buena suerte.

Espero que ayude 🙂

Una buena manera de explicar los problemas más extremos pero generalizados en el espacio de “big data” / “analytics” / “data science” es con las parábolas. La parábola de “Big Letters” cubre el tema de la alfabetización , la voluntad de “subirse al carro” sin comprender o incluso ser consciente de algunos conceptos fundamentales, y el papel que los vendedores pueden desempeñar en la explotación y el mantenimiento de este estado de cosas. Aquí está:

En 1439, Johannes Gutenberg utilizó por primera vez la imprenta en Europa, desencadenando la era de la comunicación de masas. Un invento alteró la sociedad. Este fue un momento de revolución en las ciencias, la tecnología, la economía y las artes en Europa. Un “renacimiento”.

La noticia llegó a un exitoso vendedor de nabos en Europa. Vio suficientes presentaciones de conferencias y escuchó de suficientes colegas y otros que la impresión era la tecnología de la información que iba a cambiar el negocio, y nuestro agricultor estaba decidido a no quedarse atrás. Resulta que el vendedor de nabos, como muchos en ese momento, era apenas numerado y realmente analfabeto.

El vendedor de nabos, consultó con los vendedores de imprentas que le informaron sobre los diferentes modelos de máquinas de imprenta que podía considerar, y todo el valor adicional que podía ofrecerle. Los vendedores no estaban perturbados en absoluto por la innumeración del vendedor de nabos, y de hecho ni siquiera lo abordaron. Después de todo, aunque la impresión puede ser milagrosa, todavía se trataba de cosas “técnicas”, “académicas” como leer y escribir, y cosas de nivel superior como “ciencia” y “literatura” en la misma línea, difícilmente el dominio de negocios importantes. A la gente le gusta nuestro vendedor de nabos.

Los vendedores fueron muy claros en su discurso: el vendedor de nabos tenía que ser dueño de una imprenta, pero de ninguna manera dijeron que tenía que hacer otra cosa que no fuera poseerla, seguir las “mejores prácticas” prescritas y, presumiblemente, ver el rollo de dinero. ¿Aprender a leer? No mencionado, no relevante. En cambio, los proveedores presentaron algunos estudios de casos de mejores prácticas de la industria del nabo, en los cuales sus imprentas destacaron en una serie de métricas. Los estudios de caso se referían a aplicaciones comerciales clave, en las que se estaban metiendo todos los demás vendedores de nabos (¡competidores!). ¿Podría nuestro vendedor darse el lujo de perderse?

Sí amigo, puedes investigar y encontrar resultados. para eso puedes unirte a un curso en línea de análisis de big data y hacer algunas manos en herramientas de big data, por lo que puedes recomendarte para aprender.

Análisis de Big Data con Sqoop y Hive – Udemy

More Interesting

¿Cuál es el objetivo principal de la minería de datos con big data?

¿Qué debe saber un CEO, gerente de producto y analista de comercio electrónico sobre la medición del desempeño, los KPI del producto (indicadores clave de desempeño), las métricas, etc.

¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?

¿Qué es el análisis de datos? ¿Puedes explicar con ejemplos?

¿Qué clasificadores de aprendizaje automático escalan muy bien a big data? ¿Hay alguna referencia de papel?

Si escribo una disertación sobre el impacto de Big Data en una industria específica, ¿necesito aprender Análisis de datos?

¿Qué es la agregación de datos?

¿Qué piensan los científicos de datos del nuevo programa de Maestría en Ciencias de Datos de la Universidad de Columbia Británica?

DeZyre o Udacity Nanodegree: ¿Cuál recomendarías para un aspirante a científico de datos?

¿Cómo es un gran impacto el Big Data?

¿Qué algoritmos debe aprender un estudiante interesado en ciencia de datos?

¿Qué puedo seguir en el dominio de la ciencia de datos? Tengo conocimiento en el programa R.

¿Qué tan buenas serán las oportunidades si agrego habilidades / conocimientos adquiridos por CFA-I además de mis habilidades básicas de análisis de datos?

¿Cuáles son algunas de las revisiones de Big Data y el certificado de análisis social de MITx?

¿Cómo se transfiere una persona trabajadora a tiempo completo a la ciencia de datos?