¿Cuáles son algunas preguntas de investigación de doctorado en el campo del “proceso de ciencia de datos”?

Recibo muchos correos electrónicos donde los estudiantes piden temas de tesis o disertación. Mientras que para una tesis de maestría que puede estar centrada en la tecnología, podemos proporcionar alguna orientación, para el doctorado, es importante que encuentre / defina la pregunta usted mismo, con alguna orientación de su asesor.

El doctorado implica auto exploración; Proporciona un proceso para convertirse en un investigador / innovador independiente y seguro. La mayoría de los buenos asesores no hacen preguntas a sus estudiantes de doctorado (excepto tal vez en los primeros años cuando se centran en resolver preguntas específicas que conducen a publicaciones que pueden o no formar parte de la tesis), proporcionan un ecosistema (financiación, propuestas y proyectos que tienen algunas preguntas definidas pero tienen flexibilidad para hacer más preguntas, grupos de investigación con la capacidad de interactuar con estudiantes y posdoctorados senior y junior, amplio intercambio de ideas y lluvia de ideas, trabajo en red, preferiblemente con la industria, acceso a problemas y datos del mundo real ) en el que incuba y refina su propia persona de investigación / innovación.

Recuerde, cuando elige un tema de doctorado, se dirige a resolver un problema que será relevante e importante dentro de 2 a 4 años en el futuro, cuando completará su disertación y buscará un trabajo. En esta duración, continuará refinando y haciendo correcciones de curso a medida que continúe la nueva investigación en áreas dinámicas como la ciencia de datos. Lo que no está resuelto, es importante o está de moda hoy en día puede no estar ni 3 años en el futuro (por ejemplo, la computación en la nube estuvo de moda hace 3 años, pero ahora es un gran dato; de manera individual, su tema de doctorado debería resolver problemas importantes que sobrevivirán a las modas y los cambios en el futuro). Curva de tecnología de Gartner).

Aquí hay una cita importante (Uri Levine): “Enamórate del problema y no de la solución”. ¡Un corolario es que necesitas encontrar el problema (pregunta de investigación) que te apasiona!

Con todas las advertencias anteriores sobre la respuesta a la pregunta: aquí hay dos de mis estudiantes que están respondiendo algunas preguntas de ciencia de datos en su doctorado (que implica principalmente un análisis cuantitativo de grandes cantidades de datos diversos, interesantes y del mundo real): mire las preguntas que tienen trató de responder:
Hemant Purohit, Investigación en Computación Social, Kno.e.sis, Universidad Estatal de Wright
Lu Chen @ Kno.e.sis
Wenbo Wang @ Kno.e.sis

Un tema muy popular y fructífero de la investigación de la ciencia de datos ha sido identificar estructuras / suposiciones que son válidas en problemas de big data y explotar esta estructura para obtener información estadística o ganancias computacionales en predicción o detección. Este es un tema muy general que es útil para encontrar algo específico para trabajar, y a menudo hará que sus contribuciones de investigación sean inmediatamente valiosas en entornos prácticos de ciencia de datos. Por ejemplo, la estructura matricial de bajo rango oscurecida por el ruido disperso, la estructura múltiple de baja dimensión oscurecida en espacios de alta dimensión comunes en la minería de datos, los diccionarios latentes sobrecompletos que se usan escasamente para generar ejemplos observados, las leyes de potencia con respecto a las conexiones de borde en un entorno real masivo. gráficos mundiales, membresías ocultas de la comunidad en gráficos de redes sociales, seguimiento del cambio temporal de intereses escasos de los usuarios en sistemas de recomendación, etc.

Esto depende del objetivo final de su escritura de investigación de doctorado. Debe comprender claramente qué es exactamente lo que quiere obtener de este tipo y elegir su tema con cuidado.

La ciencia de datos es lo que ya necesitamos como prioridad número uno y es por eso que podemos enfrentar nuevas preguntas en esta área casi cada hora. Por supuesto, podemos suponer que puede obtener preguntas sobre las tecnologías SQL y NoSQL o algo así, pero de hecho, debe desarrollar estas preguntas por su cuenta, ya que tendría que crear nuevas respuestas. Quiero decir que debes crear estas preguntas por tu cuenta, ya que debes proporcionar soluciones para el futuro que ni siquiera existen. En mi opinión, puede concentrarse en algunos de estos temas:

Aprendizaje automático y optimización

  • Recuperación de información
  • Inteligencia artificial
  • Visualización de datos
  • Usabilidad

Puede buscar preguntas de investigación de doctorado dentro de estos temas, espero que obtenga lo que está buscando.

Data Science es uno de los campos que muchos jóvenes están estudiando. En realidad, ha sido calificado como uno de los trabajos más sexys actualmente. Algunas de las preguntas en las que puede comenzar a pensar podrían incluir “¿En qué se parece el proceso de ciencia de datos al Descubrimiento de conocimiento en las bases de datos?”, “¿Cómo afecta el proceso de ciencia de datos al reconocimiento de voz?” y “¿Cómo aplicar la ciencia de datos a las empresas?” entre otros. Bueno, en este caso, es posible que no encuentre sus respuestas en sitios como http://www.huffingtonpost.com/ma