¿Se puede trabajar en Machine Learning con un doctorado en estadísticas?

Eso es exactamente lo que hago / estoy haciendo. Mi “credencial” anterior dice Ph.D. en Machine Learning ya que esa era mi especialización, pero mi Ph.D. está técnicamente en Estadística y eso es lo que está impreso en mi título.

Si bien existe una gran superposición entre las estadísticas y el aprendizaje automático, creo que hay una pequeña diferencia cultural que es necesario superar. A Ph.D. de estadísticas te lleva a la mitad del camino, igual que un doctorado en informática En este momento, los programas de estadísticas cubren, bueno, estadísticas. También cubren estadísticas bayesianas (duh), métodos computacionales como Markov Chain Monte Carlo y otras técnicas que se utilizan en el aprendizaje automático, pero todavía falta algo.

Creo que lo que falta es esa base fundamental en la informática. Siento que el aprendizaje automático es inútil a menos que pueda implementarlo. Con las estadísticas, ese no es el caso. Puede lanzar sus datos a SAS o SPSS y con unos pocos comandos tendrá sus resultados. Esto está cambiando, pero creo que el mayor obstáculo que tienen algunos estadísticos es una base en algoritmos y un desarrollo básico del sistema (fork / thread, memoria compartida, sistemas distribuidos).

Entonces, si eres un Ph.D. estudiante o graduado que hace esta pregunta, probablemente solo necesite obtener una base más en ciencias de la computación y fundamentos de algoritmos porque las estadísticas lo llevan a la mitad del camino.

Por supuesto, la forma más fácil de ingresar al aprendizaje automático con un Ph.D. de estadísticas es graduarse de un programa que tiene una especialización de aprendizaje automático …

[sarcasmo]

¡Por supuesto no!

Después de todo, ¡mucho aprendizaje automático se basa en estadísticas! ¡La mayoría de los algoritmos no basados ​​originalmente en estadísticas se pueden entender estadísticamente!

¿Cómo podría ser útil?

[\sarcasmo]

Dejando a un lado el sarcasmo, un doctorado en estadística es cómo ingresé a ML, y es uno de los mejores títulos para tener si su trabajo en ML tiene algún tipo de componente de investigación, que, de todos modos, para mí es la mejor parte de mi trabajo. . O al menos lo más divertido.

Nota: el sarcasmo en esta respuesta no está destinado al autor de esta pregunta. Es en la respuesta porque he escuchado, demasiadas veces, que la ciencia de datos y el aprendizaje automático hacen que las estadísticas sean obsoletas, en lugar de la verdad, que es bastante fundamental para ambos.

Si. Ahí es donde la mayoría de los científicos de datos comenzaron antes de que tuviéramos “científicos de datos”. Recomiendo aprender el aprendizaje automático, ya sea a través de cursos o solo. Intenta publicar mientras estás en la escuela; Fue una ventaja cuando comencé a entrevistarme para mis primeros puestos.

Aquí hay un PPT rápido con algunos algoritmos de ML comunes (documentos de referencia adjuntos; todos tienen paquetes R asociados): https://www.slideshare.net/Colle

Absolutamente. Una gran parte del aprendizaje automático son solo estadísticas aplicadas. Deep Learning tiene muchas menos estadísticas que otros campos de ML, pero aún hay muchas estadísticas allí.

Y luego tiene campos como modelos gráficos probabilísticos que esencialmente son otro nombre para las estadísticas bayesianas.

Por supuesto, si tienes una sólida formación en estadísticas, estarás en un buen lugar para comenzar a aprender ML, que está fuertemente basado en la probabilidad.

Dicho esto, también hay otros temas que son útiles:

  • Álgebra lineal
  • Cálculo multivariable
  • Computación numérica

Por supuesto que puede. Además de los títulos especializados de aprendizaje automático, es probable que sea el título más relevante que pueda tener.

More Interesting

Cómo reducir la dimensionalidad en la agrupación promedio global para que coincida con el tamaño de softmax

¿Qué es la curva de recuperación de precisión (PR)?

¿Cómo decidimos la clase de clústeres generados a través del clúster k-means?

¿Cómo pueden beneficiarse los MOOC de sus datos?

¿Vale la pena dejar mi trabajo de desarrollador de software de USD $ 150K para estudiar el aprendizaje automático y el aprendizaje profundo?

¿Cuáles son algunos estudios de caso excelentes en el aprendizaje automático?

¿Cuál es un ejemplo de un sistema, proceso o actividad que no puede ser modelado por un proceso de decisión de Markov?

¿Qué otros algoritmos de aprendizaje automático, además del aprendizaje profundo, se aplican ampliamente en aplicaciones comerciales?

¿Cuál es más rápido, Torch7 o Theano?

¿Cuál es la mejor manera (habitual) de combinar los puntajes tf-idf para cada documento que un usuario ha visto al crear un perfil para este usuario?

¿Qué es un buen marco de visualización de datos en tiempo real?

Si pudieras elegir cinco miembros perfectos para un equipo de desarrollo de aprendizaje automático y en la nube, ¿qué habilidades requerirías que tuvieran?

En un problema de optimización no convexo, ¿es posible determinar si dos puntos pertenecen al mismo valle o no?

¿Puede ingresar al programa de doctorado CS de nivel superior / siguiente sin publicación, suponiendo que tenga una experiencia de investigación decente?

¿Cómo funciona el modelo de atención con LSTM?