¿Qué significa hacer investigación en aprendizaje automático?

Considero que el aprendizaje automático es un área de investigación aplicada, por lo que todo girará en torno a algún problema por resolver. En general, la tarea es automatizar algunas Tareas de Inteligencia Humana (HIT) con una precisión razonable (por ejemplo: generar una descripción suficientemente buena de una imagen para que un motor de búsqueda pueda recuperarla). Comenzaría por estudiar los modelos existentes (sesgos inductivos) para la tarea en cuestión. Si está en la industria, intentaría usar el mejor modelo disponible. Si estás en el mundo académico, querrás mejorarlo. En general, las áreas de informática y matemática con las que se trataría son cálculo, álgebra lineal, teoría de grafos, teoría de grupos, estructuras de datos, algoritmos. Si va a escribir un código eficiente para resolver un problema usted mismo, necesitaría tener al menos cierta comprensión de los modelos de programación paralela (transmisión de mensajes, subprocesamiento múltiple, etc.). Si es necesario, tendría que configurar la infraestructura informática usted mismo, para lo cual tendría que conocer los conceptos básicos de los sistemas operativos GNU / Linux, programación de GPU, conceptos básicos de instalación del software en esas plataformas, configuración básica de red, configuración un grupo de nodos, etc. La configuración de la infraestructura suele ser una tarea única. Para crear un nuevo modelo, primero le gustaría probar los existentes en sus datos. La comunidad de aprendizaje automático ha sido bastante generosa al compartir sus códigos, por lo que no debería ser un problema. Si los modelos existentes no funcionan bien, generalmente pasará un tiempo preprocesando sus datos para que el modelo se ajuste mejor. De lo contrario, tendría que pensar en un modelo que pudiera acomodar mejor sus datos. Para esto, puede hacer un análisis exploratorio de sus datos, algunas pruebas de agrupamiento sin supervisión si lo desea. Luego crearía una hipótesis sobre los datos, la formularía matemáticamente y escribiría el código para probarlo. Luego analizaría los casos en los que su modelo falló y volvería a repetir el proceso hasta que tenga éxito. Espero que esto responda un poco a lo que preguntaste. Si no, comenta.

En mi humilde opinión, presentar un nuevo algoritmo cuyo sesgo inductivo debe estar claramente delineado es un enfoque; También considere algoritmos de optimización para hiperparámetros, por ejemplo, http://www.jmlr.org/papers/volum… . Otra estrategia común es hacer extensos resultados experimentales para comparar múltiples enfoques de LD (ver, por ejemplo, http://jmlr.csail.mit.edu/papers … o https://www.cs.cornell.edu/~caru …). Finalmente, también se deben considerar las pruebas teóricas de las propiedades de algunos modelos, aunque los revisores a menudo presentan solicitudes relacionadas con la validación experimental, si el enfoque es nuevo.

A2A.
Trabajo en aplicaciones de ML en áreas de lenguaje y visión. Soy un estudiante graduado (estudiante de doctorado).
Como estudiante de doctorado, es bastante agradable donde (intento) resolver problemas en problemas que siempre me han fascinado y más alguien me paga (aunque sea poco).
He seguido una carrera como ingeniero de software en laboratorios de investigación, que también fue una etapa agradable y gratificante, y los investigadores tienen un amplio margen para resolver problemas difíciles e interesantes.

More Interesting

¿Qué tipo de proyectos privados se pueden hacer en biología computacional o bioinformática que se pueden hacer a pequeña escala?

Investigación: ¿Cuáles son los temas en los que se está llevando a cabo una investigación innovadora actualmente?

¿Por qué la evaluación parcial no se usa más comúnmente en los lenguajes de programación?

¿Cuáles son los problemas en la educación en informática?

¿Qué pasaría si el trabajo de un investigador extranjero en un laboratorio de investigación estadounidense no clasificado comienza a tener aplicaciones militares?

¿Dónde puedo hacer investigación en informática?

¿Cómo puede un estudiante de doctorado en un programa de aprendizaje automático no superior (con la mayoría de los estudiantes y profesores haciendo investigación aplicada) intentar entrar en una carrera de investigación teórica?

¿Cuáles son los beneficios de aprender informática teórica?

¿Cuál es la intuición detrás de la computación de modelado?

¿Los procesadores se ralentizan con la edad?

¿Cuáles son los mejores trabajos académicos en informática? ¿Por qué?

¿Cuáles son las principales áreas de investigación en el campo de los superconductores actualmente?

¿Cuáles son los mejores trabajos de investigación, blogs u otros escritos perspicaces sobre el ecosistema bitcoin?

¿Cuánto trabajo se ha hecho para identificar acentos algorítmicamente?

¿Cuáles son los temas candentes que se pueden investigar sobre la construcción del compilador?