¿Qué hacen los ingenieros de aprendizaje automático diariamente?

Hola, ingeniero de ML aquí.

Actualmente trabajando en PNL, en su mayor parte, incluida la clasificación de intenciones y la extracción de entidades.

Aquí hay un día típico para mí:

Póngase a trabajar, abra GitHub y verifique en el tablero ZenHub (algo así como Jira, excepto que más fresco). Tenía algunos modelos que estaban entrenando anoche en nuestros servidores y debería haber recibido un correo electrónico que terminaron. ¡Yo hice!

Probablemente pasaré unos minutos probando esos nuevos modelos y luego ajustaré algunos parámetros, luego reiniciaré el proceso de capacitación.

El resto del día usualmente estoy codificando de manera directa, ya sea trabajando en una aplicación de Python de back-end que suministrará la IA para uno de nuestros productos, o implementando un nuevo algoritmo que quiero probar.

Por ejemplo, recientemente leí un artículo sobre recocido simulado acoplado (CSA), y quería probarlo ajustando los parámetros para XGBoost como una alternativa a una búsqueda de cuadrícula. CSA es una forma generalizada de recocido simulado (SA), que es un algoritmo para optimizar una función que no utiliza ninguna información sobre la derivada de la función.

Desafortunadamente no pude encontrar una implementación en Python, así que decidí escribir la mía. ¡Dos días después, había enviado mi primer paquete a PyPI!

De todos modos … en realidad nunca he conocido a otro ingeniero de ML, así que no tengo idea de si mi experiencia diaria es típica 😉 ¿Me perdí algo? Los viernes de bagel son increíbles porque soy el único al que le gustan los bagels. Debe ser una cosa de Nueva York? (Actualmente en el medio de Iowa, no debe confundirse con Idaho. Tenemos MAÍZ, no las papas).

Su trabajo principal es crear modelos y capacitarlos para obtener mejores resultados que los modelos anteriores para resolver algunos problemas definidos.

More Interesting

¿Cuál es el algoritmo de aprendizaje automático más rápido para implementar para la detección de fraudes?

¿La ingeniería de características es relevante para los bosques aleatorios? ¿Cómo son relevantes las transformaciones de centrado, escala y Box-Cox en este contexto?

¿Cómo puedo sobresalir en el aprendizaje automático con antecedentes estadísticos?

¿Por qué es importante aprender el descenso de gradiente en el aprendizaje automático?

¿Es el aprendizaje supervisado sobre los resultados evolutivos existentes la mejor estrategia para garantizar la supervivencia en un entorno cambiante? ¿Existe una estrategia óptima para la mutación contra cambios ambientales imprevistos?

¿Por qué los NN recurrentes son tan susceptibles al problema del gradiente de fuga?

¿El gradiente sintético eliminará la propagación hacia atrás?

¿Por qué el error cuadrático medio es equivalente a minimizar la entropía cruzada entre la distribución empírica y un modelo gaussiano?

Estoy usando Weka e implementé la ganancia de información forestal aleatoria usando Java. ¿Cuáles son algunos consejos sobre cómo imprimir cuántas funciones tiene después de aplicar la ganancia de información y cómo imprimir los nombres de las funciones y sus valores de ganancia de información en orden descendente (solo funciones de ganancia de información)?

El aprendizaje profundo hará que los humanos sean innecesarios para qué trabajos.

¿Cuáles son los pros y los contras de estos tres modelos de secuencia: modelo MaxEnt Markov, campos aleatorios condicionales y redes neuronales recurrentes?

¿Por qué los CNN se usan más para tareas de visión por computadora que otras tareas?

¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?

Al entrenar a un clasificador, ¿cómo trato con clases que tienen números muy diferentes de muestras en el conjunto de entrenamiento? ¿Cómo evito un ajuste excesivo en la clase que tiene la mayor cantidad de muestras?

¿Cuál es la mejor arquitectura de red neuronal para procesar video?