Como experto en aprendizaje automático, ¿con qué aspectos de las bases de datos y la optimización de bases de datos debería estar familiarizado?

Como experto en aprendizaje automático, debe ser autosuficiente en el preprocesamiento de sus datos. Normalmente, esto significa extraer los datos con algo de filtrado básico y cargarlos en su entorno favorito y escribir el resto de su preprocesamiento, que podría ser muy diverso y complejo.

En cuanto a las habilidades, generalmente necesita conocer bien solo una herramienta y saber cómo obtener datos de cualquier cosa. Cuando los datos son muy grandes, a veces (aunque no tan a menudo como muchos creen) es necesario procesar los datos donde viven. Esto podría estar en hdfs en una base de datos sql o alguna base de datos nosql. En ese caso, debe tener datos de mezcla de alta competencia en la única plataforma que tiene. Es muy raro, excepto quizás en algunos trabajos de consultoría, que los profesionales de aprendizaje automático tengan más que un dominio básico en muchas plataformas.