Como experto en aprendizaje automático, debe ser autosuficiente en el preprocesamiento de sus datos. Normalmente, esto significa extraer los datos con algo de filtrado básico y cargarlos en su entorno favorito y escribir el resto de su preprocesamiento, que podría ser muy diverso y complejo.
En cuanto a las habilidades, generalmente necesita conocer bien solo una herramienta y saber cómo obtener datos de cualquier cosa. Cuando los datos son muy grandes, a veces (aunque no tan a menudo como muchos creen) es necesario procesar los datos donde viven. Esto podría estar en hdfs en una base de datos sql o alguna base de datos nosql. En ese caso, debe tener datos de mezcla de alta competencia en la única plataforma que tiene. Es muy raro, excepto quizás en algunos trabajos de consultoría, que los profesionales de aprendizaje automático tengan más que un dominio básico en muchas plataformas.
- ¿Qué es la ciencia de big data?
- ¿Qué sería más fructífero aprender: R o SAS?
- ¿Está Microsoft Excel fuera de moda y menospreciado por los profesionales de la ciencia de datos?
- ¿Por qué odias el aprendizaje automático y la ciencia de datos?
- ¿Cuál es el mejor instituto en Pune para AngularJS y data science?