¿De qué manera la Academia se está quedando atrás en la capacitación de Data Science?

Por un lado, los conjuntos de datos con los que trabaja la academia son:

a) muy limpio. Por ejemplo, los académicos consideran que el conjunto de datos de autos UIUC está resuelto. Los autos en esos conjuntos de datos tienden a ser autos cuadrados de los años 80 que son fáciles de detectar y localizar. También son completamente frontales o posteriores o laterales.
Trabajé en el auto sin conductor y puedo decir que en el mundo real los autos se ven como: motos, camiones grandes, vehículos negros en la sombra, manchas apenas visibles al anochecer, medio ocluidas, en todos los ángulos de giro posibles. Los autos modernos también tienen un aspecto más liso y ovoide y no se parecen a los autos cuadrados en el conjunto de datos de UIUC.
De hecho, a veces las señales de tráfico se parecen más a los autos cuadrados que a los autos reales.

b) demasiado pequeño. He trabajado en problemas similares al conjunto de datos de 80 millones de imágenes pequeñas. Pero los conjuntos de datos del mundo real son mucho más grandes que 80 millones. Por muchos ceros. Y las imágenes no son pequeñas.

c) sin metadatos. En la industria, muchos corpus vienen con grandes cantidades de metadatos. Por ejemplo, las imágenes pueden tener texto cerca de ellas. Por lo tanto, sería demasiado simplista usar solo señales de contenido de imagen por sí mismas. Los conjuntos de datos académicos tienden a ser de un ‘canal de señal’ a la vez para diversas especialidades. por ejemplo, un conjunto de datos de visión y un conjunto de datos de PNL, pero rara vez ambos al mismo tiempo.

¿Cuál sería un ejemplo de una función simple no convexa?

¿Cuál es la diferencia entre el control óptimo adaptativo y el aprendizaje por refuerzo?

Andrew Ng: ¿Qué opinas sobre la memoria?

Quiero comenzar en PNL. ¿Vale la pena?

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar “imágenes de Google”, me preguntó: “¿Quiso decir: imágenes de Google?”.

¿Funcionará el Blue Brain Project?

Junto con la tecnología relativamente nueva de Big Data está el nuevo científico de datos de títulos de trabajo. Si bien no está vinculado exclusivamente a los proyectos de Big Data, el rol del científico de datos los complementa debido a la mayor amplitud y profundidad de los datos que se examinan, en comparación con los roles tradicionales …

Puede visitar este enlace: Big Data, ciencia de datos – Clases de capacitación de cursos combinados en línea | Big Data, Data Science – Cursos de cursos combinados en línea Un científico de datos representa una evolución desde el rol de analista de datos o negocios. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas, análisis y matemáticas.

. Lo que distingue al científico de datos es la perspicacia empresarial fuerte, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es curioso, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “.

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Los científicos de datos son inquisitivos: exploran, hacen preguntas, hacen análisis de “qué pasaría si”, cuestionan los supuestos y procesos existentes

Los datos se duplican cada dos años, y todos han oído hablar de los números de crecimiento absurdos indicados en los informes. En este contexto, el resultado inevitable es la aparición del Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y proyectar el mapa tecnológico para hacer posible la transición de datos a ideas. El alcance del trabajo de un científico de datos incluye la identificación de las fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

Por el momento, el papel de un científico de datos lo desempeña una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de esa clase. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que puedan estar más allá del ámbito de los modelos actuales y los problemas comerciales. El analista de negocios trabajaría en los datos que ha recopilado el científico de datos. James Kobielus, un analista senior de Forrester, en su negocio, llega a comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para trabajar con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con el surgimiento de una carrera de pleno derecho, esto pronto cambiará.

Héctor Yee

More Interesting

Quiero pasar el tiempo dado para el proyecto del último año para aprender ML. ¿Cómo empiezo?

¿Por qué cada filtro aprende diferentes características en una red neuronal convolucional?

¿Por qué ha sido tan efectivo OpenAI?

¿Cómo decidimos la clase de clústeres generados a través del clúster k-means?

En Python, ¿cómo puedo probar y asegurarme de que mi modelo predice datos correctamente? (principiante preguntando)

¿Se están realizando estudios actuales que utilicen la minería de datos o el aprendizaje automático en campos científicos?

¿Es posible generar datos de expresión genética artificial? Las imágenes a veces se pueden perturbar para aumentar el tamaño de las muestras con fines de aprendizaje automático.

Cómo aplicar PCA para la reducción de dimensionalidad y SVM para agrupar y clasificar los patrones usando C ++ OpenCV

¿Qué debo aprender en Data Science para ayudar a mi startup?

¿Puedo usar una CPU para generar datos (aumento) cuando el entrenamiento de flujo de tensor en GPU es de forma paralela?