¿Por qué odias el aprendizaje automático y la ciencia de datos?

Creo que el aprendizaje automático tiene su lugar. La ciencia de datos es necesaria en todas partes porque realmente se trata de manipular y analizar grandes cantidades de datos. Lo que no me gusta es cómo las personas usan algoritmos de aprendizaje profundo para eludir realmente saber por qué las cosas se clasifican como son. Si bien esto podría estar bien para que Google agrupe las imágenes de mis gatos bajo una etiqueta de mascota, creo que obstaculizará otros campos del esfuerzo científico. Especialmente porque las técnicas de aprendizaje profundo no tienen la capacidad de incluir marcos teóricos en su entrenamiento (a diferencia de los métodos bayesianos).

El tratamiento del cáncer es un buen ejemplo. Observo a las personas que utilizan el aprendizaje profundo para diseñar mejores planes de tratamiento o predecir los resultados a largo plazo del tratamiento. Esto es maravilloso, podemos brindar una mejor atención, tal vez más personas puedan vivir más tiempo con una mejor calidad de vida. Pero nuestra comprensión de la biología está impulsada por la investigación del cáncer. Cuando una computadora puede predecir el resultado de un tratamiento con una precisión del 99%, sin el conocimiento subyacente, sospecho que los fondos comenzarán a agotarse. Esto afectará a muchos otros campos de manera similar.

El aprendizaje profundo juega directamente con los mayores problemas de una sociedad, la gratificación instantánea. Continuará mejorando, las nuevas redes abordarán nuevos problemas y la necesidad de conocimiento comenzará a perderse. Es una caja negra de la que no puedes aprender. Debe tratarse como un trampolín, una brecha de puente, pero en su lugar será tratado como el final, todo será todo. Hará al conocimiento científico lo que los robots y los controles de la computadora hicieron a la fabricación. Lo reemplazará, pero en lugar de eliminar trabajos, perderemos nuestra capacidad de comprender cómo funciona el mundo.

Descargo de responsabilidad:

  • No digo que toda la ciencia y la búsqueda del conocimiento se agoten. Solo estoy tratando de retratar mis preocupaciones con la tecnología.
  • Sé que el aprendizaje automático es un campo mucho más amplio que el aprendizaje profundo, pero eso es lo que la mayoría de la gente asocia.
  • Todavía creo que las redes neuronales son buenas, solo debemos tener en cuenta que nada puede reemplazar las explicaciones teóricas de las cosas.

Odio el aprendizaje automático / ciencia de datos / aprendizaje profundo por las siguientes razones.

  1. Primero dijeron que la codificación es una nueva alfabetización. Ahora ML, DL y Data Science se están convirtiendo en una nueva Alfabetización.
  2. Pronto, las entrevistas de Data Structures y Algo Coding pueden ser reemplazadas por entrevistas de Data Science y Machine Learning Algo.
  3. ¿Por qué debería tener que enseñarle a una computadora a aprender “esto es cara, esto es flor” escribiendo código y teniendo un conjunto de datos de entrenamiento. Me será más fácil enseñarle a un niño de 3 años sobre esas cosas. 😛
  4. El titular del perfil de LinkedIn estará lleno de entusiastas de ML | DL | Data Science, etc.
  5. Pocas materias en la universidad serán reemplazadas por estos cursos.
  6. Incluso para BPO y otros trabajos, el requisito será el aprendizaje automático.
  7. Cada empresa, haga lo que haga, le dirá que está realizando el aprendizaje automático donde no hay caso de uso de ML para esa empresa.
  8. Los perfiles HackerRank, HacerEarth, Codeforces, Codechef serán reemplazados por el perfil Kaggle.

  1. Si ve la imagen de arriba, puede encontrar que el aprendizaje automático es la habilidad requerida para la pasantía de desarrollo web.

Nota: Para las empresas que esperan un conocimiento más reciente sobre algoritmos Ml, algoritmos DL, Tensorflow, etc. ¿Cómo es posible que todos los estudiantes de primer año sepan todo esto? De 60, solo 3 personas tendrán conocimiento de estas cosas. Aún así, nuestro sistema educativo no le dio mucha importancia a este dominio para los estudiantes de la UG. Por lo tanto, no espere una experiencia más reciente de 5 años en Data Science.

Odio este dominio por completo debido a las expectativas de las empresas por parte de los estudiantes.

DS / ML ha recibido tanta publicidad en los últimos años que todos quieren convertirse en científicos de datos o desarrolladores de ML. Las universidades están dando títulos como el maní, pero el hecho es que un porcentaje muy pequeño de estas personas consiguen el trabajo adecuado. Además, se presenta como si la ciencia de datos se tratara de codificación R / Python.

Fundamentalmente, la ciencia de datos / la inclinación de la máquina tiene que ver con las matemáticas, solo escribir un código que realice la regresión no cuenta en la categoría de ciencia de datos. Pero no se preocupan por estos fundamentos y todas las personas se preocupan solo por escribir / copiar ese trozo de línea. Mi viaje como graduado de Data Science está lleno de dificultades. Todos los días es un nuevo desafío y, francamente, he renunciado a mis esperanzas en Data Science porque sé lo que un verdadero científico de datos debe ejercer. Sin duda, DS es el trabajo más sexy del siglo XXI, pero esa sensualidad viene con mucha lucha y trabajo duro constante.

No odio las cosas que no tienen alma o conciencia para infligirme daño conscientemente.

Lo que odio es cuando Machine Learning, AI, Big Data, Data Lake, NLP, Cloud, y todos estos términos son lanzados por personas que apenas tienen idea de qué son.

“Sí, hagamos IA y Big Data en las nubes, fusionemos genómica y tecnología financiera juntos. No te olvides de los nuevos emprendedores de la Generación Z, ¿impulsarán el Machine Learning en el lago de datos? Necesitamos contratar algunos ingenieros de datos y hacer un seguimiento del liderazgo en el VC para la próxima ronda de semillas ”

¿Por qué odias el aprendizaje automático y la ciencia de datos?

A veces tengo una gran falta de fe en la alfabetización matemática de las personas que practican el aprendizaje automático y la ciencia de datos de algunos de los lugares con los que interactúo. Siento que es una moda pasajera. Siento que a las personas se les dice que aprendan estas herramientas y lean trabajos matemáticos pesados ​​que probablemente estén muy por encima de ellas. Tengo la impresión de que escuchan sobre descomposiciones de matrices, pero a veces nunca toman clases de análisis numérico o álgebra lineal numérica.

Aquí están mis razones:

  1. Se trata de obtener resultados cercanos al 99,99% correctos. Nunca he oído hablar de nadie que afirme que su aprendizaje automático puede garantizar la corrección.
  2. No puede probar la exactitud de su algoritmo. No es necesario decir que si no es 100% correcto en primer lugar, no puede probar que sea correcto.
  3. Alguien necesita recoger el conjunto de entrenamiento. Entonces no es automatización completa. Si los humanos mutan, y los rostros humanos tienen un aspecto drásticamente diferente, debes recolectar un conjunto de entrenamiento completamente diferente para los rostros humanos.

Por supuesto, reconozco la utilidad del aprendizaje automático, pero nunca lo haría porque estoy obsesionada con demostrar que las cosas funcionan.

Me encanta. Pero odio a los idiotas que piensan que no necesitan saber Estadísticas para hacerlo correctamente; desafortunadamente, el Mundo está lleno de esos ‘Bros’.

More Interesting

¿Cuál es el mejor instituto de capacitación en Pune para ciencia de datos y cursos de big data?

¿Qué software recomendaría para el análisis de datos cualitativos de 30 entrevistas? Hay 11 códigos y, en promedio, cada respuesta tiene 5 códigos concurrentes.

¿Cuál es mejor para el estudio de big data 'simplilearn' o 'Intellipaat'?

Tengo un dato de 50 filas de Lakh. ¿Cómo lo abro en R o Python? ¿O hay alguna otra alternativa que no sea usar Hadoop?

¿Alguien podría hablarme sobre las universidades para el análisis de datos o la ciencia de datos en Europa o EE. UU. (Tiempo completo -2 años)?

¿Cómo se puede utilizar la asignación al azar para evaluar la independencia de las variables?

¿Cómo se puede pasar de la función de consultor de un MBB a la función de ciencias de datos?

¿Por qué tenemos oportunidades tan limitadas en big data?

¿Cuánto tiempo debe ejecutar una prueba A / B en su sitio antes de declarar a uno ganador?

¿Cuáles son los métodos para la agrupación de datos de series temporales aplicables a grandes conjuntos de datos?

¿Cuál es la diferencia entre Hadoop y big data?

¿Cuál es la especificación requerida en una computadora para participar en las competencias de Kaggle?

Soy un gran desarrollador de datos con antecedentes de Java, escrito en MR, Hive, Spark, Scala, Sqoop y Tableau. ¿Qué sigue para aprender a ser analista de datos / científico de datos?

¿Tendré oportunidades de trabajo después de hacer un curso de ciencia de datos de Simplilearn?

¿Debería un aspirante a científico de aprendizaje automático / científico de datos practicar problemas de kaggle?