Otras personas le darán otras definiciones, pero para mí la ciencia de datos es el análisis científico de los problemas donde el desafío principal es la gran cantidad de datos que tiene. La ciencia de datos siempre implica el uso de computadoras como herramienta para responder sus preguntas. Si sus datos son lo suficientemente pequeños, puede razonar sobre ellos a mano, entonces aún puede ser de interés, pero no está haciendo ciencia de datos. La mayor parte de lo que pienso cuando la ciencia de datos surge del desarrollo de software (donde una gran cantidad de usuarios que hacen muchas cosas lo lleva a la escala donde la ciencia de datos entra en acción) o las finanzas. Sin embargo, a veces, las preguntas de otras ciencias eventualmente se convierten en problemas de ciencia de datos después de que se haya realizado mucho otro trabajo. Por ejemplo, es posible que tenga una gran cantidad de registros médicos y desee filtrarlos para encontrar formas de mejorar la salud de las personas.
La informática es el estudio de la complejidad estructurada. Muy a menudo, eso significa que es el estudio de cómo hacer que las computadoras hagan cosas difíciles rápidamente, pero también es el estudio de lo que las computadoras no pueden hacer y, a veces, explora sistemas de cómputo más exóticos. Por ejemplo, tengo un doctorado en informática que obtuve por descubrir cómo hacer que el ADN se ensamble en formas interesantes. La ingeniería de software es, en cierto sentido, la rama aplicada de la informática.
La superposición entre los dos se produce cuando sabes qué pregunta científica quieres hacer, pero necesitas hacer que las computadoras realicen alguna tarea de manera más eficiente para obtener la respuesta que deseas. Esto podría surgir con un algoritmo más rápido, descubrir cómo combinar el trabajo de muchas computadoras en una sola respuesta, o ajustar su pregunta para que sea más fácil de manejar para una computadora. En general, cuando estás haciendo ciencia de datos, no es demasiado difícil hacer que las computadoras hagan lo que quieres una vez que has descubierto qué es eso, pero cuando eso no es tan obvio, también debes hacer algo de ciencia de la computación.
- Si cambia el tamaño de una imagen ráster de 1000 × 1000 a 10 × 10 y luego la redimensiona a 1000 × 1000, ¿se considera que esto es un alias en informática?
- Cómo organizar una buena competencia relacionada con el aprendizaje automático o la ciencia de datos
- ¿Por qué las computadoras no pueden usar números irracionales?
- ¿Cuál es el mejor método de aprendizaje automático para predecir el tiempo de una observación dada?
- ¿Cómo puede determinar eficientemente el k-ésimo elemento máximo en un árbol de búsqueda binario?