¿La informática teórica tiene algo que ver con la minería de datos?

La informática teórica le enseñará muchos hechos importantes que implicarán cómo extrae sus datos. Por ejemplo:

  • La forma de medir y cuantificar el volumen de sus datos influirá en los supuestos que se cumplirán o violarán sus enfoques de minería de datos.
  • La forma de medir y cuantificar la velocidad algorítmica y los gastos computacionales obviamente influirán en los algoritmos de minería de datos que seleccione
  • La forma en que almacena y estructura sus datos influirá en el rendimiento de sus algoritmos
  • El rendimiento de su hardware y software también influirá en el rendimiento de sus algoritmos.

Dicho esto, según tengo entendido, la importancia de la teoría computacional probablemente esté relacionada linealmente con la magnitud de sus datos y lo que está en juego en su esfuerzo de minería de datos.

Por ejemplo, si solo está tratando de ajustar una Cadena de Markov a un pequeño cuerpo de texto para su proyecto de clase, la teoría computacional probablemente no le impedirá hacer un buen trabajo. Lo único que lo detendrá será si comprende o no la programación.

Pero si trabaja para una empresa financiera a gran escala y está tratando de predecir cambios en las acciones de millones de dólares y solo tiene desde el mediodía hasta la hora de cierre para hacerlo, entonces realmente quiere asegurarse de que su algoritmo va a hacer lo que usted quiere. esperarlo, y eso dependerá de los puntos que describí anteriormente.

Si lo hace

Estas son las cosas (no una lista exhaustiva) en la minería de datos que se han / se beneficiarán de los avances en la informática teórica:

  • Cálculo distribuido [1]
  • Almacenamiento de datos eficiente [2]
  • Algoritmos de aprendizaje automático [3]
  • Comunicación de red [4]

Muchos más subcampos teóricos de CS configuran el curso de la minería de datos. Esto es solo un vistazo a los principales.

¡Espero que esto ayude!

Notas al pie

[1] Computación distribuida – Wikipedia

[2] Almacenamiento de datos informáticos – Wikipedia

[3] Aprendizaje automático – Wikipedia

[4] Red informática – Wikipedia

Cuando se trata de computabilidad, una gramática sensible al contexto, que es una máquina de Turing con límites lineales (LBTM), gran parte de la teoría se aplicaría a la minería de datos.

La hipercomputación, como el uso de lógica difusa o una máquina de Turing Oracular, se relaciona directamente con la minería de datos.

La teoría de la complejidad computacional, que analiza los algoritmos de clasificación por su sobrecarga, como P versus NP, se relaciona con la minería de datos en el sentido de que discute una serie de problemas en la teoría de optimización y el aprendizaje automático.

More Interesting

Si tuviera la oportunidad de rediseñar el programa de cuatro años de Ciencias de la Computación de su universidad, entonces, ¿qué programa diseñaría?

¿Cómo se puede dividir un conjunto de números en dos subconjuntos de modo que el XOR de los elementos en un subconjunto sea igual al XOR de los elementos en el otro y sea lo más grande posible?

¿Cuáles son algunas aplicaciones del mundo real de la teoría de la información cuántica?

Criptografía: ¿Qué sucedería si alguien encuentra un algoritmo significativamente más rápido para factorizar enteros grandes?

¿Es útil aprender Matemática discreta antes de la informática?

¿Cuáles son las diversas formas en que puede resolver el siguiente laberinto con un robot seguidor de enlace negro basado en IR? ¿Cómo puede resolverlo con el mínimo número de sensores posible y el tiempo más rápido para llegar al final?

¿Existe un algoritmo para fusionar dos árboles rojo-negros con una complejidad menor que O (n + m)?

¿Cómo ayuda el conocimiento matemático en la programación? ¿Puedes describir algunos ejemplos?

¿Es la matemática un buen título para un programador?

¿Cómo se puede usar una computadora para resolver problemas de multiplicación y división al convertirlos en sumas y restas usando el registro?

¿Cuál es el tiempo de retorno promedio en el cubo booleano n-dimensional, si el proceso estocástico está eligiendo una coordenada al azar y volteándola?

¿Qué es un diagrama de máquina de Turing y cómo diseño uno?

¿Un bucle siempre tiene un punto de partida?

Cómo convertir una combinación dada a un solo número

¿Es P vs NP el problema más difícil e importante del Premio del Milenio?