¿Qué son los datos de alta dimensión en Big Data?

No está vinculado a “big data” per se. La dimensión es simplemente el número de variables. Es fácil de explicar usando geometría. Una línea infinitamente delgada tiene una dimensión porque solo necesita una variable para describirla completamente. Ese valor es la longitud de la línea. Un rectángulo, o cualquier otra forma que pueda describirse con dos números (longitud, altura en este caso), tiene dos dimensiones. Un bloque tiene tres dimensiones. Pero esta idea no se limita a las dimensiones que puede visualizar, por ejemplo, el hipercubo tiene cuatro. También puede describir una casa con un número arbitrario de variables, como 6 ventanas, 2 puertas, 3 baños, “cerca” de tiendas, “lejos de una escuela”, “historia de fantasmas”, piscina, … y así sucesivamente. Cada “cosa” que utilizas para describir la casa introduce otra dimensión. Con algunos datos, puede tener muchas dimensiones. Quizás hay un par de miles, o diez millones. Depende del contexto y / o estado de ánimo lo que consideres que es “alto” dimensional.