Al planificar una base de datos (organización, arquitectura, atributos, etc.), ¿qué tipo de consideraciones deben hacerse para facilitar el éxito y la facilidad del análisis de datos futuro?

Las mejores prácticas en el diseño de bases de datos que consideran el análisis predictivo futuro son las siguientes:

  • Asegúrese de que los datos se capturen en el nivel más básico, con la flexibilidad de incluir nuevos atributos basados ​​en el progreso de la funcionalidad del negocio.
  • Para registrar datos en detalle y a nivel granular, diseñe tablas de transacciones estratégicas.
  • Siempre se recomienda agregar comentarios, ya que ayudan a comprender mejor la estructura de la base de datos.
  • Intente almacenar solo la ruta del servidor a diferentes tipos de archivos en la base de datos, ya que reduce el espacio en disco que está ocupado, lo que a su vez agiliza los procesos de la base de datos. Los archivos se pueden almacenar en carpetas, accesibles para el servidor web.
  • Cuando defina las columnas de la tabla, asegúrese de saber qué campos requieren datos y cuáles no. Es recomendable no configurar todos sus campos para que no sean nulos, especialmente si no está interesado en obligar a los usuarios a ingresar datos. Pero al mismo tiempo, no definir restricciones o mantenerlas sueltas puede hacer que su aplicación sea vulnerable y dañar la integridad de los datos.
  • En los casos en que haya duplicación de los mismos datos en diferentes columnas o se haga referencia en más de una tabla, asegúrese de mantener el mismo tipo de datos en toda la base de datos.
  • Use solo los nombres de columna que desea recuperar, mientras ejecuta consultas en la base de datos, ya que reduce las operaciones de disco y facilita el tráfico de red.
  • Cuando ejecuta una consulta de acción de inserción, y el objetivo es insertar datos en todas las columnas actuales, use siempre la lista de columnas en la que insertar en lugar del nombre de la tabla. De esta manera, incluso si se agregan nuevas columnas a la tabla, la consulta aún funciona.

Un punto práctico de orientación es estimar el tamaño de la recopilación de datos durante varios años para asegurarse de no hacer un callejón sin salida en cuanto al almacenamiento / potencia computacional necesaria para manejar sus necesidades y los plazos de sus usuarios para obtener una respuesta.