¿Existe alguna metodología como OOP que guíe cómo diseñar un software de procesamiento de datos?

Cuando se trata del procesamiento de datos, siempre hay pasos de procesamiento y los pasos se pueden organizar en capas.

Consulte Arquitectura del almacén de datos (hay incluso más capas que en la imagen a continuación).
Decida qué procedimientos pertenecen a varias capas y su proyecto se organizará:
Capa de origen de datos
Área de ensayo
Capa ETL
Capa DWH
Capa de presentación de datos
Por supuesto, no está creando DWH en R, pero este es un concepto general para el procesamiento de datos.

Otro punto de vista se describe en KDD Process / Overview.


Le indica que hay varios pasos de procesamiento: selección, preprocesamiento, transformación, extracción de conocimiento, evaluación, interpretación.

Y, finalmente, el proceso más común en la minería de datos es el Proceso estándar de la industria cruzada para la minería de datos.
Nuevamente hay 6 etapas. IBM SPSS Modeler organiza transmisiones según CRISP-DM ftp://ftp.software.ibm.com/softw….
Y así podría organizarse su código R.