¡Excelente! Está buscando construir su primer producto de datos de autoservicio. Felicidades.
Ahora podría decirle cómo RapidMiner Server simplifica la creación de un proceso así, pero creo que está buscando el desafío de cómo construirlo desde cero.
RapidMiner utiliza Java para todo el sistema y tiene incorporada la seguridad del usuario, pero todas las tecnologías que mencionó pueden hacer lo que necesita JavaScript, PHP, etc. con diversos grados de complejidad.
- ¿Quién cifra los datos?
- ¿Puedo ingresar a la ciencia de datos con un GPA bajo?
- ¿Es Python el lenguaje de programación más importante para el análisis de datos?
- ¿Cuáles son las diversas formas en que Data Science puede convertirlo en un emprendedor exitoso?
- ¿Cuál es la forma más efectiva de estructurar un equipo de ciencia de datos?
Comience por elaborar un plan de su sistema (recomiendo diagramas de flujo de datos) para que tenga una idea clara de dónde fluye todo desde y hacia su sistema planificado, también tome nota de lo que ya se ha construido y las precauciones especiales para tomar en cada etapa.
Algunas cosas para pensar:
- Seguridad: ¿quién tiene acceso para cargar archivos? ¿Podría alguien cargar un archivo malicioso en su sistema si está abierto en la web?
- Manejo de errores: ¿necesita tener un sistema para verificar el formato de los archivos?
- Backend: ¿almacena los archivos cargados en cualquier lugar o simplemente los procesa como un análisis de datos?
- Resultados: ¿en qué formato presentas la carga al usuario? ¿Devuelve solo un archivo o un tablero?
- Modelado: ¿qué tipo de modelado se realizará en los datos? ¿Ya has escrito este código en un idioma y quieres construir un front end?
Para codificar esto desde cero y como no tienes mucha familiaridad con los sistemas, te recomiendo Python. Como funciona como un lenguaje de programación de propósito general que cubre todo, desde servidores web hasta análisis de datos, creo que podría ser ideal para su caso de uso; También es muy fácil de aprender. La seguridad puede hacerte tropezar, pero asegúrate de leer sobre los desafíos a medida que avanzas y eliminarlos.