¿Es posible entrenar modelos de aprendizaje automático de procesamiento de datos en dispositivos locales y enviar solo el modelo entrenado al servidor?

* A2A *

Supongo que cuando su modelo recibe capacitación local, quiere decir que el modelo recibe capacitación en la máquina o dispositivo del usuario. En ese caso, sí, definitivamente es posible entrenar modelos localmente y luego subir los modelos al servidor, pero

  1. Existen serios inconvenientes en términos de eficiencia de la capacitación:
    1. Muchas veces, es posible que desee utilizar GLoVe pre-entrenados para problemas de PNL y estos vectores pre-entrenados se ejecutan fácilmente en GB. Transferir ese tipo de datos a la máquina / dispositivo del usuario puede ser prohibitivo, también si tiene que suceder regularmente.
    2. El tiempo de entrenamiento de los modelos estará limitado por los recursos disponibles en el dispositivo del usuario. Además, muchas veces, ejecutar un modelo de entrenamiento puede ocupar todos los recursos en la máquina del usuario y dejarlo inutilizable para cualquier otra cosa durante ese tiempo.
    3. La plataforma cambia de máquina a máquina, de dispositivo a dispositivo. Escribir un código eficiente de agnóstico de plataforma es un problema terriblemente difícil. Escribir código dirigido a la plataforma conduce a un alto costo en mantenimiento.
  2. No ganas mucho en términos de privacidad
    1. Incluso si abordamos todos los inconvenientes en el punto 1, uno todavía tiene que confiar en el proveedor de la solución ML para no filtrar datos durante el entrenamiento. Por ejemplo, podría ser un error tan simple como enviar información del usuario a través de http sin cifrado, a algo complicado donde una determinada solicitud http y la ubicación desde la cual se generó la solicitud http identifican la información del usuario [1].

Si va a confiar en el proveedor de soluciones ML, parece (al menos para mí) que cargar los datos del usuario a la nube es posiblemente el mejor enfoque general para la mayoría de los usuarios.


[1] [cs / 0610105] Cómo romper el anonimato del conjunto de datos del Premio Netflix

Este es un ejemplo en el que la supuesta privacidad en el conjunto de datos del Premio Netflix se rompió al combinar el conjunto de datos con múltiples fuentes de información.

Sí, eso suele ser lo que sucede. Los modelos se crean y se entrenan para que los datos de entrenamiento, que son grandes, no necesiten moverse. Los modelos entrenados son relativamente pequeños y se copian y mueven donde sea necesario.

More Interesting

¿Cuáles son algunas buenas aplicaciones o scripts que prueban muchas técnicas de aprendizaje automático a la vez para problemas de predicción?

¿Qué significa ser modelo pre-entrenado en CNN? ¿Ya están entrenados en esas clases particulares?

¿Cuáles son los criterios principales para la inicialización de los pesos en el aprendizaje profundo? Si quiero diseñar un algoritmo para la inicialización del peso, ¿qué factores debo tener en cuenta?

Comencé a aprender Machine Learning pero estoy luchando con conceptos matemáticos como la regresión lineal. ¿Cuál debería ser mi punto de partida en tal caso?

Cómo mostrar que una convolución transpuesta es equivalente a un paso de respaldo de la capa de convolución, con los mismos pesos que en una propagación hacia adelante

¿Qué es una red neuronal deconvolucional?

¿Alguien ha intentado utilizar motores de recomendación y alguna forma de filtrado colaborativo para destacar agujeros en el mercado y producir conceptos para un mayor desarrollo en los productos?

¿Cuántas imágenes de entrenamiento deberían usarse para una buena tarea de reconocimiento de género en OpenCV? ¿Hay algún conjunto de datos disponible para esta tarea?

¿Cuáles son algunos avances interesantes sobre las matemáticas del aprendizaje profundo?

¿Cuál es la diferencia entre AODE y una red bayesiana?

¿Podría alguien elaborar la relación entre un lenguaje de máquina, un sistema operativo y un procesador en particular?

¿Cuál es la entrada para un clasificador Naive Bayes?

¿Se está saturando el aprendizaje automático como campo de investigación?

¿Cómo se puede utilizar el aprendizaje automático para construir un sistema de predicción del comportamiento del cliente?

¿Cómo se aplica el aprendizaje profundo en la industria?