* A2A *
Supongo que cuando su modelo recibe capacitación local, quiere decir que el modelo recibe capacitación en la máquina o dispositivo del usuario. En ese caso, sí, definitivamente es posible entrenar modelos localmente y luego subir los modelos al servidor, pero
- Existen serios inconvenientes en términos de eficiencia de la capacitación:
- Muchas veces, es posible que desee utilizar GLoVe pre-entrenados para problemas de PNL y estos vectores pre-entrenados se ejecutan fácilmente en GB. Transferir ese tipo de datos a la máquina / dispositivo del usuario puede ser prohibitivo, también si tiene que suceder regularmente.
- El tiempo de entrenamiento de los modelos estará limitado por los recursos disponibles en el dispositivo del usuario. Además, muchas veces, ejecutar un modelo de entrenamiento puede ocupar todos los recursos en la máquina del usuario y dejarlo inutilizable para cualquier otra cosa durante ese tiempo.
- La plataforma cambia de máquina a máquina, de dispositivo a dispositivo. Escribir un código eficiente de agnóstico de plataforma es un problema terriblemente difícil. Escribir código dirigido a la plataforma conduce a un alto costo en mantenimiento.
- No ganas mucho en términos de privacidad
- Incluso si abordamos todos los inconvenientes en el punto 1, uno todavía tiene que confiar en el proveedor de la solución ML para no filtrar datos durante el entrenamiento. Por ejemplo, podría ser un error tan simple como enviar información del usuario a través de http sin cifrado, a algo complicado donde una determinada solicitud http y la ubicación desde la cual se generó la solicitud http identifican la información del usuario [1].
Si va a confiar en el proveedor de soluciones ML, parece (al menos para mí) que cargar los datos del usuario a la nube es posiblemente el mejor enfoque general para la mayoría de los usuarios.
- ¿Cuál es la relación entre IA, aprendizaje automático y ciencias de la computación? ¿Hay especializaciones en IA o aprendizaje automático, o son especializaciones en informática?
- ¿Cómo aprendo la teoría profunda sobre Bitcoin como su programación o hash?
- ¿Es posible entrenar modelos de aprendizaje automático de procesamiento de datos en dispositivos locales y enviar solo el modelo entrenado al servidor?
- Teoría de la información: ¿Cuál es la relación entre la inteligencia y los algoritmos de compresión de datos?
- Cómo aprender a limpiar datos usando R rápidamente
[1] [cs / 0610105] Cómo romper el anonimato del conjunto de datos del Premio Netflix
Este es un ejemplo en el que la supuesta privacidad en el conjunto de datos del Premio Netflix se rompió al combinar el conjunto de datos con múltiples fuentes de información.