Cuando tienes un martillo todo es clavo. 🙂 {No trate de pensar en Algoritmos distribuidos para la técnica Ir a todos sus problemas; solía hacer esto y no ayudó en la mayoría de los casos}
Las computadoras portátiles en estos días son bastante poderosas para hacer cosas de ML fuera de la caja. Si tiene un buen procesador y RAM, debería estar bien.
Como hay subjetividad con respecto a lo que uno considera “Grande”, miraría los siguientes enfoques:
- Cómo tomar un árbol general como entrada y crear un programa que lo convierta en un árbol binario y realice los tres recorridos
- ¿Cómo se comparten de forma segura las claves de los algoritmos de cifrado y descifrado entre el emisor y el receptor sin ser interrumpidos por intrusos?
- ¿Cómo se puede calcular el número de inversiones entre dos matrices en O (N log N)?
- ¿Cuál es el camino más corto de Dijkstra para el siguiente gráfico?
- ¿Cómo puedo aleatorizar la matriz almacenada y luego usarla como entrada?
- Pruebe modelos más simples : no subestime el poder de la regresión. Pagar 3ra solución ganadora para el desafío de respuesta a preguntas AI2
- Pruebe características más simples: agregar más funciones no siempre produce mejores modelos. La reducción de la dimensionalidad puede ayudar a mejorar el rendimiento de su modelo y acelerar el tiempo de entrenamiento. Una introducción a la selección de características es una buena publicación de blog que ofrece más sugerencias sobre este tema
- Pruebe Bigger Machine: en estos días puede alquilar un servidor de gama alta de AWS o Google a precios bastante asequibles. Tomaría una máquina con mayor RAM y recuento de núcleos y vería si mejora los tiempos de entrenamiento y el rendimiento del modelo
- Probar implementaciones nativas: generalmente trabajo con Python, si llego a un muro con respecto al entrenamiento / reentrenamiento miro las implementaciones nativas de algoritmos en C / C ++
- Pruebe las GPU: una vez más, este es un punto secundario del n. ° 3, pero solo para decirlo aquí. La aceleración de NumPy GPU es una referencia que puede ayudar a los usuarios de NumPy {que es una biblioteca popular en la comunidad de Python Scientific Computing}
Si todo lo anterior falla, siga adelante y use la Computación Distribuida.