La métrica obvia para comparar dos modelos de clasificación es alguna noción de precisión , tal vez una comparación de precisión en varios conjuntos de datos de referencia.
Algunos otros aspectos para comparar dos algoritmos:
- Complejidad : esto está relacionado con la precisión. Esencialmente, un modelo más complejo funcionará mejor en problemas más complejos, pero se sobreajustará en problemas más simples. Un modelo más simple hará lo contrario. Puede comparar cómo controla la complejidad, como en SVM con kernel RBF, tiene un parámetro para controlar el ancho del kernel.
- Tiempo de entrenamiento – ¿Cómo crece con el no. de muestras de entrenamiento y el no. de características? También puede analizar los algoritmos de optimización utilizados en cada modelo aquí, como descenso de gradiente, solución de forma cerrada, ISTA, etc.
- Tiempo de predicción: una vez más, ¿cómo crece con el no. de muestras de entrenamiento y el no. de características?
- Tamaños de modelos : ¿qué necesita almacenar para predecir? Habla sobre la complejidad del espacio.
- Hiperparámetros – Más el no. de hiperparámetros, se requiere más ajuste para obtener un buen modelo.
- ¿Las startups ofrecen trabajos orientados a la investigación?
- ¿Cuáles son las ventajas y desventajas de tener mi propio servidor en la nube?
- Mientras entrena una red profunda, una vez que la precisión del entrenamiento alcanza el 100%, ¿hay algún punto en entrenar la red durante más épocas?
- ¿Cuál es el gradiente de la función de probabilidad logarítmica en la regresión logística multinomial?
- Intuitivamente, ¿cómo funcionan los multiplicadores de Lagrange en SVM?