Veamos qué significa lineal y no lineal en general en el aprendizaje automático.
Los modelos lineales son usualmente alguna transformación lineal aplicada a la entrada cuyos parámetros necesitan ser aprendidos. Considere el siguiente modelo: y = W x + b . Este es un modelo lineal típico como puede ver porque la transformación lineal cuya representación matricial es W se aplica a la entrada x . Con dicho modelo, puede resolver problemas de estructura lineal, como la clasificación cuyo límite de decisión se parece al hiperplano, es decir, las etiquetas son [casi] linealmente separables.
En las redes neuronales, aplica dicha transformación a la entrada y, luego, pasa el vector resultante a la función no lineal. ¿Por qué hacemos tal cosa? La mayoría de los procesos en la naturaleza son muy complejos por varias razones. Una de esas razones es que siempre hay algunas variables ocultas que no conocemos (o que simplemente no podemos observar), que tienen un gran impacto en la salida del proceso. Piense en la predicción del éxito de la terapia contra el cáncer. Los científicos han estudiado las células cancerosas durante mucho tiempo y descubrieron varios indicadores de cuán exitoso será un tratamiento, pero no conocen todas las variables involucradas (no saben todo acerca de cada célula cancerosa de cada individuo). Esas variables desconocidas están introduciendo ruido en los datos y hacen que este problema sea muy complejo (puede pensar que esas variables desconocidas están distorsionando nuestro hiperplano a algún límite de decisión altamente no lineal). Debido a todo esto, no solo podemos usar multiplicaciones matriciales en nuestras redes neuronales para resolver este problema (no piense en apilar capas lineales, por favor, porque la composición de 2 transformaciones lineales sigue siendo lineal). Es por eso que utilizamos algunas funciones no lineales además de las transformaciones lineales (alimentar el producto de entrada de peso al sigmoide, ReLU, etc.) para crear límites de decisión no lineales con la esperanza de encajar y generalizar al mismo tiempo.
- ¿Qué puede hacer el aprendizaje automático que la analítica tradicional no puede hacer?
- ¿Cómo podrían usarse las expresiones faciales para medir los niveles de amenaza usando redes neuronales?
- ¿Cómo se utilizará la IA para la informática del consumidor?
- Como estudiante de segundo año de la universidad, ¿cómo puedo prepararme para la inteligencia artificial?
- ¿Cómo debo construir un robot?