En lugar de preguntar QUÉ, creo que también es importante saber POR QUÉ.
QUÉ: Álgebra lineal POR QUÉ: la mayor parte del aprendizaje automático que hacemos, trata con escalares y vectores y matrices : vectores de características, matrices de pesos, etc. Haces multiplicaciones de matrices de vectores como, por ejemplo, en regresión logística, redes neuronales … O haces matrices transponer primero y luego multiplicar (por ejemplo, por error, propagación hacia atrás en redes neuronales). A veces es necesario agrupar datos de entrada, tal vez utilizando técnicas de agrupación espectral, lo que requiere que sepa cuáles son los valores propios , los vectores propios son. A veces necesita tomar inversas de matrices, por ejemplo, al calcular la inversa de la matriz de covarianza para ajustar un gaussiano distribución. Así que ahora sabes POR QUÉ necesitas Álgebra Lineal.
QUÉ: Teoría de la optimización POR QUÉ: ¿Cómo entrenas los pesos de tu modelo para minimizar el error de entrenamiento? Respuesta: optimización. Es posible que necesite saber cómo tomar derivadas de la función de pérdida con respecto a algún parámetro para poder llevar a cabo la optimización del descenso de gradiente . Es posible que necesite saber qué significan los gradientes . ¿Qué son los hessianos si estás haciendo una optimización de segundo orden como LBFGS ? Es posible que necesite aprender cuáles son los pasos de Newton, tal vez para resolver búsquedas de líneas . Deberá comprender las derivadas funcionales para comprender mejor los árboles de decisión potenciados por gradiente. Deberá comprender las propiedades de convergencia de varios métodos de optimización para tener una idea de qué tan rápido o lento se ejecutará su algoritmo.
- ¿Qué piensa Andrew Ng sobre Deep Learning?
- ¿Cuál ha sido la experiencia de la gente con RapidMiner?
- Cómo hacer la clasificación y agrupamiento de documentos en rapidMiner
- ¿Qué aplicaciones iOS usan TensorFlow del lado del cliente?
- ¿El análisis de sentimientos basado en léxico se considera un método no supervisado?
QUÉ: Probabilidad y estadística POR QUÉ: Cuando estás haciendo aprendizaje automático, buscas principalmente algún tipo de distribución. ¿Cuál es la probabilidad de una salida dada mi entrada? ¿Por qué necesito esto? Cuando su modelo de aprendizaje automático predice (asigna probabilidades) lo suficientemente alto para la observación conocida, sabe que tiene un buen modelo a mano. Es un criterio de bondad. Las estadísticas le ayudan a contar bien, normalizar bien, obtener distribuciones , averiguar la media de su función de entrada, su desviación estándar . ¿Por qué necesitas estas cosas? Necesita medios y variaciones para normalizar mejor sus datos de entrada antes de introducirlos en su sistema de aprendizaje automático. Esto ayuda a una convergencia más rápida (concepto de teoría de optimización).
QUÉ: Procesamiento de señal POR QUÉ: Por lo general, no alimenta la entrada sin formato a sus sistemas de aprendizaje automático. Haces algún tipo de preprocesamiento. Por ejemplo, le gustaría extraer algunas características de la señal de voz de entrada o una imagen. Ahora, para extraer estas características necesita conocer las propiedades de estas señales subyacentes. El procesamiento de señales digitales o el procesamiento de imágenes lo ayudarán a adquirir experiencia. Estaría en una mejor situación para saber qué función de extracción funciona y qué no. Desea aprender qué es una transformación de Fourier porque tal vez le gustaría aplicar eso a la señal de voz o tal vez aplicar una transformación de coseno discreta a las imágenes antes de usarlas como características para su sistema de aprendizaje automático.
Es posible que también desee leer esto como respuesta a la pregunta: “¿Cómo aprendo el aprendizaje automático, la inteligencia artificial y el procesamiento del lenguaje natural”?