Cómo entender algoritmos de ML, también conocido como profundidad de conocimiento de matemáticas

Puede consultar el curso de aprendizaje a partir de datos de Yasser Abu Mostafa. Este curso tiene ventaja sobre los otros cursos de ML disponibles públicamente (como Andrew Ng’s en Coursera) en que apoya la comprensión intuitiva de los algoritmos con un riguroso tratamiento matemático que satisfará su necesidad de una comprensión profunda. Creo que el curso es principalmente autónomo en términos de matemáticas, sin embargo, debe tener una comprensión básica de: álgebra lineal, cálculo y probabilidad y estadística.

También puede consultar una serie de publicaciones de blog que actualmente estoy escribiendo sobre Aprendizaje automático teórico. Si bien la matemática interna de cada algoritmo no es el alcance de esa serie, su objetivo es darle a un practicante de ML una intuición rigurosa sobre el marco general de ML, por qué nuestros algoritmos (en general) funcionan y proporcionan algunas justificaciones teóricas de prácticas comunes.

Creo que los profesionales de Machine Learning (ML) son “prácticos”. Usarán herramientas que funcionen.

A veces, se enamoran de una herramienta particular en detrimento de ellas. (Mala idea debido a que no hay almuerzo gratis en búsqueda y optimización – Wikipedia)

Creo que la clave aquí es que ML es una metodología estadística (por lo que recomendaría estudiar más estadísticas). La intuición es que cada herramienta de ML emplea una estrategia de aproximación diferente (pero defectuosa) que es un compromiso entre la velocidad y la precisión (y quizás la facilidad de implementación) dado un conjunto de entrenamiento demasiado escaso de diversos grados de calidad. Detrás de todo, hay una teoría matemática sólida, pero eso no significa que la técnica vaya a funcionar.

Por ejemplo, eche un vistazo a la regresión lineal como un algoritmo de ML. Asume que el resultado “real” es lineal, con distribución de error gaussiano y que los valores atípicos con una contribución X ^ 2 no influirán indebidamente en el resultado (entre otras cosas). Las matemáticas subyacentes no son terriblemente sofisticadas (encontrar un mínimo por tomando la primera derivada), pero podría ser la herramienta incorrecta para el problema.

Un buen practicante de ML siempre debe sospechar del modelo resultante debido a las dificultades.

George Box dijo: “Todos los modelos están equivocados. Algunos son útiles.

More Interesting

¿Cómo se compila un sistema de inteligencia artificial, se prueba las características adicionales y cómo se libera a sí mismo con comportamientos estables, puede un sistema Ai depurarse?

¿Por qué es tan difícil enseñar a las computadoras a pensar como los humanos?

¿Las máquinas automatizadas inteligentes más eficientes y económicamente eficientes contribuyen a la creciente desigualdad de la riqueza, el estancamiento salarial y las recuperaciones sin empleo?

¿La mayor presencia de la tecnología de rastreo finalmente nos despojará de muchas libertades que disfrutamos hoy?

Si los robots están reemplazando a los humanos, ¿necesitamos el crecimiento de la población para impulsar el crecimiento económico?

¿Es la pirámide de Maslow la clave para hacer una IA 'consciente'?

¿Qué cosas necesito para desarrollar una inteligencia artificial?

¿Podría Google AI predecir qué vas a Google a continuación?

¿Cuáles son los ejemplos de sistemas de inteligencia artificial que se usan actualmente en todo el mundo?

Cómo conseguir un trabajo en Google como desarrollador de aprendizaje automático / IA

¿Pueden las tareas de inferencia de aprendizaje automático en los centros de datos generalmente hacerse paralelas?

¿Cuál es la diferencia entre el valor umbral y el sesgo en la red neuronal artificial?

¿Cómo se programa la inteligencia artificial? ¿Qué conceptos son importantes y cómo funciona realmente el código para "aprender" algo?

¿Cuáles son algunos temas comunes que deben enseñarse en un curso de inteligencia artificial, pero que se omiten en la mayoría de los cursos de IA?

¿Por qué los quadrocopters calculan las rutas mínimas de snap (jounce)?