¿Existe una justificación “rigurosa” de por qué los algoritmos de aprendizaje profundo necesitan una gran cantidad de datos?

En realidad, la pregunta debería ser la opuesta. ¿Por qué el aprendizaje profundo es perfecto para crear un modelo a partir de una gran cantidad de datos?

La mayoría de los algoritmos de aprendizaje automático son iguales e incluso mejores que DL para una pequeña cantidad de datos. Sin embargo, ¿los algoritmos tradicionales de ML no se escalan bien para una gran cantidad de datos? Por qué ? Debido a la complejidad algorítmica. Por supuesto, lo mejor que puede hacer es una dependencia lineal de la cantidad de datos para la creación de un modelo que sea razonablemente bueno. DL hace exactamente eso. El tamaño del modelo suele ser mucho menor en comparación con los datos de entrenamiento. Las innovaciones arquitectónicas sobre el modelo base (Redes neuronales convolucionales, Redes neuronales recurrentes) ayudan a obtener lo mejor de ciertos tipos de datos (imagen / video / voz / documento, etc.).

AlgoritmosAprendizaje automáticoAprendizaje profundo

¿Cuál es la mejor manera de analizar un currículum en los campos de la base de datos? ¿Qué hacer si tiene muchos currículums y necesita que los datos se extraigan en elementos individuales que se pueden colocar en una base de datos?

¿Cuáles son algunos ejemplos interesantes con algoritmos evolutivos que se pueden implementar en una tarde o menos?

¿Cuál es la diferencia entre [matemáticas] 2 ^ {n ^ {o (1)}} [/ matemáticas] y [matemáticas] 2 ^ {O (n ^ e)} [/ matemáticas] (para algunos e <1)?

¿Los robots alguna vez aprenderán a hacer trabajos de ventas?

Cómo acceder a internet usando DBS-TV dish y LNB

¿Es imprescindible aprender estructuras de datos y algoritmos si quiero convertirme en desarrollador de backend?

Puedo dar una justificación “lógica” en lugar de rigurosa. No tiene nada que ver con perspectivas técnicas. Al menos me convenzo de esta manera;

Siempre considero una red neuronal o cualquier algoritmo basado en el aprendizaje profundo como un estudiante graduado de secundaria que quiere ser abogado, y la universidad a la que se unirá somos nosotros mismos. Cuantos más libros, casos de estudio, habilidades de la corte, explicación de la constitución, habilidades de razonamiento analítico y lógico, exploración de leyes penales, pruebas, evaluación y otros muchos datos apropiados en los que la universidad lo entrena durante el programa de 3 años, más abogado superior es ‘ Estaré Podrá resolver y concluir cosas a las que nunca ha estado expuesto.

Una analogía más, imagine un algoritmo de aprendizaje profundo entrenado en una gran cantidad de datos cuando se gradúa del MIT, y un algoritmo que no está lo suficientemente capacitado como graduado de una universidad extremadamente baja. Podrá comparar su rendimiento cuando se implemente en un lugar de trabajo.

Mohamed Sayed

Cobertura de código: Wikipedia en millones de nodos.

Mohamed Sayed

En una palabra, cualquier programa de aprendizaje automático necesita una buena cantidad de datos para ser probado adecuadamente. Sin embargo, la rama de Deep Learning nació y se desarrolló justo cuando alguien quería combinar el aprendizaje automático con Big Data, en un intento de aproximar lo más posible la respuesta de los programas al análisis real de la “realidad” a la que nuestro cerebro está acostumbrado. hacer. Personalmente, creo que necesitamos profundizar nuestro conocimiento de la neurociencia para poder salir de un sobre en el que creo que estamos cazando: ¡un enfoque “muscular” de Big Data no siempre es sinónimo de una verdadera inteligencia!

Corina Mitrohin

More Interesting

¿Qué es el diagrama de flujo?

¿Cuáles son las aplicaciones de las estructuras de datos?

¿Es posible la generación de números aleatorios verdaderos?

¿Cuál es el algoritmo utilizado por la búsqueda de imagen inversa de Google (es decir, la búsqueda por imagen)? ¿Qué algoritmos necesitaría entender para crear una funcionalidad similar a pequeña escala?

¿Cómo calculamos la complejidad espacio-temporal de un algoritmo?

¿Cuál es la mayor complejidad de tiempo que cualquier juez en línea puede aceptar como O (10 ^ 9) o algo en términos de números?

¿Cuál es el elemento más pequeño / más grande en el código Java?

Cómo comenzar con algoritmos en CS

¿Cuál es el mejor algoritmo para encontrar el camino con dos limitaciones?

¿Dónde debo comenzar una estructura de datos?