La respuesta corta es “sí”: una red neuronal con algunas capas ocultas y suficientes conexiones es “factible” para encontrar una solución a alguna función arbitraria / distribución conjunta.
Sin embargo, la pregunta correcta podría ser “¿es la herramienta adecuada para el trabajo?”
Esto es fundamentalmente una cuestión de representación y riesgo empírico minimizado, que es la forma elegante de decir, parafraseando a Einstein, “las cosas deben ser lo más simples posible y no más”.
- ¿Cuál fue la verdadera razón por la que Facebook cerró su IA, que inventó su propio idioma?
- ¿Qué puedo hacer para obtener ideas en el área de inteligencia artificial para una tesis doctoral?
- Dado un conjunto de datos y una estructura de red neuronal, ¿es posible predecir la precisión de esa red neuronal (usando otra red neuronal)?
- ¿Cuáles son los métodos que utilizan los algoritmos actuales de traducción automática para tratar la polisemia?
- ¿Puede la IA reemplazar a un juez?
En otras palabras, si sus datos pueden modelarse de manera efectiva de una manera simple, de baja dimensión, elegante y robusta, no explote la cantidad de parámetros de aprendizaje. Si puede dividir su distribución de una manera de baja pérdida, con un hiperplano sensible, entonces no ajuste demasiado y así sucesivamente.
En mi experiencia, el camino al infierno está pavimentado con modelos demasiado entrenados que funcionan bien en la muestra.
Recomiendo leer sobre:
Teoría del aprendizaje
Representantes