¿Cuántas entradas de ejemplos se necesitan para entrenar una red neuronal? ¿Son los valores p un buen indicador relevante?

Alket obtuvo la respuesta principal correcta: realmente depende de su conjunto de datos y de cuál es su objetivo. Si está tratando de entrenar una red para identificar 20 especies diferentes de aves a partir de imágenes, necesitará muchos más datos que tratar de entrenarla para decidir una pregunta verdadera / falsa. En general, más datos son mejores y para la mayoría de los problemas necesitará al menos 1000 entradas de capacitación. Pero podría ser mucho más que eso dependiendo del problema en cuestión.

En general, los valores p no se utilizan para verificar los resultados de las redes neuronales (o cualquier algoritmo de aprendizaje automático). En cambio, realmente depende de lo que intentes hacer. Una buena reseña está aquí: Métricas para evaluar los algoritmos de aprendizaje automático en Python – Dominio del aprendizaje automático

También me gustaría argumentar en contra de la declaración de Alket de que debe evitar las redes neuronales. Estas son herramientas muy poderosas. Hay un elemento de blackbox-ness para ellos, pero cuando piensas en lo que están haciendo debajo del capó no es tan aterrador. Siendo realistas, una red neuronal simple con una sola capa oculta está mezclando entradas como método de ingeniería de características optimizadas en su primer paso, y luego prediciendo a partir de estas características optimizadas en su segundo paso. Esta predicción es bastante similar a la regresión logística o lineal en un nuevo espacio de características optimizado. Agregar más capas hace que esto sea cada vez más complejo, pero aparentemente es lo mismo a menos que comience a agregar capas especializadas (por ejemplo, capas convolucionales, LSTM, etc.). Esto es extraordinariamente flexible y, aunque merece una reflexión profunda para asegurarse de que comprende lo que está sucediendo; pero no debe evitarse solo porque la operación paso a paso es un poco opaca.

No sé acerca de los valores p, pero para el entrenamiento se necesita una gran cantidad de datos y también muchas características. No puede entrenar el modelo con solo unos cientos de líneas de datos.

Sin embargo, esto podría variar de una aplicación a otra.

Además, uno de los problemas con las redes neuronales es su naturaleza de caja negra que no permite una comprensión completa de su forma de funcionamiento, por lo que el resultado puede no estar claro. Personalmente los evito y opto por métodos más simples como clasificadores de árboles y estadísticas bayesianas.

More Interesting

¿Aprendería AI más sobre los humanos analizando Quora en lugar de las redes sociales como Facebook o Twitter?

Cómo hacer una IA que pueda jugar un juego simple como Mario o Pokemon

¿Cuál es la dificultad de aplicar el método de aprendizaje profundo a los mercados financieros?

¿Existe un algoritmo informático que sea capaz de distinguir la música clásica compuesta por los mejores compositores (Bach, Mozart, Beethoven, etc.) de la música compuesta por sus contemporáneos menos considerados?

¿Es ético crear inteligencia artificial que pueda tener sentimientos?

¿Cómo sabremos cuándo una entidad de IA se ha vuelto consciente de sí misma?

¿Qué opina de Sophia, el robot de IA?

Suponiendo que se creó una IA súper inteligente, capaz de superar a toda la humanidad en cada arena, ¿cómo pasaría su tiempo?

En los chatbots, ¿cuándo es bueno el aprendizaje automático y cuándo es malo?

¿Hay una IA que no pasó la prueba de Turing intencionalmente?

¿Cuál sería la mejor estrategia para implementar un motor de inteligencia artificial?

¿Qué tipo de antecedentes matemáticos son beneficiosos para alguien que comienza a programar en IA?

¿Qué tan difícil sería para alguien hacer una IA que pueda interactuar contigo sin conocimiento previo?

¿Cuál es la explicación simple del algoritmo M5P (árboles modelo M5) en aprendizaje automático / minería de datos?

¿Cómo podemos traducir la red neuronal natural en una red neuronal artificial para la comunicación o transmisión?