Esta es realmente una muy buena pregunta, tocando los fundamentos de la ciencia y la epistemología. Nunca se puede “probar” que un conjunto de datos puede o no clasificarse, o de manera más general, que se ajusta a un modelo dado. Solo puede tener una alta confianza (es decir, una estimación muy alta de la probabilidad de su afirmación). En particular, para su pregunta original, incluso obtener la confianza de que no hay un modelo posible que clasifique correctamente un conjunto de datos arbitrarios es aún peor, ya que tendría que pasar por todas las clases posibles de modelos, incluidos los de “caja negra” que arbitrariamente asignar grupos “correctos” a las muestras. Lo mejor que puede hacer es considerar una clase razonable de modelos dado su conocimiento previo sobre los datos y decir que está satisfecho de que estos modelos no puedan, de hecho, ajustarse a ellos.
Por cierto, nunca mencionó en su pregunta si tiene buenas razones para creer que los datos son clasificables. El conocimiento previo sobre los datos y el espacio del problema es lo más importante sobre la ciencia de datos, mucho más importante que el algoritmo específico que intenta utilizar. ¿Recolectó los datos usted mismo? ¿De qué se trata, es decir, a qué se refieren las dimensiones del vector (“características”)? ¿La descripción de datos contiene alguna pista sobre qué tipo de clasificaciones se pueden esperar? ¿Le dieron algún tipo de prueba con etiquetas de “verdad fundamental” o “bien conocido”, o está en el aire si hay alguna etiqueta razonable? En el análisis exploratorio, ¿ves patrones? Si le entregaron una matriz arbitraria de 1000 × 1000 y le dijeron que la clasificara, su pánico es muy justificable: en principio, siempre puede ser el resultado de un generador de números aleatorios.
- ¿Cuándo debería preferir los algoritmos de aprendizaje profundo a los algoritmos de aprendizaje automático poco profundos?
- Proporcione tres aplicaciones informáticas para las cuales el Aprendizaje automático parece apropiado y tres para las cuales parecen inapropiadas. ¿Incluya una justificación de sentencia para cada una?
- ¿Qué sucede si hacemos que la forma de una función de activación sea diferente en cada capa, permitiendo que también se aprenda su forma, si las capas superiores tienen menos unidades, haciéndolas más no lineales?
- ¿Cuál es la diferencia entre máquinas de vectores de soporte y aprendizaje profundo?
- ¿Es posible usar la red neuronal para predecir múltiples valores respetando ciertas condiciones?