¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?

Los sistemas de clasificación artificial, como se implementan más comúnmente, intentan imitar los sistemas de clasificación natural. Toman como entrada los mismos estímulos a los que un humano estaría expuesto, y están calibrados contra las clases que un humano identificaría, dados esos estímulos (es decir, son constantemente entrenados y readaptados hasta que alcanzan los mismos fines que los humanos). un humano, con una precisión razonable).

Sin embargo, esto no quiere decir que los pasos intermedios de clasificación sean los mismos. De hecho, en muchos casos pueden ser bastante diferentes (o al menos bastante diferentes de las formas en que pensamos que funcionan los sistemas de clasificación naturales). En otras palabras, los algoritmos de aprendizaje automático solo se refieren a imitar fines humanos, no a medios humanos. Por ejemplo, si un humano mirara una serie de imágenes de animales domésticos y las clasificara como perros, gatos o peces, podría utilizar características como el tamaño, la forma y el color (en realidad no Sé que así es como la gente hace esto, pero esto es sólo una hipótesis). Estos podrían funcionar, pero también podrían ser solo un subconjunto de un conjunto más amplio de características visuales básicas cuya distribución difiere según el tipo de animal presentado. Un algoritmo de aprendizaje automático podría lograr la misma precisión en la distinción entre categorías de mascotas, pero podría utilizar algún otro conjunto de características distintivas que no se superpongan (por completo), tal vez objetos de fondo, textura / contraste o luminosidad (en la medida en que diferentes tipos de animales es probable que sean fotografiados en diferentes tipos de lugares, que tienen características distintivas propias).

Las categorías en las que se clasifican los elementos, por lo tanto, es poco probable que difieran, para la mayoría de las aplicaciones de ML en las que se ejecutaría hoy, y esto es por diseño; la razón por la que hemos desarrollado muchos de estos enfoques de IA es para que podamos reemplazarlos el elemento humano de [algún proceso] y, por lo tanto, estos algoritmos están diseñados para imitar lo que ese humano produciría (de modo que el proceso no se perturbe).

Sin embargo, vale la pena señalar que no hay nada “natural” per se acerca de los procesos de clasificación natural, en el sentido de que natural tiende a implicar “inherente” / “ideal” / “más fundamental” / o de lo contrario “especial”. No hay nada especial sobre las categorías que los humanos identifican sobre un conjunto de estímulos: en la mayoría de los casos, hemos identificado solo uno de los diferentes enfoques para dividir nuestro mundo en trozos más pequeños, de modo que podamos entenderlo mejor. En la mayoría de los casos, hemos encontrado un enfoque que parece funcionar bien, pero eso no significa que sea el único o necesariamente el mejor enfoque. Las diferencias interculturales son un gran ejemplo de esto; solo hay que mirar diferentes idiomas, y las cosas a las que hacen y no asignan etiquetas, para ver esto (el alemán contiene muchos ejemplos con los que las personas están familiarizadas).

Del mismo modo, al igual que es importante tener en cuenta que los tipos específicos de categorías con las que hemos surgido no son necesariamente especiales o inherentes, vale la pena señalar (y esto está relacionado) que la idea misma de las categorías en sí es, en muchos sentidos, simplemente una ilusión . Los humanos clasifican las cosas porque reducen la dimensionalidad del mundo que los rodea (convirtiendo las variables continuas en discretas), lo que les permite aprender de manera más rápida y eficiente. Sin embargo, no existen tales “límites” en la naturaleza. No hay distinciones claras entre especies, por ejemplo. Estas son delineaciones que hemos impuesto, porque la evolución y la relación entre los diferentes grupos e individuos serían, de lo contrario, demasiado complejas de entender (de cualquier manera que sean lo suficientemente eficientes como para ser prácticamente útiles). El proceso mediante el cual hacemos esto, mediante el cual dividimos nuestro mundo continuo en trozos discretos, es integral para el aprendizaje y el desarrollo, pero puede ser dañino cuando se trata, por ejemplo, de investigación científica, un hecho sobre el que se ha escrito antes [1] En una nota final, interesante, sin embargo, los enfoques de ML pueden ofrecer una solución parcial aquí. Como se señaló anteriormente, los algoritmos de ML, en sus pasos intermedios, con frecuencia identifican subcategorías que son diferentes a las que los humanos tienden a usar. Es posible sacar provecho de estas diferencias entre algoritmos y humanos, para resaltar los límites de las categorías que podrían estar tan bien fundados como los identificados y utilizados por los humanos, pero que simplemente son diferentes. El uso de ML sin los fines identificados por el ser humano (es decir, el algoritmo toma los estímulos como entrada, pero no tiene una clasificación humana que coincida con la salida; simplemente clasifica y reclasifica hasta que organiza los casos individuales en grupos de la manera más eficiente) se denomina aprendizaje no supervisado, y Es probable que sea una bendición para la ciencia y la tecnología en el futuro.

Notas al pie

[1] https://www.google.com/url?sa=t&…