¿El aprendizaje supervisado se usa más?

Esto dependería únicamente de qué tipo de problemas se están resolviendo y si tenemos una referencia para corregir nuestra red neuronal o mecanismo de toma de decisiones. Una red neuronal requeriría datos que podrían usarse para corregir la predicción realizada por la red neuronal y esto no siempre es posible, en cualquier caso, debe darse cuenta de que el conocimiento de algoritmos de aprendizaje no supervisados ​​como el k significa que aún se requiere la agrupación, por ejemplo. en el algoritmo k significa agrupación, usted supone que sus datos se agruparán exactamente en k agrupaciones, que idealmente son k centroides, donde cada uno de los datos tiene la misma oportunidad de convertirse en un centroide (un centro de una agrupación).

En el aprendizaje supervisado, lo ideal es probar primero la separabilidad lineal, ya que los conjuntos de datos que son inseparables linealmente a menudo se reducen a un problema que es NP-Completo. Hay varias formas de probar esto, el método Fourier Kahn, Simplex, o puede usar un método basado en geometría computacional como el Convex Hull o una clase de separabilidad lineal, si es linealmente separable, entonces puede usar la topología neural perceptrón para resolver el problema o simplemente una máquina de vectores de soporte. Si los conjuntos de datos no son linealmente separables, entonces los algoritmos anteriores no funcionarán, debe usar la red neuronal perceptrónica determinista recursiva o la red neuronal perceptrónica multicapa, esos dos diseños de redes neuronales particulares pueden resolver problemas en los casos en que los conjuntos de datos no son Linealmente separable.

Creo que debe conocer los algoritmos de aprendizaje supervisados ​​y no supervisados, ya que esto le permitirá, como ingeniero, decidir qué criterio de resolución de problemas se utilizará en cada momento. Comience con la K significa algoritmo de agrupamiento que es un algoritmo de aprendizaje no supervisado y trabaje desde allí.

Creo que a todos les encantaría trabajar en problemas supervisados ​​todo el tiempo, simplemente parecen ser más fáciles y pasas más tiempo en el problema en lugar de luchar contra los datos. La realidad es que los problemas del mundo real a menudo necesitan una solución basada en datos sucios, rotos y no etiquetados.

Recientemente, he visto un movimiento hacia enfoques más híbridos, por ejemplo, usando un gran conjunto de datos no etiquetados para aprender características de una manera no supervisada y luego usar métodos supervisados ​​para ajustar para poder clasificar. Esto puede significar que tendrá que etiquetar manualmente un conjunto de datos pequeño, pero eso es aún mejor que etiquetar manualmente un conjunto de datos grande.

Por ejemplo, considere el siguiente ejemplo. Tiene un gran conjunto de datos no etiquetados de imágenes de mascotas y desea que un modelo pueda clasificarse según las siguientes clases (perro, gato, pájaro).

Opción 1:

Su primer paso sería utilizar una RBM (máquina de Boltzman restringida) para entrenar en el conjunto de datos no etiquetados. La idea es que el RBM aprenda las características que componen el conjunto de datos.

Su segundo paso sería congelar su RBM que se alimenta a la parte superior de una CNN, utilizando el pequeño conjunto de datos etiquetados para ajustar la parte convolucional de la red para hacer la clasificación, con la esperanza de que la parte RBM de la red haya aprendido lo suficiente características en el conjunto de datos sin etiquetar para poder clasificar con una alta precisión.

Opcion 2:

Otra opción sería tomar su gran conjunto de datos no etiquetados, crear un conjunto de datos de igual tamaño corrompiendo su conjunto de datos original (o usar un conjunto negativo suficiente), y construir un modelo CNN y entrenar en sus datos fabricados (clases: válido, corrupto) y entrenar a la pérdida más baja posible.

El segundo paso es soltar la capa densa final, congelar todas las capas hasta la última capa y agregar una nueva capa densa que alimente una capa softmax . Afina la nueva capa densa en tu pequeño conjunto de datos etiquetados con la esperanza de que hayas aprendido suficientes características que componen las mascotas individuales para poder usarlas ahora para entrenar una capa completamente conectada para poder clasificar en las clases establecidas originalmente.

A pesar de que todos queremos trabajar con proyectos supervisados, la realidad es que, en el gran mundo malo, estaremos trabajando en un entorno no supervisado la mayoría de las veces, y poder utilizar enfoques híbridos realmente tiene valor.

Sí, creo que es justo decir que el aprendizaje supervisado es más común en este momento, probablemente en gran parte porque generalmente es más fácil. Dicho esto, algunos de los problemas más interesantes y populares en IA y ML son tareas fundamentalmente no supervisadas, por ejemplo, la inclusión de palabras.