¿Cómo se puede imitar la intuición humana en los algoritmos de aprendizaje automático? ¿Es importante el modelado de la intuición en el aprendizaje profundo?

El modelo en sí mismo no brinda mucha inteligencia a menos que se complemente significativamente con la intuición humana. La intuición entra en juego directa o indirectamente en el modelo en varias etapas:

  1. En primer lugar, todo el análisis exploratorio de datos junto con la ingeniería de características es un gran paso en la aplicación de la intuición y esto indiscutiblemente marca una gran diferencia. Por nombrar algunos: identificación de valores atípicos, puntos de influencia, tratamiento de valores de NA, ¿codificamos variables categóricas, método para calcular la distancia entre variables categóricas, etc.
  2. La elección de la reducción de dimensionalidad antes de la clasificación / regresión
  3. Selección de modelo
  4. Ajuste de hiperparámetros
  5. Elegir la métrica de evaluación y ajustar las predicciones.

En un nivel superior, la intuición humana ya está integrada en los modelos y, en mi opinión, eso es lo que ha dado lugar a varios tipos de modelos. Dependiendo de la intuición, elegimos un modelo particular. Si dicho modelo aún no existe, entonces hay un margen para la innovación. Por ejemplo, varios de los modelos de aprendizaje profundo que han surgido de la intuición son: GAN, modelos de atención, CNN, RNN, LSTM, CRF, etiquetado POS, NER por nombrar algunos …

La intuición en el aprendizaje automático es similar a “antecedentes” o “sesgos” que forman estructuras algorítmicas fundamentales que se utilizan para calcular acciones óptimas. (¡Aquí hay una buena descripción general de ‘priors’ de Yoshua Bengio !)

Uno puede imaginar la intuición como características “precocidas” que permiten un aprendizaje óptimo.

En el aprendizaje automático (donde es importante considerar las restricciones biológicas), la intuición puede observarse como características “precocidas” que permiten un aprendizaje óptimo, y estas características incorporadas son muy importantes porque pueden (a) permitir el ” aprendizaje de transferencia ” y (b) también reduce los espacios problemáticos grandes a pequeños subconjuntos de acciones óptimas , y (a) y (b) están inspirados por la inteligencia general biológica .

Considere las siguientes dos formas principales en que uno puede modelar la intuición en las máquinas:

  1. Por qué la combinación de red neuronal convolucional + búsqueda de árbol de Monte Carlo es importante, como una medida de la intuición basada en la máquina. (Utilizado por la IA más fuerte del planeta , AlphaGo Zero: reduce el gran espacio problemático “Ir” a un pequeño subconjunto de acciones óptimas, y en particular, la ” reducción del espacio problemático grande” se ve en la inteligencia general biológica )
  2. Explotación de la teoría del campo medio o redes neuronales múltiples, para capturarleyes de la física ” en modelos de aprendizaje, como una medida de la intuición basada en la máquina. (Utilizado por Deepmind en su aprendiz de Concepto Visual Temprano – Mejora el “aprendizaje de transferencia” , y notablemente, el “aprendizaje de transferencia” se ve en inteligencia general biológica )

(Vea la fuente del fragmento aquí)

Por lo general, todos los aspectos requieren un aporte humano. Normalmente exploro los datos antes de construir un modelo.

More Interesting

¿Cómo detectar el sarcasmo en frases u oraciones mientras se extrae texto? ¿Hay alguna metodología utilizada?

¿Cuáles son las ventajas de la maximización de la expectativa sobre el gradiente decente para ajustar un modelo de mezcla gaussiana?

¿Cuál es la relación entre covarianza cero e independencia? ¿Cuáles son ejemplos en la ciencia de variables que no son independientes pero tienen cero covarianza?

¿Cómo podemos usar el ingenuo clasificador de Bayes para el análisis del sentimiento sementico de los datos de Twitter?

Cómo convertirse en un cerebro cuant (un quant que usa IA)

¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?

¿Cómo se derivan las funciones de costo para las redes neuronales?

¿Cuál es una variedad de problemas y problemas que pueden resolverse mediante la minería de datos y el aprendizaje automático? ¿Qué tipo de algoritmo se utiliza para qué tipo de problema?

Si el generador y el discriminador usan SGD en Redes Adversarias Generativas, ¿por qué el entrenamiento de adversarios se llama no supervisado?

¿Es más fácil conseguir un trabajo de aprendizaje automático con maestros de una buena universidad que si solo eres autodidacta?

¿Cómo deciden los científicos computacionales qué estrategia usar para la validación cruzada?

¿Cuál es la diferencia entre la taxonomía automática y la generación de clasificación?

¿Es el análisis de sentimientos todo sobre lingüística?

¿Podría el aprendizaje profundo vencer a los métodos tradicionales en 3D Vision?