El aprendizaje profundo es un tipo de aprendizaje automático y el aprendizaje automático es un enfoque de la inteligencia artificial.
Desde el inicio de las computadoras programables, la gente se preguntaba si tales máquinas podrían volverse inteligentes. Esto llevó al nacimiento de la inteligencia artificial (IA) cuyo objetivo es incorporar inteligencia general en las máquinas .
- Para entender, entonces posiblemente trabajar P vs NP, ¿qué materias necesito aprender?
- ¿Qué curso debería estudiar para piratería ética después del 10?
- ¿Qué ventajas tiene el análisis de regresión múltiple sobre métodos de aprendizaje automático más sofisticados?
- Cómo obtener UPSEE y obtener CS en HBTI
- ¿Cómo funciona la función hash en hashing?
Las computadoras han sido capaces de derrotar incluso al mejor jugador de ajedrez humano, pero solo recientemente han comenzado a igualar algunas de las habilidades de los seres humanos promedio para conducir un automóvil, reconocer objetos o hablar. El verdadero desafío para la inteligencia artificial resultó ser resolver las tareas que son fáciles de realizar para las personas pero difíciles de describir formalmente, problemas que resolvemos intuitivamente, que se sienten automáticos, como reconocer palabras o caras habladas en imágenes.
El aprendizaje profundo es una solución a estos problemas más intuitivos.
La vida cotidiana de una persona requiere una inmensa cantidad de conocimiento sobre el mundo. Gran parte de este conocimiento es subjetivo e intuitivo y, por lo tanto, difícil de articular de manera formal. Las computadoras necesitan capturar este conocimiento informal para comportarse de manera inteligente.
Varios proyectos de inteligencia artificial buscaron codificar este conocimiento , diseñar reglas formales para describir con precisión el mundo en lenguajes formales y luego usar deducciones lógicas para razonar. Fue un proceso complejo y difícil de manejar .
Las dificultades que enfrentan los sistemas que dependen del conocimiento codificado sugieren que los sistemas de IA necesitan la capacidad de adquirir su propio conocimiento, extrayendo patrones de datos sin procesar . Esta capacidad se conoce como aprendizaje automático .
El aprendizaje automático brinda a las computadoras la capacidad de aprender sin ser programado explícitamente. En términos generales, en el aprendizaje automático (supervisado) la computadora está expuesta a varias entradas y sus salidas correspondientes y el objetivo es aprender el mapeo de entrada a salida utilizando algún algoritmo de aprendizaje automático para que cuando se le presente la nueva entrada que tiene nunca antes visto, puede predecir la salida correcta al alimentar la entrada al mapeo que ha aprendido.
El rendimiento de los algoritmos de aprendizaje automático depende en gran medida de la representación de los datos de entrada que se proporcionan.
Por ejemplo, si tenemos los siguientes pares de entrada–> salida:
(1, 2) -> 3
(12, 13) -> 25
(100, 15) -> 115
(71, 0) -> 71
(-8, 11) -> 3
(10, 37) -> ??
Podemos predecir que la salida para (10, 47) sería 47, ya que hemos aprendido que la salida para cualquier entrada (a, b) es a + b.
Ahora si tenemos los siguientes pares de entrada–> salida:
(1, 2) -> 3
(c, d) -> 19
(64, f) -> 73
(47, 0) -> 47
(-8, b) -> 3
(10, 25) -> ??
Aquí el resultado para (10, 25) sería 2f, lo que podría ser difícil de predecir que el anterior.
¿Por qué esta dificultad?
Porque utilicé la representación hexadecimal de números para representar entradas y salidas (binario, decimal, octal, base 2 a base 36). Aquí también se produce la misma adición decimal de la entrada como salida, pero la dificultad surge debido a la representación de los datos dados. Del mismo modo, para las computadoras también importa la elección de la representación de datos.
La elección de la representación tiene un efecto enorme en el rendimiento de los algoritmos de aprendizaje automático, ya que la representación de los datos corresponde directamente a la visibilidad de las características “correctas” en los datos que son cruciales para el aprendizaje automático.
Muchas tareas de inteligencia artificial se pueden resolver diseñando el conjunto ‘correcto’ de características para extraer de la representación de datos para esa tarea, y luego proporcionando estas características a algoritmos simples de aprendizaje automático.
Sin embargo, para muchas tareas, es difícil encontrar características ‘correctas’ para extraer. Por ejemplo, supongamos que nos gustaría escribir un programa para detectar automóviles en fotografías. Sabemos que los automóviles tienen ruedas, por lo que nos gustaría usar la presencia de una rueda como característica. Desafortunadamente, es difícil describir exactamente cómo se ve una rueda en términos de valores de píxeles. Una rueda tiene una forma geométrica simple, pero su imagen puede ser complicada por sombras, obstrucciones en primer plano, la orientación de la rueda, etc.
Una solución a este problema es utilizar el aprendizaje automático para descubrir no solo el mapeo de la representación a la salida, sino también la representación misma . Este enfoque se conoce como aprendizaje de representación .
Pero a menudo, puede ser muy difícil extraer características abstractas de alto nivel, como los automóviles, de una matriz cruda de píxeles. Entonces, el aprendizaje profundo que es, a su vez, un tipo de aprendizaje de representación le permite a la computadora construir conceptos complejos a partir de conceptos más simples .
Por ejemplo, la siguiente imagen muestra cómo un sistema de aprendizaje profundo puede representar el concepto de una persona combinando conceptos más simples, como esquinas y contornos que a su vez se definen en términos de bordes.
El aprendizaje profundo permite a las computadoras aprender de la experiencia y comprender el mundo en términos de una jerarquía de conceptos, con cada concepto definido a través de su relación con conceptos más simples.
En resumen, los siguientes diagramas de flujo muestran cómo las diferentes partes de un sistema de IA se relacionan entre sí dentro de diferentes disciplinas de IA. Los cuadros sombreados indican componentes que pueden aprender de los datos.
Referencia:
http://www.deeplearningbook.org/…