Cómo ser tan bueno como Ian Goodfellow en aprendizaje automático

Primero no deberías mirar al Ian Goodfellow que ves ahora. Tienes que ver todo lo que ha pasado para llegar allí. Mucha gente solo mira el resultado y no el trabajo que esa persona realiza. Ian Goodfellow ha hecho mucho a lo largo de su carrera y ha hecho mucho para llegar allí. Probablemente no sabías que existió hasta hace 2 años. Solo eche un vistazo a su Linked in (lo pegué aquí). No te sientas abrumado por esto, pero haz que te inspire a poner ese trabajo. Si nos fijamos, dice que Ian Goodfellow está “interesado tanto en descubrir los principios que subyacen al aprendizaje y la inteligencia como en aplicar el aprendizaje automático para crear aplicaciones reales. “. Así que solo sigue tu pasión y persigue tu interés. No hay una respuesta secreta. Tampoco intentes copiarlo, haz algo que te interese.

Ian Goodfellow

Científico investigador del personal de Google Brain

Área de la bahía de San Francisco

Software de ordenador

Corriente

  1. Google

Anterior

  1. OpenAI,
  2. Google
  3. Willow Garage

Educación

  1. Université de Montréal

Más de 500 conexiones

Soy un investigador de aprendizaje automático. Estoy interesado tanto en descubrir los principios que subyacen al aprendizaje y la inteligencia, como en aplicar el aprendizaje automático para crear aplicaciones reales.
Soy mejor conocido por inventar redes generativas de confrontación.

Experiencia

  • Staff Research ScientistGoogleMarch 2017 – Presente (5 meses)
  • Research ScientistOpenAIMarch 2016 – marzo de 2017 (1 año 1 mes) Área de la Bahía de San Francisco
  • Científico investigador sénior Google Google noviembre de 2015 – marzo de 2016 (5 meses) Como miembro del equipo de Google Brain, trabajo en el aprendizaje profundo, tanto en términos de investigación básica como en términos de mejora de productos.
    Estoy escribiendo un libro de texto sobre aprendizaje profundo junto con mis asesores de tesis doctorales: Aprendizaje profundo
  • Investigador científico Google, julio de 2014 – noviembre de 2015 (1 año y 5 meses) Durante mi primer año y cambio en Google, contribuí a TensorFlow, diseñé un nuevo método para generar ejemplos adversos y usarlos para mejorar las redes neuronales, hice un montón de visualizaciones que muestran que los nervios Después de todo, las funciones de pérdida de red no están llenas de obstáculos, supervisó al interno Tianqi Chen mientras desarrollaba un método para transferir rápidamente el conocimiento entre redes neuronales e hizo muchas otras cosas divertidas relacionadas con el aprendizaje profundo.
  • Software Engineering InternGoogleJune 2013 – septiembre de 2013 (4 meses) Estados Unidos Trabajó con el equipo de Street Smart para crear una red neuronal profunda capaz de leer los números de direcciones de las imágenes de Street View. Este sistema se utilizó para agregar o actualizar la ubicación de más de 100 millones de casas dentro de los primeros meses de su implementación.
  • Pasante de verano Willow Garage 2009 – 2009 (menos de un año) Tuve la suerte de ser pasante en esta institución de robótica icónica ahora cerrada.

Proyectos

  • pylearn2A partir de septiembre de 2010Pylearn2 es una biblioteca de aprendizaje automático para investigadores de aprendizaje automático. Está diseñado para ser fácil de usar (para facilitar la codificación) pero espera un alto nivel de experiencia en aprendizaje automático. Pylearn2 prioriza la flexibilidad, por lo que un investigador puede ejecutar casi cualquier experimento imaginable. Esto contrasta, por ejemplo, con scikits-learn, que prioriza la facilidad de uso para los no expertos y la simplicidad, y está diseñado para ser una caja negra que funciona bien en lugar de una plataforma para la experimentación. Miembros del equipo: Ian Goodfellow, David Warde- Farley, Mehdi Mirza

Idiomas

  • Italiano Competencia laboral limitada

Habilidades

  • Inteligencia artificial
  • Aprendizaje automático
  • Visión por computador
  • Matlab
  • Pitón
  • Látex
  • Mejoramiento
  • Modelado estadístico
  • C ++
  • Redes neuronales
  • Optimizaciones
  • Algoritmos
  • Reconocimiento de patrones
  • Minería de datos
  • Ciencias de la Computación
  • Ver más de 15

Educación

  • Université de MontréalPhD, Machine Learning2010 – 2014 Inventé las redes maxout, las redes de confrontación generativas, las máquinas de boltzmann profundo de predicción múltiple y un nuevo algoritmo de inferencia rápida para la codificación dispersa de espiga y losa. Lideré el desarrollo y la popularización de Pylearn2. Gané un concurso de aprendizaje de transferencia y estaba en el equipo ganador de otro concurso de aprendizaje de transferencia. Contribuí a Theano.
  • Stanford University Bachiller en Ciencias, Master of Science, Computer Science2004 – 2009 Fui asistente de curso para CS 229 Machine Learning (2008), CS 221 Introducción a la Inteligencia Artificial (2007, 2008 y 2009 … whew), y compiladores CS 147 (2008) . Serví como presidente del Gremio de Escritores de Stanford y trabajé como Tutor Residente de Escritura para Roble Hall.

Publicaciones

  • Sobre los desafíos de las implementaciones físicas de RBMsProc. AAAI 2014, pp. 1199-1205 Junio ​​de 2014 Las máquinas de Boltzmann restringidas (RBM) son modelos de aprendizaje automático potentes, pero el aprendizaje y algunos tipos de inferencia en el modelo requieren aproximaciones basadas en muestreo, que, en computadoras digitales clásicas, se implementan utilizando MCMC costosos. El cálculo físico ofrece la oportunidad de reducir el costo del muestreo mediante la construcción de sistemas físicos cuya dinámica natural corresponde a la extracción de muestras de la distribución RBM deseada. Tal sistema evita el costo de quemado y mezclado de una cadena de Markov. Sin embargo, las implementaciones de hardware de esta variedad generalmente conllevan limitaciones tales como baja precisión y rango limitado de los parámetros y restricciones en el tamaño y la topología de la RBM. Realizamos simulaciones de software para determinar qué tan perjudicial es cada una de estas restricciones. Nuestras simulaciones se basan en la computadora D-Wave Two, pero los problemas que investigamos surgen en la mayoría de las formas de computación física. Nuestros hallazgos sugieren que los diseñadores de nuevos hardware y algoritmos de computación física para computadoras físicas deberían centrar sus esfuerzos en superar las limitaciones impuestas por las restricciones de topología de las computadoras físicas actualmente existentes. Autores: Ian Goodfellow
  • Redes Adversarias GenerativasNIPS 2014Junio ​​2014 Proponemos un nuevo marco para estimar modelos generativos a través de un proceso de confrontación, en el que simultáneamente entrenamos dos modelos: un modelo generativo G que captura la distribución de datos, y un modelo discriminativo D que estima la probabilidad de que una muestra provino de los datos de entrenamiento en lugar de G. El procedimiento de entrenamiento para G es maximizar la probabilidad de que D cometa un error. Este marco corresponde a un juego de dos jugadores minimax. En el espacio de funciones arbitrarias G y D, existe una solución única, con G recuperando la distribución de datos de entrenamiento y D igual a 1/2 en todas partes. En el caso de que G y D estén definidos por perceptrones multicapa, todo el sistema se puede entrenar con retropropagación. No hay necesidad de ninguna cadena de Markov o redes de inferencia aproximadas desenrolladas durante el entrenamiento o la generación de muestras. Los experimentos demuestran el potencial del marco a través de la evaluación cualitativa y cuantitativa de las muestras generadas. Autores: Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley
  • Reconocimiento de números de varios dígitos a partir de imágenes de Street View usando redes neuronales convolucionales profundasICLR 2014Abril 2014 Reconocer texto arbitrario de varios caracteres en fotografías naturales sin restricciones es un problema difícil. En este documento, abordamos un subproblema igualmente difícil en este dominio, a saber. Reconocer números arbitrarios de varios dígitos de las imágenes de Street View. Los enfoques tradicionales para resolver este problema suelen separar los pasos de localización, segmentación y reconocimiento. En este artículo, proponemos un enfoque unificado que integra estos tres pasos mediante el uso de una red neuronal convolucional profunda que opera directamente en los píxeles de la imagen. Empleamos la implementación DistBelief de redes neuronales profundas para entrenar redes neuronales grandes y distribuidas en imágenes de alta calidad. Descubrimos que el rendimiento de este enfoque aumenta con la profundidad de la red convolucional, con el mejor rendimiento en la arquitectura más profunda que capacitamos, con once capas ocultas. Evaluamos este enfoque en el conjunto de datos SVHN disponible públicamente y logramos una precisión superior al 96% en el reconocimiento de números de calles completos. Demostramos que en una tarea de reconocimiento por dígito, mejoramos el estado del arte, logrando un 97.84% de precisión. También evaluamos este enfoque en un conjunto de datos aún más desafiante generado a partir de imágenes de Street View que contienen varias decenas de millones de anotaciones de números de calles y alcanzamos más del 90% de precisión. Para explorar más a fondo la aplicabilidad del sistema propuesto para tareas más amplias de reconocimiento de texto, lo aplicamos a texto sintético distorsionado de reCAPTCHA. reCAPTCHA es una de las pruebas de turing inversa más seguras que utiliza texto distorsionado para distinguir a los humanos de los bots. Reportamos una precisión del 99.8% en la categoría más difícil de reCAPTCHA. Nuestras evaluaciones en ambas tareas indican que en umbrales operativos específicos, el rendimiento del sistema propuesto es comparable y, en algunos casos, superior al de los operadores humanos. Autores: Ian Goodfellow, Yaroslav Bulatov, Julian Ibarz, Vinay Shet

More Interesting

¿Se automatizará el trabajo de ingeniero de software debido a las máquinas de tural neural y el aprendizaje profundo?

¿Cuáles son algunos casos cotidianos que se pueden resolver mediante aprendizaje automático / ciencia de datos / IA?

Inteligencia artificial: ¿Cómo las redes neuronales convolucionales identifican las emociones humanas?

Si DeepMind aprende de los movimientos realizados por los jugadores humanos de Go, ¿cómo puede DeepMind vencer al mejor jugador humano de Go?

¿Es útil una clase de Inteligencia Artificial para un ingeniero mecánico interesado en mecatrónica y robótica?

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2016?

¿Qué red neuronal es mejor para el reconocimiento facial: propagación hacia atrás o red neuronal recurrente?

¿Por qué no creas un modelo de aprendizaje diferente y eficiente para los estudiantes de investigación?

¿Cuál es el mayor error sobre la IA entre las masas en general?

Cómo identificar si ML es útil para un proyecto o no

¿Por qué nadie ha escrito un traductor de idiomas perfecto?

¿Podemos usar el aprendizaje automático para encontrar las pasiones de las personas?

Después de aprender Python, ¿cómo aprendo el aprendizaje automático / IA?

¿Cuáles son algunos problemas de aprendizaje automático que se resuelven mejor sin usar redes neuronales, dado que las redes neuronales tienden a ser más complicadas?

¿Cuánto debo asignar para Ubuntu root, swap y home para computadora Machine / Deep Learning?