Los nuevos tipos de redes neuronales (que incluyen algoritmos de ‘aprendizaje de representación’ y arquitecturas profundas) se están utilizando con éxito en el mundo web. Por ejemplo, se usan en el sistema de reconocimiento de objetos Goggles de Google (esto fue discutido en el último ICML 2011 por el orador invitado Hartmut Neven) y probablemente en Google Image Search (para aprender un espacio de representación común para imágenes y consultas), ver los documentos recientes de Samy Bengio.
Contrariamente a lo que se ha escrito anteriormente, el entrenamiento de redes neuronales se escala muy bien (es decir, linealmente o incluso mejor el tamaño del conjunto de entrenamiento de wrt, mientras que las SVM requieren un tiempo de entrenamiento cuadrático o peor tamaño del conjunto de entrenamiento de wrt) y es fácil de incorporar como tipo de entrada de datos dispersos de alta dimensión que es común en el mundo web. Contrariamente a la creencia popular, de hecho, cuanto mayor es el conjunto de datos, mayor es la ventaja de estas técnicas (al menos mientras se considere la capacitación en una sola computadora, la paralelización más allá de las GPU sigue siendo un desafío). En todas partes se han utilizado CRF y regresión logística, se pueden usar redes neuronales (o mejor, sus descendientes recientes), generalmente con una ventaja. La gran ventaja de los avances recientes en este campo es el uso de aprendizaje no supervisado, que permite explotar grandes cantidades de datos sin etiquetar para pre-entrenar representaciones intermedias. Esto ha dado el primer lugar para Deep Learning en la fase final del reciente Desafío de aprendizaje no supervisado y de transferencia: http: //www.causality.inf.ethz.ch…
Otra novedad relevante para la tecnología web y de PNL es el advenimiento de redes neuronales recurrentes que superan lo último en modelado de lenguaje (modelado de la probabilidad de secuencias de palabras) y en sus aplicaciones en reconocimiento de voz (trabajo reciente de Tomas Mikolov, ver http://www.fit.vutbr.cz/~imikolo…, pero ahora hay resultados aún mejores en un documento presentado).
- ¿Qué sigue para Alexa / Echo de Amazon?
- ¿Cómo se puede aplicar la IA al diseño de chips de computadora?
- ¿Cómo entrenó una red neuronal de Caffe en un conjunto de datos de grano fino como automóviles, pájaros, etc.?
- ¿Hay ejemplos en los que se usa el aprendizaje profundo (ConvNets, etc.) en combinación con el aprendizaje automático clásico?
- ¿Cómo se puede usar la IA en campañas políticas?