En el aprendizaje automático, su fe está en el modelo. Usted cree que su modelo (transformación de espacio y clasificador) es tan bueno que incluso con datos limitados para aprender o con restricciones para manejar grandes cantidades de datos de aprendizaje. Estarías bien. El estrés consiste en obtener modelos cada vez más sofisticados y espacios transformados y aprender los parámetros por una vez. Después de aprender, muchos de los puntos de datos se vuelven irrelevantes. Ejemplo en SVM, solo los puntos de datos vectoriales de soporte calculados durante la fase de entrenamiento juegan algún papel en la clasificación (prueba).
En Big Data, la fe está en los datos: la abundancia y la inmensidad de los datos. Casi cree que cualquier consulta nueva estaría muy cerca de algunas de las anteriores ya cubiertas en Datos. Casi tienes una creencia supersticiosa en las correlaciones (qué) y dejas de preocuparte por las causas (por qué y cómo). Dado que necesita manejar grandes cantidades de datos, tendría que conformarse con modelos más simples (por ejemplo, los vecinos más cercanos). También obtiene una gran cantidad de puntos de datos que juegan un papel en la clasificación final de los puntos de datos de prueba.
Referencias
http://amps-web.amps.ms.mit.edu/…
- ¿Las startups ofrecen trabajos orientados a la investigación?
- Cómo hacer ingeniería de características para la regresión no lineal correcta
- ¿Cuál es el mejor código de Python que extrae todas las frases y parte de las etiquetas de voz (POS) de una oración?
- ¿Cuáles son algunos temas de proyectos realmente interesantes para la investigación en informática como el reconocimiento de gestos a través de Kinect o el sexto sentido de Pranav Mistry?
- ¿Cuáles son algunos buenos proyectos en los que un principiante de aprendizaje automático puede trabajar?
¿Qué hace que los grandes datos visuales sean difíciles? Alyosha Efros, CMU