Consideremos un ejemplo simple:
Mi amigo quiere comprar un auto y viene a mí, la conversación es así:
Amigo: quiero comprar un auto.
- ¿A qué año de pregrado está destinado MIT 6.006 Introducción a Algoritmos (primer año, segundo año, etc.)?
- ¿Es el algoritmo y la metodología para corregir automáticamente las palabras mal escritas en las consultas de búsqueda de Google una "salsa secreta" o está abierto?
- ¿Cuáles son los mejores libros sobre algoritmos que usan C ++?
- Plegamiento de proteínas: ¿Qué algoritmos se usan en el juego Foldit?
- ¿Qué sitio web / tutorial / video puedo usar para comprender muy bien la programación dinámica en un día?
I: ¿Qué tipo de auto quieres?
Amigo: un sedán con buen kilometraje y buen rendimiento.
I: Ok, pero aún es demasiado vago, ¿quieres que tenga más puntos de datos?
Amigo: Ok, debe tener un buen valor de reventa y una buena confiabilidad, me gustaría tener el auto por mucho tiempo
I: Ok, todavía tengo alrededor de 100 autos que se ajustan a esa factura.
Ahora consideremos el mismo escenario:
Amigo: quiero comprar un auto
I: ¿Qué tipo de auto quieres?
Amigo: Quiero un sedán, dentro de $ 20000, con una buena confiabilidad, buen rendimiento, alto valor de reventa y me gustaría tener el auto por mucho tiempo.
I: ¿Qué más?
Amigo: debería ser nuevo, tener una buena potencia, como alrededor de 200 hp, preferiría un híbrido o eléctrico y debería tener bajas tasas de interés.
I: Hmm, hay muchos autos que cumplen con los requisitos, pero ciertamente no son 200, ni siquiera 100, serían alrededor de 15-20.
Si ve la diferencia en los dos ejemplos anteriores, está claro que si tengo más datos, el mismo algoritmo en mi mente puede tomar mejores decisiones. Prácticamente no hay nada diferente en mi mente, es solo la cantidad de datos que obtengo lo que me ayuda a procesar mejor y dar mejores resultados.
Ahora, este ejemplo es bueno para los humanos, porque aprendemos y podemos calcular combinaciones de permutación inconscientemente, pero con las computadoras tenemos que hacerlo a través de algoritmos, que en términos de CS se llama “aprendizaje automático”, lo que significa un programa que mejora la producción, por entendiendo el uso pasado. El uso pasado aquí no es más que los datos que recopilan compañías como Google, Facebook y muchas otras compañías. Cuanto mejor sea el algoritmo de aprendizaje automático, más aprenderán sobre cómo mejorar sus resultados, pero eso también significa que necesitan más datos para mejorar esos algoritmos. Por lo tanto, en general, Google no solo tiene más datos, sino que también tiene un mejor algoritmo para acceder y comprender esos datos.
Pero una anécdota de esto es saber que necesita mejorar, necesita más datos y, por lo tanto, Bing, la búsqueda de Yahoo y otros no pueden competir a partir de ahora, debido al círculo de datos y algoritmo.
Esto también es cierto para Facebook y otros gigantes tecnológicos, incluidos, entre otros, Yelp, Twitter, Yahoo, Uber, Quora y muchos más.