Cuando inicia sesión en Amazon por primera vez y comienza a navegar, los algoritmos inteligentes de Amazon comienzan a aprender sobre usted. Cosas como el tiempo que pasó mirando diferentes categorías de productos, qué artículos navega más, qué cosas termina comprando, la cantidad que gasta en una semana determinada, por nombrar algunos.
Esta es una gran cantidad de información sobre usted: lo que le gusta, cuánto gasta. Amazon gana dinero cuando compras cosas. Por lo tanto, para asegurarse de que gane más dinero, intentará atraerlo con ofertas y ofertas especiales en productos que generalmente compraría en Amazon. Para saber lo que te gusta, Amazon necesita saber más sobre ti. ¡Y recopila toda esta información cuando compra en Amazon!
Esa es una gran cantidad de datos para un solo usuario. ¡Ahora multiplíquelo por millones de usuarios activos de Amazon y obtendrá grandes datos!
- ¿Qué preparativos son necesarios para ser un científico de datos?
- ¿Los grandes datos están afectando nuestra privacidad?
- Si encripta un SSD sin primero borrar de manera segura los datos antiguos, luego llénelos con datos encriptados, ¿podrían los datos no encriptados aún ser recuperables?
- ¿Qué escuela es mejor para la ciencia de datos? Master of Computer Science - Data Science en UIUC o Master of Information - Data Science en UC Berkeley
- ¿Qué tan malo es estandarizar variables ficticias?
Pero las computadoras no son humanos y no pueden asociar una acción con una causa. Por ejemplo, si compra un cuaderno de Amazon, no sabrá para qué necesitaría un cuaderno y no puede vender otros artículos que van con un cuaderno: bolígrafo, lápiz, lápices, goma de borrar, más cuadernos, etc.
Sin embargo, las computadoras son buenas con patrones repetitivos. Si 5 de cada 8 personas compran cuadernos con un bolígrafo, pueden reconocer ese patrón. Entonces, la próxima vez que compre un libro, Amazon podría sugerirle que compre un bolígrafo. Cuando compra ese bolígrafo, con su cuaderno, le está haciendo a Amazon más dinero: vino por un cuaderno de $ 3 y se fue con una compra de $ 5 (cuaderno + lápiz). Ahora, si hay 100,000 personas como tú que hacen lo mismo en una ventana de 10 minutos, ustedes le hicieron a Amazon $ 200,000 adicionales ($ 2 pen x 100,000).
Además, las ganancias monetarias inmediatas le enseñaron al algoritmo de Amazon que si está comprando una computadora portátil y si le recomienda comprar una pluma con ella, comprará una.
Big data y big data analysis están alimentando a las computadoras con una tonelada de datos y enseñándoles a encontrar patrones relativos en él para hacer una correlación significativa entre dos puntos de datos. En palabras más simples, enseñar a las computadoras a asociar una causa con una acción.
Apache es un servidor web que hace que un servicio como Amazon sea accesible a través de la World Wide Web y Hadoop es una plataforma que almacena y procesa grandes datos capturados por Amazon al rastrearlo mientras navega y compra en Amazon.