¿Cuál es el contexto de los algoritmos de transmisión en la ciencia de datos?

Los algoritmos de transmisión básicamente se refieren a la toma de decisiones en tiempo real. Nuevamente, esto puede explicarse en una variedad de contextos, como la pérdida de clientes o la tasa de conversión en un sitio web, etc. Permítanme explicarlo para la pérdida de clientes. Considere en un día de agradecimiento que puede tener análisis en tiempo real analizando la conversión en su sitio web, es decir, si el cliente que visita el sitio web está comprando el producto. El algoritmo de transmisión puede mostrar cómo se producen las conversiones. Digamos, por ejemplo, si las personas de Dallas visitan y pasan suficiente tiempo en su sitio web pero no compran en su sitio web (estas estadísticas se pueden obtener mediante el uso de Google Analytics), puede haber una decisión estratégica que podríamos tomar para proporcionar una oferta dice 15 por ciento de descuento para quienes visitan nuestro sitio web desde el sur de los Estados Unidos. Nuevamente, este es solo un ejemplo, hay muchos escenarios en los que podríamos querer usar dichos algoritmos de transmisión.

Apache Storm es un código abierto donde podemos implementar esto en un entorno de bigdata e IBM Infosphere Streams es la versión de IBM Stream mining.

La transmisión se originó cuando el número de eventos en tiempo real que se utilizaron para los cálculos excedió la capacidad de almacenamiento del sistema, o al menos cualquier opción de almacenamiento rentable. Algunos de los primeros fueron sobre “registros de datos de llamadas”, utilizados por las empresas de telecomunicaciones para representar los datos de cada llamada telefónica. Si bien ahora puede incluir dicho grupo de datos en una solución Big Data, hace años ningún sistema de almacenamiento conservaría los vastos detalles y la cantidad de registros de llamadas de cualquier solución asequible. Por lo tanto, se utilizaron análisis de transmisión para calcular una serie de dimensiones analíticas en tiempo real, incluso si no se guardaron todos los detalles finos del registro de llamadas.

Con el transcurso del tiempo, la capacidad de almacenar registros de datos tan grandes y complejos ha aumentado, por medio de Hadoop y otras soluciones, pero las soluciones de Streaming aún le brindan una solución analítica en tiempo real que se actualiza constantemente.

More Interesting

¿Qué es parte del conocimiento central, tanto en un sentido práctico como teórico, que todo informático debería haber escuchado al menos o tener una comprensión básica de él?

Cómo ser un experto en Linux, resolviendo eficientemente problemas comunes para un programador o un investigador en informática

¿Qué tipo de problemas informáticos son más divertidos de resolver?

¿Cuál es el lenguaje de programación que debo elegir para realizar una investigación en el área de Visión por Computador?

¿Cuál es el mejor IIT en India, considerando solo para estudios de posgrado e investigación en el campo de la informática?

¿Cuál es el estado del arte en bases de datos temporales?

¿Se ha saturado el alcance de la investigación para sistemas operativos y desarrollo de kernel?

¿Cuándo tiene sentido informar el tiempo de CPU y / o tiempo de pared en publicaciones de informática?

¿La investigación académica de CS es realmente valiosa? No he encontrado casi nada valioso o innovador en ellas (excepto casos muy raros en los que los autores tienen una conexión muy estrecha con la industria).

¿Cuáles son algunos de los documentos fundamentales sobre movilidad humana?

¿Cuáles son los mejores métodos para la gestión de proyectos en un entorno altamente incierto?

¿Cómo es el Vietnam Journal of Computer Science en términos de reputación, tasa de aceptación y calidad de los documentos aceptados?

¿Cuáles son algunas preguntas de investigación abiertas relacionadas con la realidad virtual?

¿Es factible para mí ingresar al programa de maestría de Stanford CS (o cualquier escuela de las 10 mejores) sin investigación de CS en pregrado?

¿Qué podría mejorarse sobre la educación en informática?