He aquí una implementación particular de su muestreo de reservorio absoluto sin reemplazo que arrojé en python del Algoritmo A-ES jxnl / reservoir.py basado en este documento de Pavlos S. Efraimidis:
http://arxiv.org/pdf/1012.0256.pdf
La idea general es utilizar una cola de prioridad para tomar el máximo k generado aleatoriamente en función de los pesos.
- ¿Es Siraj Raval el Neil De Grasse Tyson del aprendizaje profundo?
- ¿Qué es un núcleo universal en el contexto del aprendizaje automático?
- ¿Cómo comienzo en la teoría y la programación del aprendizaje automático?
- ¿Hay un LSTM en TensorFlow que procesa un carácter a la vez?
- ¿Cuáles son las principales innovaciones y hallazgos del documento 'Diseño químico automático utilizando una representación continua de moléculas basada en datos'?
Cada objeto [matemática] o_i [/ matemática] del vapor [matemática] S [/ matemática] genera un número aleatorio uniformemente a partir de [matemática] u_i \ en [0, 1] [/ matemática] y calcula una clave [matemática] k_i = u_i ^ {1 / w_i} [/ math] donde [math] w_i [/ math] es el peso de [math] 0_i [/ math].
Una muestra de depósito ponderado de tamaño [matemática] k [/ matemática] serían los objetos con las teclas superiores [matemática] k [/ matemática] [matemática] k_i [/ matemática]
¿Por qué es este el caso? por lo siguiente:
Si tiene dos variables uniformes aleatorias [matemáticas] U_ {1,2} \ en [0,1] [/ matemáticas] entonces si [matemáticas] X_i = U_i ^ {1 / w_i} [/ matemáticas] para [matemáticas] w_i > 0 [/ matemáticas]
Entonces [matemáticas] P [X_1 <X_2] = \ frac {w_2} {w_1 + w_2} [/ matemáticas]
¡Así se muestrean los pesos!