¿Existe una incrustación del espacio euclidiano en el espacio hamming?

Muchos bits, mucho error, muy códigos, ¡guau!

¡Es un tema candente en el aprendizaje a gran escala, la codificación de fuente y la detección comprimida!

Aunque la binarización de vectores es un tema bastante interesante, en la codificación ML / Source, el enfoque es en gran medida utilizar una distancia de hamming rápida / distancias aproximadas a través de una LUT que calcular la métrica L2. En otras palabras, trata de preservar el vecindario de la siguiente manera:

if \ math x_2 = vecino más cercano (\ math x_1) entonces \ math x_2 ~ vecino más cercano (función de cuantización (\ math x_1))

Como se señala a continuación: Hashing espectral hace exactamente eso, pero no garantiza la minimización del error de reconstrucción cuando los puntos de datos se asignan de nuevo desde su representación de espacio de Hamming a L2.

Eche un vistazo a los siguientes temas:

1. Hashing sensible a la localidad.
2. Máquinas restringidas de Boltzman. [Variante de redes neuronales]
3. Hashing espectral.
4. Incrustación de Hamming
5. Cuantización del producto.
6. K-medios cartesianos.

¡Que las partes estén a tu favor!

Algo que te dejaría boquiabierto: ¡los bits se pueden compartir entre las dimensiones de los vectores! ¡Número fraccional de bits por dimensión!

Related Content

Cómo mostrar que una convolución transpuesta es equivalente a un paso de respaldo de la capa de convolución, con los mismos pesos que en una propagación hacia adelante

¿Cuáles son las diferencias entre hacer aprendizaje automático en la academia y en la industria?

¿Qué métodos existen para combatir los problemas de gradiente de desaparición y explosión?

¿Es el aprendizaje supervisado sobre los resultados evolutivos existentes la mejor estrategia para garantizar la supervivencia en un entorno cambiante? ¿Existe una estrategia óptima para la mutación contra cambios ambientales imprevistos?

¿Cuál es la relación entre softmax y sigmoide ya que sus derivados son similares?

Dada la disponibilidad de sensores y rastreadores de automóviles, ¿por qué los semáforos todavía mantienen los automóviles en rojo para dar tiempo a los carriles vacíos?

¿Cómo se puede usar el aprendizaje profundo para la detección de eventos anormales en los videos?

La distancia entre vectores reales es un número real, mientras que la distancia entre vectores binarios es generalmente un número entero. Esto no funcionará en general.

Justin Rising

Página de hash espectral en mit.edu

Justin Rising

More Interesting

¿Qué paradigma / algoritmo de aprendizaje automático puedo usar para seleccionar de un grupo de posibles opciones?

¿Qué debo buscar al comprar una computadora para ejecutar experimentos de Machine Learning?

¿Cuáles son algunos ejemplos de buenos regresores e instrumentos para los modelos de regresión IV?

¿Cuál es el tamaño del conjunto de datos de Cifar?

¿Cuántos idiomas hay para las redes neuronales?

¿Cuáles son las distribuciones bayesianas anteriores y posteriores? ¿Cuáles son sus roles en las redes neuronales?

¿Existe una API para reconocimiento facial?

¿Por qué la probabilidad condicional es más poderosa que la probabilidad conjunta en un nivel intuitivo?

¿Cómo se puede utilizar el aprendizaje automático para la transcriptómica?

Cómo usar tanto algoritmos genéticos como redes neuronales artificiales en una simulación de vida artificial

¿Es realmente posible comenzar una carrera seria de IA / ML con el objetivo final de trabajar en un lugar como OpenAI, Google o DeepMind a través del autoestudio?

Cómo analizar páginas web a través de enlaces de Twitter

¿Cómo determinar el refuerzo lateral en la pila? ¿Cuáles son las especificaciones simplificadas?

¿Es cierto que incluso si podemos modelar a partir de la distribución del modelo [matemática] p (x) [/ matemática], el muestreo de importancia óptima no es [matemática] p (x) [/ matemática]?

¿Cuál es el mejor modelo de predicción de la siguiente palabra en R?

Web Analytics