¿Cuáles son los últimos algoritmos de aprendizaje de los vecinos más cercanos? Me refiero a todo lo que se basa en datos, como métodos basados en instancias, kNN, algoritmos de aprendizaje vecinos y métricos, todo en un solo lugar.

“estado del arte” es un término amplio. Cuanto más avanzado es algo, más específico es y no es general en la forma descrita en los detalles de la pregunta: “todo lo que esté basado en datos”.

Para obtener acceso a un primer corte en el estado del arte, comience con una biblioteca de aprendizaje automático de uso general en su lenguaje de programación favorito, por ejemplo:

MatLab: Aprendizaje automático con MATLAB
Python: Python científico / scipy (SciPy.org – SciPy.org)
Java: biblioteca de aprendizaje automático Weka (minería de datos con software de código abierto de aprendizaje automático en Java)
C ++: El kit de herramientas OpenCV (visión por computadora abierta) tiene excelentes algoritmos (ml. Machine Learning)

Estos kits de herramientas le permitirán experimentar ampliamente con técnicas de mezcla y combinación para adaptarse a un problema. Se ocupan de la mecánica compleja, por lo que solo necesita configurar el problema y el conjunto de datos, y configurar los parámetros del algoritmo.

Si encuentra una técnica que funciona, pero tiene problemas (demasiado lenta para calcular, no maneja ciertos casos), entonces desea buscar el estado del arte para esa técnica en particular.

Todas las técnicas que han demostrado su eficacia en general están disponibles en una biblioteca en algún lugar.

Si un algoritmo es tan avanzado que generalmente no está disponible en las bibliotecas, entonces está hablando de algoritmos de investigación que deben adaptarse de un artículo de revista y código de demostración. En este punto, básicamente estás solo, porque ahora eres el más avanzado.

AlgoritmosAprendizaje automáticoBig DataMinería de datosProgramación informática

¿La asignación de Dirichlet latente es un modelo paramétrico o no paramétrico?

¿Cómo debo elegir una función de activación adecuada para la red neuronal?

¿Cuál es una pista adecuada para la clasificación de documentos con MATLAB?

Andrew Ng: ¿Qué opinas de AlphaGo?

Si reviso mi dirección MAC en cmd, puedo ver dos direcciones físicas, pero manualmente solo encontré una dirección MAC. ¿Cuál es el significado de la segunda dirección MAC?

¿Qué es un modelo de mezcla de Bernoulli?

Recomendaría k-means sobre KNN. Es más eficiente, se generaliza mejor y se puede usar como características para otros algos.

Mi biblioteca favorita para eso es SofiaKMeans – sofia-ml – Documentación para sofia-kmeans: agrupación rápida de k-significa. – Conjunto de algoritmos incrementales rápidos para el aprendizaje automático. Incluye métodos para aprender modelos de clasificación y clasificación, utilizando Pegasos SVM, SGD-SVM, ROMMA, Perceptrón pasivo-agresivo, Perceptrón con márgenes y Regresión logística. – Alojamiento de proyectos de Google

Actualice para responder el comentario de Alexey: k-means se puede usar para el aprendizaje supervisado de esta manera: primero entrena K grupos usando k-means y luego calculará las características K para cada entidad, cada una es máxima (0, AverageDistance-DistanceToCentroid [yo]). Estas características suelen ser realmente buenas. Luego entrena cosas habituales (redes neuronales, SVM lineal, bosques) sobre estas características.
De alguna manera es similar a los núcleos RBF en SVM pero más eficiente (características K en lugar de características N).

Yuval Feinstein

El LSH dependiente de datos y dependiente de consultas es probablemente un gran comienzo para su investigación. KNN no es un problema muy difícil, es su eficiencia lo que es difícil.

Yuval Feinstein

More Interesting

¿Hay algún artículo que justifique la normalización de los valores de los elementos en los sistemas de recomendación?

Cómo combinar un clasificador basado en características con un modelo de serie temporal como ARIMA

¿En qué áreas podría el aprendizaje automático ayudar a las personas a tomar decisiones imparciales?

¿Cuáles son las mejores prácticas para elegir el tamaño de estado oculto en RNN?

¿Qué tan buenos antecedentes en ML ofrece el curso Coursera Machine Learning a alguien?

¿Cuál es el propósito de usar un parámetro de penalización [matemática] C [/ matemática] en SVM?

Cómo discriminar una señal del ruido en la última investigación y desarrollo de AI / ML

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

¿Cómo debe prepararse para un programa de maestría / doctorado centrado en la inteligencia artificial?

¿Se utiliza R en la minería de datos a gran escala en grandes compañías de software como Facebook y LinkedIn?