“estado del arte” es un término amplio. Cuanto más avanzado es algo, más específico es y no es general en la forma descrita en los detalles de la pregunta: “todo lo que esté basado en datos”.
Para obtener acceso a un primer corte en el estado del arte, comience con una biblioteca de aprendizaje automático de uso general en su lenguaje de programación favorito, por ejemplo:
- MatLab: Aprendizaje automático con MATLAB
- Python: Python científico / scipy (SciPy.org – SciPy.org)
- Java: biblioteca de aprendizaje automático Weka (minería de datos con software de código abierto de aprendizaje automático en Java)
- C ++: El kit de herramientas OpenCV (visión por computadora abierta) tiene excelentes algoritmos (ml. Machine Learning)
Estos kits de herramientas le permitirán experimentar ampliamente con técnicas de mezcla y combinación para adaptarse a un problema. Se ocupan de la mecánica compleja, por lo que solo necesita configurar el problema y el conjunto de datos, y configurar los parámetros del algoritmo.
- ¿Cómo funciona el muestreo negativo en los modelos de Word2vec?
- ¿Son los modelos de n-gramas, la codificación de uno en caliente y word2vec diferentes tipos de representaciones de palabras y vectores de palabras?
- ¿Qué es mejor, el algoritmo de vecinos más cercanos a k (k-NN) o el clasificador de máquina de vectores de soporte (SVM)? ¿Qué algoritmo se usa principalmente en la práctica? ¿Qué algoritmo garantiza una detección confiable en situaciones impredecibles?
- Como ingeniero de ML en Quora, ¿alguna vez ha implementado un artículo de investigación en aprendizaje automático para resolver un problema técnico o de producto?
- ¿Cuáles son las aplicaciones del procesamiento del lenguaje natural en una revista en línea?
Si encuentra una técnica que funciona, pero tiene problemas (demasiado lenta para calcular, no maneja ciertos casos), entonces desea buscar el estado del arte para esa técnica en particular.
Todas las técnicas que han demostrado su eficacia en general están disponibles en una biblioteca en algún lugar.
Si un algoritmo es tan avanzado que generalmente no está disponible en las bibliotecas, entonces está hablando de algoritmos de investigación que deben adaptarse de un artículo de revista y código de demostración. En este punto, básicamente estás solo, porque ahora eres el más avanzado.