¿Qué conocimiento se requiere para usar bibliotecas de aprendizaje automático pero no implementarlas?

Recientemente tuve que hacer esto mediante el cual tuve que llamar a tres algoritmos de aprendizaje automático en código Java para clasificar las frecuencias de palabras clave en corpus de texto. Sin embargo, no estoy familiarizado con los algoritmos utilizados de manera significativa.

Entonces, algunos consejos para tratar de responder a su pregunta:

Utilice una herramienta de aprendizaje automático preexistente y reconocida. No intentes “reinventar la rueda”.
Tenga una comprensión básica de cómo funciona cada algoritmo, porque es posible que tenga que documentar esto más adelante.
Sepa qué requieren los algoritmos que debe usar en términos de datos y el formato de esos datos, por ejemplo, archivos .arff para el producto Weka en Java.
Comprender los resultados producidos por los algoritmos.
Sepa cómo llamar a los algoritmos desde el código de su programa, por ejemplo, para Weka, mire esta página.

Machine Learning

¿Cuáles son algunos conjuntos de datos sin resolver que son los objetivos de la investigación actual de Deep Learning?

¿Qué significa para una red neuronal ser entrenada de extremo a extremo?

¿Cuáles son los tipos de problemas que se pueden resolver con las redes neuronales?

¿El submuestreo de un entrenamiento desequilibrado es una buena idea cuando los datos del mundo real, usaré mi clasificador, también estarán desequilibrados?

¿Qué es el algoritmo de descenso de gradiente?

Cómo guardar un sitio web completo en mi Kindle y leer el contenido

La intuición principal detrás del aprendizaje automático es encontrar patrones en el conjunto de datos. Todas las bibliotecas de máquinas son como un recuadro negro, que necesita entradas apropiadas y proporciona una salida en presencia o ausencia de atributos de etiqueta de clase. Entonces, ¿cuáles son los puntos que debe tener en cuenta?

Los tipos de atributos de los datos (nominal, ordinal, binomial, leído, numérico o categórico)
Presencia de etiqueta de clase o ausencia
¿Qué métrica es mejor para sus datos? ¿La puede lograr el resultado que proporcionará el modelo de aprendizaje automático?
¿Cuáles son los diferentes atributos que tiene el clasificador, como un SVM tiene lineal, radial, cuadrático o cúbico?
¿Hay algún parámetro para el clasificador, como en SVM tenemos un impulso de aprendizaje y una tasa de aprendizaje?

Por último, nos preocupa alguna mejora en el resultado y el resultado es interpretable.

Martin O’Shea

More Interesting

Para un problema de clasificación (dos clases), ¿es mejor usar dos salidas con softmax o una salida con entropía cruzada binaria?

¿Cuál es la función de las máquinas restringidas de Boltzmann para el filtrado colaborativo?

¿Qué es la regresión en el aprendizaje automático?

Cómo hacer una biblioteca en ML como Tensorflow

¿Es posible que, en el futuro, los países sean manejados por una súper computadora que calcule el mejor resultado de una decisión política?

¿Qué significa que una modelo se sobreajuste?

¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

¿Por qué los modelos acústicos DNN / HMM son mejores que GMM / HMM?

¿Tiene sentido usar redes neuronales convolucionales en la identificación biométrica humana basada en ECG?